每瓦效能飆10倍、成本降15倍!Blackwell重塑AI推論經濟學
[Newtalk新聞] 隨著人工智慧(AI)從一次性回覆轉變成複雜推理(reasoning),推論(inference)的需求與其背後的經濟效益正急速成長。
全新的獨立 InferenceMAX v1是首個在真實場景中衡量總運算成本的基準測試。結果顯示,NVIDIA Blackwell 平台橫掃全場,為 AI 工廠實現無與倫比的效能與最佳整體效率。
NVIDIA 超大規模與高效能運算副總裁 Ian Buck 表示:「推論是 AI 每天創造價值的關鍵。這些結果證明,NVIDIA 的全端策略提供客戶在大規模部署 AI 時所需的效能與效率。」
以下是NVIDIA發布最新動向:
InferenceMAX v1 登場
InferenceMAX v1 是 SemiAnalysis 於週一發布的全新基準測試,再次突顯了 Blackwell 在推論的領導地位。該基準在主要平台上運行熱門模型,測量多樣化使用情境下的效能,並公開任何人皆可驗證的結果。
為什麼這一類型的基準測試如此重要?
因為現代 AI 不僅關乎速度,更關乎效率與經濟規模。隨著模型從一次回覆轉變為多步驟推理與工具使用,每次查詢生成的詞元數大量增加,顯著推升了運算需求。
NVIDIA 與 OpenAI(gpt-oss 120B)、Meta(Llama 3 70B)及 DeepSeek AI(DeepSeek R1)在開源領域的合作,展示了社群驅動模型如何推進推理與效率的最先進成果。
透過與這些領先模型開發者及開源社群合作,NVIDIA 確保最新模型能針對全球最大規模的 AI 推論基礎設施進行最佳化。這反映 NVIDIA 對開放生態系的承諾,共享創新以為所有人加速進展。
與 FlashInfer、SGLang 和 vLLM 社群的深度合作,使得共同開發的增強核心與運行時,能大規模驅動這些模型。
軟體最佳化持續推升效能
NVIDIA 透過硬體與軟體協同設計來持續提升效能。gpt-oss-120B 在搭載 NVIDIA TensorRT-LLM 函式庫的NVIDIA DGX Blackwell B200 系統上,初始效能即為業界領先,但 NVIDIA 團隊與社群進一步對針對開源大型語言模型,大幅最佳化了 TensorRT LLM 的效能表現。
TensorRT-LLM v1.0 的發布,是推動大型 AI 模型更快速、更具回應性的重大突破。
透過先進的平行化技術,它運用 B200 系統與 NVIDIA NVLink Switch 的 1,800 GB/s 雙向頻寬,大幅提升 gpt-oss-120B 模型的效能。
創新不僅於此。全新發布的 gpt-oss-120b-Eagle3-v2 模型引入「推測式解碼 (speculative decoding)」,這個聰明的方法能一次預測多個詞元,降低延遲並提升速度,將每使用者輸送量提升三倍,達每用戶每秒100 詞元(TPS / user),每 GPU 速度從 6,000 提升至 30,000 詞元。
對於 Llama 3.3 70B 等密集 AI 模型,由於其龐大參數需於推論中同時運作而需要大量的運算資源,NVIDIA Blackwell B200 在 InferenceMAX v1 基準測試中創下全新效能標準。
Blackwell 在每 GPU 達10,000 TPS、每使用者50 TPS互動性的條件下,提供較 NVIDIA H200 高 4 倍的每GPU輸送量。
效能效率帶來價值
每瓦輸出詞元量、每百萬詞元成本與每使用者TPS等指標與輸送量同等重要。對功率受限的 AI 工廠而言,Blackwell 每兆瓦輸送量比上一代提升 10 倍,能轉化為更的高詞元收益。
每詞元成本是衡量 AI 模型效率的關鍵,直接影響營運支出。NVIDIA Blackwell 架構將每百萬詞元成本較上一代降低 15 倍,帶來可觀節省並推動更廣泛的AI應用。
多維效能
InferenceMAX 採用帕雷托前沿(Pareto frontier)展示資料中心輸送量與回應性等因素間的最佳權衡,並比較效能。
但這不僅是一張圖表,它展現 NVIDIA Blackwell 如何在成本、能源效率、輸送量與回應性等考量中取得平衡,從而在真實工作負載中實現最高投資報酬率。
只針對單一場景最佳化的系統雖可能在孤立測試中達巔峰,但經濟性無法擴展。Blackwell 的全端設計在實際生產中提供關鍵的效率與價值。
成就關鍵
Blackwell 的領先地位來自極致的硬體與軟體協同設計。這是一套為速度、效率與規模而生的全端架構。
Blackwell 架構特色包括:
NVFP4 低精度格式,在不犧牲準確度的情況下提升效率。
第五代 NVIDIA NVLink,連接 72 個 Blackwell GPU如同一個大型 GPU共同運作。
NVLink Switch 透過先進的張量、專家系統與 data parallel attention演算法支援高度並行。
年度硬體更新節奏與持續軟體最佳化。NVIDIA 自發表以來僅透過軟體便使 Blackwell 效能提升兩倍以上。
NVIDIA TensorRT-LLM、NVIDIA Dynamo、SGLang 與 vLLM 等開源推論框架皆經過最佳化以實現巔峰效能。
龐大生態系:數百萬 GPU 部署、700 萬 CUDA 開發者,並對超過 1,000 個開源專案貢獻。
更多Newtalk新聞報導
柯志恩發明年入主市府豪語 許智傑:我會是最能促進族群融合的市長
一場「離婚鬧劇」!輝達只接受T17、T18?財經網美痛批新壽公關失策
其他人也在看
梅蘭妮亞:正與普廷合作 幫助遭綁架烏克蘭兒童返國
美國第一夫人梅蘭妮亞10日表示,她一直在與俄羅斯總統普廷合作,幫助那些據信在烏俄戰爭期間遭綁架到俄國的烏克蘭兒童與家人團聚。《美國國家廣播公司》(NBC)報導,烏克蘭當局估計,自3年多前戰爭爆發以來,已有超過20萬烏克蘭兒童被綁架到俄國或其控制的地區。對此,梅蘭妮亞10日在白宮發表演說時提到8月致普
自由時報 ・ 16 小時前
俄派450架無人機「30枚飛彈」夜襲 烏克蘭8地區停電「5800棟建築無電可用」
根據《BBC》報導,俄羅斯國防部承認這場「大規模打擊」動用了高精度武器,包括高超音速飛彈,鎖定的是烏克蘭軍工複合體所依賴的能源設施。這類行動自2022年全面入侵以來持續不斷,隨著冬季逼近,對烏克蘭能源與交通基礎設施的攻擊頻率明顯增加。烏克蘭總統澤倫斯基(Volodymy...
CTWANT ・ 23 小時前
中國潛艦被拍到在「這裡」集結 外媒:疑似進入高度戰備狀態
[Newtalk新聞] 據外媒近日報導指出,最新衛星影像顯示,中國多艘兩棲登陸艦罕見集結於上海長江口外海,疑似是中國海軍進入「高度戰備狀態」的跡象。而這批艦艇包括可搭載直升機與裝甲車的主力登陸艦,若中國對台動武,這些艦船將成為跨海攻台的核心軍力 據《新聞週刊》報導,根據歐洲太空總署(ESA)10月6日拍攝的 Sentinel-2 衛星影像,至少三型中國海軍主力兩棲艦艇出現在上海長江入海口一帶。開源防衛分析師安德森(M.T. Anderson)指出,畫面中可見一艘「玉昭級」(071型)登陸艦,排水量約2萬5千噸,能搭載登陸艇、裝甲車及數百名士兵,屬於解放軍兩棲作戰的中堅戰力。 2 艘大型 075 型兩棲攻擊艦和 1 艘 071 型兩棲登陸艦停靠在上海。 圖:翻攝自 X@ MT Anderson 同一地點還停泊著兩艘「玉坤級」(075型)兩棲攻擊艦,這型艦被稱為中國版「小型航母」,可搭載28架直升機、60輛裝甲戰鬥車與約800名海軍陸戰隊員。安德森表示,這些大型艦艇同時現身上海,代表艦隊保持高度運作準備,「這樣的集結規模在和平時期相當罕見」。 其中,中國唯一一艘「玉瀾級」(076型)兩棲突
新頭殼 ・ 1 天前華府智庫「嚴厲」警告:美極音速武器已落後中俄 恐失戰場優勢
美國華府智庫「大西洋理事會」(Atlantic Council)近日發布一份措辭嚴厲的報告,警告美國在極音速武器的發展上已落後於中國與俄羅斯。根據《新聞週刊》(Newsweek)報導,由於美國的緩慢與中俄的決心,一種「戰場不對稱」正在形成,可能破壞西方傳統的軍事優勢。
自由時報 ・ 19 小時前
比利時F-16將給烏!還有希臘25幻象戰機 捷克30輛坦克、德國3.3萬枚飛彈
[Newtalk新聞] 烏俄戰爭進入關鍵階段之際,烏軍在南部戰線獲得重大突破。而歐洲多國近期大幅加碼對烏克蘭的軍事援助,從戰車、戰機到火箭與重砲,全方位強化烏軍的陸空作戰能力。 捷克宣布,將向烏克蘭轉讓 30 輛現代化的 T-72M4CZ 主戰坦克。這款升級版 T-72 配備先進火控系統,整合熱影像瞄準與彈道電腦,可在戰場上迅速鎖定並擊毀目標。 其全新引擎可在 30 分鐘內更換,維修效率驚人;倒車速度達 14 公里/小時,遠超俄軍 T-90M 的 4 公里/小時。再加上強化的複合裝甲防護,讓烏軍地面部隊的生存率大幅提升。 根據《防務快報》報導,比利時已開始接收美國製的 F-35 戰機,意味著舊有的 F-16 戰鬥機可能轉交烏克蘭。若進展順利,烏克蘭最快將於 2026 年接收新一批 F-16,補充空軍戰力,使其能更有效應對俄軍的空襲與導彈威脅。 根據《防務快報》報導,比利時已開始接收美國製的 F-35 戰機,意味著舊有的 F-16 戰鬥機可能轉交烏克蘭。 圖:翻攝自X帳號@Maks_NAFO_FELLA 「部隊行動部落格」指出,德國政府已資助向烏克蘭提供約 3 萬枚非導引與 3,000
新頭殼 ・ 1 天前
(影) 赫爾松俄軍崩潰逃亡 ! 爆炸毒氣瀰漫、俄疑搞化學攻擊阻烏軍進攻
[Newtalk新聞] 烏克蘭南部戰線近日局勢劇變。多個地區傳出俄軍潰退與逃亡消息,甚至疑似發生俄方自導自演爆炸事件,意圖誣陷烏克蘭發動化學攻擊。 烏克蘭游擊組織「ATESH」指出,駐守赫爾松地區的俄羅斯士兵大批逃亡,部分人藏匿於廢棄建築、森林及民宅內,也有人試圖逃往克里米亞半島。此舉顯示俄軍在赫爾松戰線的防線已出現明顯動搖。 同時,尼古拉耶夫州行政長官維塔利·基姆(Vitaliy Kim)證實,俄軍原本在被佔領的金伯恩沙嘴部署部隊,但目前僅將該地作為前線偵察與 FPV 無人機哨所。烏軍一旦推進,俄軍便迅速撤離並遺棄裝備,主力兵力已向內陸收縮。 尼古拉耶夫州行政長官維塔利·基姆(Vitaliy Kim)證實,俄軍原本在被佔領的金伯恩沙嘴部署部隊,但目前僅將該地作為前線偵察與 FPV 無人機哨所。烏軍一旦推進,俄軍便迅速撤離並遺棄裝備,主力兵力已向內陸收縮。 圖:翻攝自X帳號@NOELreports 烏克蘭軍方戰果亦持續擴大。據 X 帳號@NOELreports 數據顯示,烏軍第 225 獨立突擊團於 9 月間殲滅俄軍 412 人、重傷 478 人,並摧毀包括汽車、火砲與迫擊砲在內共 6
新頭殼 ・ 1 天前
美股風暴要來了!小摩CEO示警:6個月內恐崩 AI股損失慘重
美股在AI與科技股帶動下屢創新高,但摩根大通(JPMorgan Chase & Co.,小摩)執行長戴蒙(Jamie Dimon)卻示警這波漲勢恐難持久。他在最新專訪中直言,美股未來6個月至兩年內「極可能出現劇烈修正」,並認為市場當前的樂觀氛圍,忽視了「真正的風暴」正在醞釀中。
三立新聞網 setn.com ・ 1 天前

2025 IMEX America臺灣館圓滿成功 國際買家積極洽談合作
【記者 沁諠/台北 報導】Las Vegas, October 7–9, 2025 — The Taiwan
台灣好報 ・ 16 小時前
煙火+無人機首登國慶夜空 台新新光金控攜手台北101打造科技新篇章
【王竹萱/綜合報導】一年一度的雙十國慶到來,由台新新光金控獨家贊助台北101,首次結合「煙火+無人機」的國慶展演昨(10)日晚間盛大登場。璀璨煙火綻放天際,結合500台無人機群飛,打造前所未見的視覺盛典,點亮台北夜空,讓民眾共同見證屬於 TAIWAN 的榮耀時刻。台新新光金控總經理林維俊與旗下各子公司董事長、總經理一同出席,見證歷史性的一刻,展現企業追求創新、跨界共榮的決心與實力。
壹蘋新聞網 ・ 16 小時前
懸賞通緝我軍!藍綠白拚政治攻防2/郝龍斌嗆「境外勢力介入選舉」 張亞中:都知道點名誰
投票倒數一週,藍營魁選舉今(11日)是最後一場辯論會,5人在辯論會上交鋒不斷,除了兩岸論述,候選人郝龍斌就指控有候選人利用境外AI,製作影片和假訊息攻擊,但沒有指名道姓。張亞中會後受訪直接點破,說郝龍斌指的就是鄭麗文,喊話鄭麗文應該說清楚;但鄭麗文還是喊話,內選舉要以和為貴。
鏡新聞 ・ 12 小時前
誰才貽笑國際
國慶大會主席、立法院長韓國瑜,首創在慶典開金嗓清唱《國恩家慶》,先向奔赴花蓮救災的「鏟子超人」致敬,再談國家3座「隱形堰塞湖」,同時點出光電板、大峽谷與大罷免亂象,內容直指人心。詎料,執政不思面對問題,反以「貽笑國際」攻擊韓,這才是真正的失禮失格。
中時新聞網 ・ 1 天前
對美出手!大陸對美國船開徵特別港務費 10/14起「每噸人民幣1120元」分4年加到滿
大陸的交通部強調,美方今年4月17日才剛宣布對大陸航運、物流和造船產業啟動制裁調查,從10月14日開始加徵港口服務費,還點名大陸籍、在大陸造的、或由大陸企業經營的船都逃不掉。大陸方面痛批這根本違反國際貿易規則,也嚴重損害中美雙邊海運正常往來。為此,大陸決定祭出反...
CTWANT ・ 1 天前


高雄男疑投資詐騙墜樓亡 女兒悲痛盼加強反詐宣導
吳男10日晚間從維新路社區大樓12樓墜下身亡,現場留有字條提及帳戶遭他人控制、提款卡被警示無法使用等內容,疑似與投資詐騙有關。11日上午相驗時,吳男女兒與大哥到場參與。面對媒體詢問,吳男女兒悲痛表示,10日才得知父親是因詐騙而輕生,目前不便多談,只希望警方能加強...
CTWANT ・ 18 小時前(影)南投國慶煙火「只有煙沒有火」!網怒:放10分鐘全場撤退 根本是災難
[Newtalk新聞] 今年的國慶煙火在南投舉辦,施放逾4萬發達40分鐘,號稱史上規模最大的煙火秀,但因為現場煙太大,只看到煙或煙雲,且交管措施混亂,就有網友分享影片批放了10分鐘後很多人都在撤退,「根本是災難」。 2025南投國慶焰火,根據縣府統計,共湧進逾28萬人,但許多人懷抱興奮心情到現場看焰火,因為現場煙太大,只看到煙或煙雲,且周邊交管措施混亂,就有網友在臉書社團「南投人聊天室2.0(備用)」抱怨,「只有煙,沒有火,根本是災難。放了10分鐘,全部在徹退….」 且周邊交管措施也很混亂也引起多不滿,就有網友表示,由於周邊路段中興路口、內轆路口、東閔路口、祖詞橋全塞爆,還有很多人抱怨等接駁車等了1個半小時接駁車還在原地,有些人甚至要等上3小時就算搭到接駁車,有時也因為人車太多大巴開不出去;不過也是拍到清晰照片的人緩頰,認為其實辦得還不錯,應該「多一點鼓勵,少一些責備....」。查看原文更多Newtalk新聞報導史上第2熱國慶!炙熱天氣還得撐一週 專家曝「真正降溫時間」國慶日11大重點壅塞路段曝光!高公局揭「好走時段」避車潮
新頭殼 ・ 15 小時前
用「中文」告示歧視中國人? 中客不守溫泉禮儀被糾正 怒倒沐浴乳搞破壞 店家這麼做…..
[Newtalk新聞] 中國十一假期,許多中國人到日本遊玩,卻因不遵守當地禮儀而引發糾紛。日本神奈川縣鐮倉市一知名溫泉場所「稻村崎溫泉」貼出公告稱,一名中國男性旅客不滿被糾正入浴禮儀,竟將 2 升未稀釋的沐浴乳倒入浴池,導致其他使用者不適,也讓溫泉被迫暫時關閉。 公告稱,造成此事件的男子因與其他顧客發生爭執,生氣將沐浴乳直接混入浴缸,之後他用英語和溫泉館的工作人員說,他除了中文外不會說其他語言,並迅速離開。 溫泉館方表示,為處理這次事件,館方不得不暫時關閉浴池,進行徹底清潔和換水作業。事後,溫泉館也特別貼出「中文」告示,提醒旅客遵守日本的溫泉禮儀。公告中特別強調,日本的溫泉沐浴有著古老傳統,浸泡前務必在淋浴間徹底沖洗身體,且切勿將沐浴乳或毛巾放入浴池,希望所有旅客都能學習正確的入浴方式。 根據日本媒體引用中國大型旅遊網站的統計,日本大阪成為中國民眾海外旅遊的首選目的地。 圖:達志影像/美聯社 有網民將公告放上社交平台,馬上引起熱議。不少網友批評該行為「惡劣」、「故意破壞」,認為此舉「損害了中國遊客的形象」。 也有網友認為這名男子只是純粹的個人行為,並不能代表中國人普遍有這個習慣。但溫泉
新頭殼 ・ 1 天前
稀土禁令發酵!科技業「斷鏈」危機升 台股恐跌逾千點|#鏡新聞
美中科技貿易戰再升溫,中國祭出稀土出口禁令,引發全球供應鏈緊張。稀土是電子零組件的重要原料,目前已有中國廠商宣布暫停出貨,外媒指出,連半導體機台大廠艾司摩爾出貨都可能因此延宕,分析師預測,下週一台股開盤指數可能重挫超過千點。 加入頻道會員支持鏡新聞🩷: https://www.youtube.com/channel/UC4LjkybVKXCDlneVXlKAbmw/join 鏡電視綜合台YouTube👉http://pse.is/59enw2 鏡電視直播台YouTube👉https://pse.is/4w3gts
鏡新聞 ・ 12 小時前