Google Cloud 推出 Ironwood TPU 及全新虛擬機器 Axion AI 推論時代注入動能/Amin Vahdat、Mark Lohmeyer
Amin Vahdat (Google Cloud AI 與基礎架構副總裁暨總經理)、Mark Lohmeyer(Google Cloud 運算與 AI 基礎架構副總裁暨總經理)
現今的先進模型,包括 Google 的 Gemini、Veo、Imagen,以及 Anthropic 的 Claude,都在 Tensor Processing Unit(TPU)上進行訓練和提供服務。對許多企業而言,其重心正從訓練模型,轉移到如何促成與模型之間有著實用且靈敏的互動。模型架構的不斷演進、代理式工作流程 (agentic workflows) 的興起,加上對運算需求近乎指數型的增長,共同定義了這個全新的 AI 推論時代(age of inference)。特別是那些需要通用運算 (general-purpose compute) 和機器學習加速 (ML acceleration) 之間高度協作與調度的代理式工作流程,正為客製化晶片和垂直協同最佳化(vertically co-optimized)的系統架構創造新的機會。
我們為此轉變已做足準備,現在,我們宣布推出三款基於客製化晶片打造的新產品,為推論和代理式工作負載提供卓越的效能、更低的成本並實現嶄新功能:
Ironwood:我們的第七代 TPU,將在未來幾週內正式推出。Ironwood 專為最嚴苛的工作負載而打造:從大規模模型訓練、複雜的增強學習(RL),到高容量、低延遲的 AI 推論和模型服務。與 TPU v5p 相比,它的峰值效能提升了 10 倍;與 TPU v6e(Trillium)相比,每顆晶片在訓練與推論工作負載上的效能提升超過 4 倍,使 Ironwood 成為我們迄今最強大、最節能的客製化晶片。
全新 ARM® 架構 Axion 執行個體:N4A,我們迄今最具成本效益的 N 系列虛擬機器,現已推出預覽版。相較於當前同等級的 x86 虛擬機器,N4A 提供了高達 2 倍的性價比。
我們也很高興地宣布 C4A metal,我們首款 ARM® 架構裸機執行個體(bare-meta instance),即將推出預覽版。
Ironwood 和這些全新的 Axion 執行個體,是 Google 長期耕耘客製化晶片創新的最新篇章,其他還包括 TPU、YouTube 的影片編碼單元(Video Coding Units, VCU),以及適用於行動裝置的 Tensor G5 自研晶片。在每個案例中,我們打造這些處理器的目的都是為了實現效能突破,而這一切唯有透過深度的系統級協同設計,將模型研究、軟體和硬體開發整合在一起才可能達成。十年前我們就是這樣打造出第一代 TPU,而 TPU 進而在八年前造就了驅動當今絕大多數 AI 的核心架構──Transformer 的誕生。這也影響了我們近期的發展,例如 Titanium,以及我們自 2020 年以來已在十億瓦(GW)的規模上部署,並達到 99.999% 機群運作時間(fleet-wide uptime)的先進液冷解決方案。
Ironwood:從模型訓練到全球規模推論的最快路徑
Ironwood 在初期就獲得非常熱烈的迴響,像是 Anthropic 即深受 Ironwood 卓越的性價比所吸引,這項優勢加速了他們將龐大的 Claude 模型從訓練推向服務數百萬用戶的進程。實際上,Anthropic 計畫使用多達 100 萬個 TPU:
Anthropic 運算主管 James Bradbury:「我們的客戶,從《財星》(Fortune)世界五百強企業到新創公司,都仰賴 Claude 來處理他們最重要的工作。隨著需求持續指數型成長,我們在推動 AI 研究和產品開發的邊界擴展時,也在增加我們的運算資源。Ironwood 在推論效能和訓練可擴展性上的提升,將幫助我們高效擴展,同時滿足客戶期望的速度和可靠性。」
不論企業規模大小,Ironwood 正在各產業中被廣泛使用:
Lightricks 研究團隊總監 Yoav HaCohen:「Lightricks 的使命是定義開放式創意的尖端,而這需要能在大規模上消除摩擦與成本的 AI 基礎架構。我們利用 Google Cloud 的 TPU 及其龐大的晶片間互連網路(Interchip Interconnect, ICI),為我們領先的開源多模態生成模型 LTX-2 實現了突破性的訓練效率。現在,隨著進入推論時代,這個早期測試讓我們對 Ironwood 充滿期待。我們相信 Ironwood 將使我們能夠為全球數百萬客戶創造更細膩、更精確、更高擬真度的圖像和影片生成。」
Essential AI 基礎架構負責人 Philip Monk:「在 Essential AI,我們的使命是打造強大且開放的頂尖模型。我們需要大規模且高效的擴展能力,而 Google Cloud 的 Ironwood TPU 正好滿足了這一需求。這個平台極易上手,讓我們的工程師能立即發揮其強大能力,並專注於加速 AI 的突破。」
系統級設計最大化推論效能、可靠性與成本效益
TPU 是 AI Hypercomputer 的關鍵組件,AI Hypercomputer 是我們的整合式超級運算系統,它匯集了運算、網路、儲存和軟體,以提高系統級的效能和效率。根據 IDC 最近的一份報告,導入 AI Hypercomputer 的客戶平均達成了 353% 的三年投資報酬率、降低 28% 的 IT 成本,並使 IT 團隊效率提升 55%。
Ironwood TPU 將幫助客戶進一步突破規模和效率的極限。部署 TPU 時,系統會將每個獨立的晶片相互連結,形成一個 Pod,使這些互連的 TPU 能作為單一運作的運算單元。透過 Ironwood,我們可以在單一個 superpod 中擴展至 9,216 個晶片,並透過突破性的 ICI 網路達到 9.6 TB/s 的傳輸速度。這種大規模的連接性使數千個晶片能夠快速相互通訊,並存取高達 1.77 PB 的共享高頻寬記憶體(HBM),即便是對性能要求最高的模型資料瓶頸也能克服。
在如此大規模下,服務需要持續穩定的可用性。這就是為什麼我們的光學電路交換(Optical Circuit Switching, OCS)技術能作為一個動態、可重組的結構,能夠即時繞過中斷,恢復工作負載,同時讓服務保持運行。當需要更多效能時,Ironwood 可以在 Pod 間擴展,形成數十萬個 TPU 的叢集。
AI Hypercomputer 的優勢:軟硬體協同設計,實現更快、更高效的成果
在這套硬體之上,是一個協同設計的軟體層架構,我們的目標是最大化 Ironwood 強大的運算處理能力和記憶體效能,並使其在整個 AI 生命週期中都能夠易於使用。
為了提高系統效率和營運能力,我們很高興地宣布,TPU 客戶現在可以受益於 Google Kubernetes Engine(GKE)中的 Cluster Director 功能。這包括進階維運(advanced maintenance)、拓撲感知(topology awareness),可用於實現智慧調度和高彈性叢集。
在模型預前訓練和後續訓練方面,我們也分享了高效能、開源的 LLM 框架 MaxText 新的強化功能,使其更容易實作最新的訓練和強化學習優化技術,例如監督式微調(Supervised Fine-Tuning, SFT)功能和生成式增強策略優化(Generative Reinforcement Policy Optimization, GRPO)。
在推論方面,我們最近宣布了 vLLM 中對 TPU 的強化支援,允許開發者僅需進行少量配置更改,即可在 GPU 和 TPU 之間靈活切換、或同時運行兩者。GKE Inference Gateway 則能在 TPU 伺服器之間進行智慧負載平衡,將生成首個詞元的時間(time-to-first-token, TTFT)降低高達 96%,並降低高達 30% 的服務成本。
我們的軟體層使 AI Hypercomputer 能夠在訓練、微調和大規模提供 AI 工作負載服務時,同步展現高效能和高可靠性。歸功於整個技術堆疊的深度整合──從資料中心範圍的硬體優化到開放軟體和託管服務──Ironwood TPU 是我們迄今最強大、最節能的 TPU。深入了解我們的軟硬體協同設計方法,請參閱此處。
Axion:重新定義通用運算
在建構和提供現代化應用程式的過程中,既需要高度專業化的加速器,也需要強大且高效的通用運算能力。這正是我們打造 Axion 的願景──目標透過我們客製化、基於 Arm Neoverse® 的 CPU,為日常工作負載提供卓越的效能、成本效益和能源效率。
今天,我們擴展了 Axion 產品組合,推出:
N4A(預覽版):我們的第二款通用 Axion 虛擬機器,特別適合用於微服務、容器化應用程式、開源資料庫、批次處理、資料分析、開發環境、實驗測試、資料準備,以及支援 AI 應用所需的網頁服務作業。點擊此處深入了解 N4A。
C4A metal(預覽版):我們首款基於 Arm 的裸機執行個體,為專業工作負載,例如 Android 開發、車用系統、具嚴格授權要求的軟體、規模化測試平台、或執行複雜模擬的應用所提供專用的實體伺服器。深入了解 C4A metal 請參閱此處。
隨著今天的發布,Axion 產品組合現已包含三種強大的選項:N4A、C4A 和 C4A metal。C 系列和 N 系列的搭配組合,將讓你無需在效能或特定工作負載需求上妥協,即可降低營運總成本。
Axion 內建的高效能,使其成為支援現代 AI 工作流程的理想選項。當像 Ironwood 這樣的專業加速器負責處理複雜的模型伺服任務的同時,Axion 則在運行的核心骨幹層面表現出色:支援高容量的資料準備、擷取,以及運行託管企業智慧應用程式的應用程式伺服器的。Axion 已經為客戶帶來實質的影響:
Vimeo 託管與交付營運資深總監 Joe Peled:「在 Vimeo,我們長期仰賴自訂機器類型(Custom Machine Types)來有效管理我們龐大的影片轉檔平台。我們在新型 Axion N4A 執行個體上的初步測試結果令人非常驚豔,解鎖了新的效率水平。與同等級的 x86 VM 相比,我們的核心轉檔工作負載效能提高了 30%。這意味著我們能在無需改變營運模式的情況下,改善我們的單位經濟效益,並以更高的利潤擴展服務。」
ZoomInfo 基礎架構首席架構師 Sergei Kore:「在 ZoomInfo,我們營運著一個效率至上的龐大的數據智慧平台。我們的核心資料處理流程,對於向客戶提供即時洞察至關重要,這些流程廣泛運行在 GKE 中的 Dataflow 和 Java 服務上。在我們對 N4A 執行個體的預覽測試中,測得這些關鍵工作負載的性價比相較於 x86 的同類產品提升了 60%。這使我們能夠更有效率地擴展平台,並更快地為客戶提供更多價值。」
Rise 雲端與軟體架構師 Or Ben Dahan:「遷移到 Google Cloud 的 Axion 產品組合為我們帶來了關鍵的競爭優勢。我們將運算消耗降低了 20%,同時透過 C4A 執行個體(例如我們的供應方平台 SSP 後端服務)保持低延遲和穩定性。此外,C4A 使我們能夠利用 Hyperdisk,為我們的狀態性工作負載(stateful workloads) 提供精確所需的 IOPS,而不受執行個體大小的限制。這種靈活性為我們帶來兩全其美的優勢──能為客戶贏得更多廣告競價,同時顯著提高我們的利潤。我們正在測試 N4A 系列,運行例如 API 轉送服務等一些需要最高靈活性的關鍵工作負載。我們很高興分享,目前在生產環境中運行的數個應用程式,其 CPU 消耗量比我們先前的基礎架構減少了 15%,進一步降低了成本,同時確保合適的執行個體能支援所需的工作負載特性。」
AI 與日常運算的強大組合
要在這個模型架構、軟體和技術不斷演進的時代中脫穎而出,你的企業需要結合專為模型訓練和服務打造的 AI 加速器,以及能支援包含 AI 應用日常工作負載的高效的通用型 CPU。
無論你是將 Ironwood 和 Axion 搭配使用,或是將它們與 AI Hypercomputer 上提供的其他運算選項混合搭配,這種系統級的解決方案都能提供最極致的靈活性和能力,以應對最嚴苛的工作負載。
立即註冊以測試 Ironwood、Axion N4A 或 C4A metal。
◆Ironwood TPU 初期的部署將集中於美國,預計將在 2026 年中將其擴展至全球各個地區。
(照片業者提供)
其他人也在看


吳亦凡入獄4年竟傳過世!疑因「長期拒絕進食」
娛樂中心/楊佩怡報導中國男星吳亦凡曾經於2012年於南韓以團體「EXO」成員身分出道,怎料返回中國活動的吳亦凡卻在2021年因涉嫌不當行為而被中國當局判處13年徒刑附加驅逐出境,如今已經入獄將近4年的吳亦凡,竟傳出在獄中過世。不過透過中國社群軟體實際查詢並未找到相關新聞,目前中國官方也並未出面回應。
民視 ・ 14 小時前
她在零下196度「沉睡8年」!中國首例冷凍人 丈夫一句話催淚:總得有人陪她醒來
這不是科幻小說,而是一場橫跨8年的真實愛情實驗!中國首位接受「人體冷凍保存」的女性——展文蓮,在2017年因肺癌病逝後,被丈夫桂軍民以「遺體捐獻」名義送進山東銀豐生命科學研究院,沉睡在攝氏零下196度的液氮中。8年過去,妻子靜靜躺在編號「1號罐」中,而丈夫仍相信:總有一天,科學能讓愛再次甦醒。
鏡週刊Mirror Media ・ 22 小時前
放颱風假?鳳凰颱風侵襲機率全台皆逾7成 2縣市達91%
第26號颱風、中颱鳳凰持續增強,氣象署預估最快明天(10日)發布海上警報、後天(11日)發布陸上警報,週三(12日)颱風最接近台灣時,預估將減為輕度颱風,若行進方向速度不變,週三白天暴風圈可能觸陸,夜
中廣新聞網 ・ 14 小時前
29歲人妻結婚3年「生不出孩子」 醫生檢查大驚!網友炸鍋了
中國一名29歲的王姓女子已經結婚3年了,她和老公都非常渴望生個寶寶,但是3年都沒有好消息,所以一起去醫院做全面性的生殖檢查。檢查結果出來之後,不只醫生驚呆了,王女和老公更是傻眼,原來生不出孩子的原因,竟然是王女擁有男性的染色體。但是人定勝天,醫生最後還是讓王女成功生下了一個女兒,真是完美大結局啊!
鏡報 ・ 1 天前
川普關稅若違憲「股市大崩盤重演」?花旗卻曝意外結局 阮慕驊:跟我想的一樣
美國總統川普以「國家緊急狀態」為由祭出對等關稅,美國司法正針對是否違憲審理中,而美國聯邦最高法院日前舉行言詞辯論,多名大法官對合法性提出尖銳質疑,引發川普不滿。對此,財經專家阮慕驊在臉書發文指出,跟大家想的不一樣,花旗認為如果川普對等關稅被美國最高法院判違憲,會引發股市上漲,「這個看法跟我想的一樣」。阮慕驊表示,目前一般看法是,對等關稅若翻盤市場會大亂、股市......
風傳媒 ・ 10 小時前
中信盃黑豹旗》領先平鎮卻遭「沒收比賽」 陽明總教練賽後有話說
中信盃黑豹旗64強賽今天(8日)登場,北部三重棒球場最後一戰上演桃園市平鎮高中交手台北市陽明高中,本該是精采的科班對決,沒想到卻迎來戲劇性結尾。陽明高中在2:1領先情況下,於3局下被裁判沒收比賽、裁定敗北,引發譁然。大會與陽明高中總教練尹德融也分別做出回應。
TSNA ・ 1 天前
2028支持度「賴清德VS隨便誰」票數一面倒 眾評:合理
賴清德歷經大罷免32比0遭完封,又被美國智庫評為「魯莽的領導人」,內外交迫。展望2026南、高首長防守戰,尚未確定綠營候選人穩佔優勢。賴清德的2028是否有內挑戰者尚未見跡象,但若賴參選2028,有脆友KUSO發起「賴清德VS路邊隨便誰」投票,賴竟僅獲15%支持,引發熱議。
中時新聞網 ・ 6 小時前
泫雅唱到一半「突癱軟暈倒」!粉絲當場目擊嚇壞
娛樂中心/李明融報導南韓女星泫雅擁有亮麗的外型以及火辣身材,因此也被封為「性感小野馬」,在去年與龍俊亨完婚後,休息一段時間,而她今天(9日)現身澳門water bomb(水彈音樂節)開唱時,表演到一半突然當場無預警暈倒,工作人員見狀也立刻衝上台將她抱走,台下粉絲也瞬間嚇壞,擔心是否身體出了狀況。
民視 ・ 9 小時前
快防颱! 鳳凰週一午後發海警 估「台中以南」登陸
鳳凰颱風將以強颱之姿襲擊菲律賓呂宋島,隨後北轉影響台灣!氣象署預估颱風可能從台中以南登陸,再從東北部或東部出海,甚至可能消散於台灣上空。週一、週二將先出現共伴效應,北台灣及東部地區有豪雨以上等級降雨;週三、週四颱風通過時,中南部及花東地區也將有顯著雨勢。氣象專家林得恩指出,「鳳凰取自山的名字,將與中央山脈進行山山對決,但碰上中央山脈,實力差距太大,會快速減弱」,然而其威脅性仍不容小覷。民眾應及早做好防颱準備,密切關注最新氣象資訊。
TVBS新聞網 ・ 11 小時前
中職/古久保健二落淚道別!樂天領隊曝換總教練原因 球迷憤怒批:有夠羞辱的
[FTNN新聞網]體育中心/綜合報導中華職棒樂天桃猿今(9)日稍早宣布率領球隊拿下本季台灣大賽總冠軍的古久保健二將卸任一軍總教練職務,震撼球迷,也傳出古久...
FTNN新聞網 ・ 7 小時前
鳳凰將變強颱! 最快週一海警.週二陸警 嘉南登陸機會高
生活中心/綜合報導鳳凰颱風最快今天(9)升級為強颱,入夜後登入菲律賓。氣象署預估,最快周一午後就會發海警,緊接著周二發陸警。暴風圈約在週三清晨就會觸陸。不過現在已經是防颱準備的最後關鍵期,因為颱風進入南海北轉後,外圍環流伴隨東北季風,周一開始,迎風面北部、宜花,恐就會先出現致災性大雨。
民視 ・ 7 小時前
王子低頭賠錢「證據恐怖不可曝光」 她斷言:粿粿事業已到盡頭
王子(邱勝翊)遭范姜彥豐指控介入他與妻子粿粿的婚姻,王子雖第一時間公開道歉,坦承與粿粿「超越朋友界線」,但否認自己是破壞家庭的第三者,遭輿論撻伐。日前他再度發出聲明,強調會誠實面對、積極解決問題。對此,網紅廣告小妹(凡槿)在社群發文直言,對王子連發兩次道歉感到意外。
鏡報 ・ 1 天前
2026新北市長之爭!最新萬人網路民調結果驚人 這人獲37%居冠最被看好
2026新北市長選戰,民進確定由立委蘇巧慧出戰,國民則是台北市副市長李四川呼聲最高,而民眾主席黃國昌也表態將參選,現任副市長劉和然同樣有意參選。根據壹蘋新聞網最新投票顯示,網友最看好的參選者出爐,佔逾37%。
三立新聞網 setn.com ・ 19 小時前
不是吳怡農!蔣萬安對手驚爆「總統級綠營大咖」內幕曝光
2026九合一大選將於明年登場,台北市長蔣萬安的「前對手」壯闊台灣聯盟理事長吳怡農日前赴民進中央部遞交意願書,表態參選台北市長。然而據媒體報導,吳怡農在去年立委選舉中未參選決定,使他在這次選舉中受到內質疑。同時綠營人士指出,台北市長的人選從來都是總統級人選參選,如行政院副院長鄭麗君就是很好的人選。
中天新聞網 ・ 14 小時前
被外籍配偶年收入嚇到! 律師:台灣年輕人沒理由不行
律師林智群近日在臉書分享一名外籍配偶客戶的案例,指出對方雖在台灣人生地不熟,但憑藉刻苦耐勞的精神賺取豐厚收入,直言「開庭時法官問她年收入,她講出來的數字真的讓我嚇一跳。」貼文引發討論。
中天新聞網 ・ 19 小時前
中颱鳳凰各國預測路徑一致「斷腰狂掃台灣」 估宜花出海
鳳凰颱風向西北西前進,預測10日經過呂宋島並進入南海,有北轉接近台灣的趨勢。根據各國預報,一致預測出鳳凰將於13日從中南部登陸。
中天新聞網 ・ 19 小時前
直擊/顏正國告別式「一票白紗正妹」溫柔送別 來自「殯葬蔡依林」操刀
藝人顏正國從童星出道,拍攝《好小子》走紅,10月7日傳出因罹患肺腺癌四期病逝,享年50歲。今(8)日在新北市立殯儀館舉辦告別式,現場氣派而莊嚴,聚集超過上百人悼念。前來致意的親友除了顏正國的兄弟好友之外,有一批亮麗的禮儀人員頂著艷陽在會場中穿梭,成為儀式中的嬌點。趙浩雲
三立新聞網 setn.com ・ 1 天前
林岱樺驚天一哭!高雄市長民調「震撼巨變」網嚇喊:要把她幹掉了
民進立委林岱樺雖涉入助理費案,仍爭取參選高雄市長,1日舉辦造勢晚會,現場湧入3萬人,林更多次落淚,哭喊拜託天公伯,給高雄人一個公道,引發熱議。不過,據一份地下賭盤做出的「開盤參考」民調,林岱樺的支持度卻是敬陪末座,而綠委邱議瑩則是追到和同同志賴瑞隆對決局面,引發網友討論,有網友直言邱議瑩怎會衝那麼快,這民調感覺要把林岱樺幹掉,但更多網友認為根本低估藍委柯志恩實力。
中天新聞網 ・ 1 天前
颱風假有望?中颱「鳳凰」下週登陸 3縣市暴風圈侵襲機率破8成
[Newtalk新聞] 鳳凰颱風下週將登陸台灣,對此,氣象署指出,鳳凰預計今(9)晚到明(10)天通過、登陸呂宋島,之後進入南海北轉朝台灣前進,強度會減弱,12、13日通過台灣預計是輕颱等級,但基本上全台灣暴風圈侵襲機率都有6成以上,其中台南、嘉義縣市超過8成,氣象署將在明後天發海陸警,不過是否放颱風假,將依各縣市政府依據風雨預報評估後決定。 氣象署指出,鳳凰颱風今晚登陸呂宋島後,強度就會受到地形破壞減弱,明天到13日隨著颱風位置不同,強降雨區域也不同,明天進入南海,後天北轉,12、13日進入台灣海峽,再通過台灣,由於北上過程垂直風切大,環境不利於其維持強度,通過台灣可能已減弱為輕度颱風。 不過威脅仍不容小覷,明後天東北季風加上颱風外圍環流,將產生共伴效應,基隆北海岸、大台北、宜花東及恆春半島有大雨或豪雨,尤其宜花及大台北地區有豪雨等級以上降雨機率,桃園以南為局部短暫陣雨。 鳳凰颱風12日接近,花東持續大雨,中南部雨勢增加,北部及東北部轉為背風面,降雨趨緩;13日颱風中心到東北方海面,強度可能減弱為熱帶性低氣壓或溫帶氣旋,隨著東北風增強,中部以北、東北部雨勢明顯,且北部有較大雨勢。 根
新頭殼 ・ 11 小時前