谷歌近日正式發布第八代TPU芯片,以“訓練-推理分離”架構重新定義AI硬件設計標準。這款專為智能體(Agent)時代打造的芯片,通過物理層面區分訓練專用(TPU 8t)與推理專用(TPU 8i)兩款產品,在性能、能效和成本控制上實現突破性進展。
推理場景的TPU 8i則聚焦延遲優化,在成本不變的前提下實現服務能力翻倍。芯片內置288GB高帶寬內存與384MB片上SRAM,內存容量為前代三倍,大幅減少數據搬運需求。系統層面引入自研Axion CPU架構,通過NUMA隔離優化提升多服務器協同效率。針對混合專家模型(MoE),互連帶寬提升至19.2 Tb/s,配合Boardfly架構縮短網絡路徑長度,新增的片上集體加速引擎(CAE)將全局操作延遲降低至原來的五分之一。
全棧協同優化成為第八代TPU的核心競爭力。谷歌首次將自研Axion CPU與TPU深度整合,根據AI任務特性定制硬件協同方案。能效提升貫穿整個計算鏈路:從芯片級第四代液冷技術,到數據中心層面的電源動態管理,單位電力算力較五年前提升6倍。開發者生態建設同步推進,新芯片原生支持PyTorch、JAX等主流框架,配合MaxText、Tunix等開源工具,實現從模型訓練到部署的全流程優化。
資本市場對谷歌的硬件戰略給予積極回應。TPU發布當日,Alphabet股價盤中漲幅達2.2%,顯示投資者對AI基礎設施升級的認可。盡管英偉達CEO黃仁勛此前在播客中強調“TPU不構成威脅”,認為CUDA生態的廣泛覆蓋性難以被替代,但谷歌通過垂直整合硬件與軟件棧的策略,正在智能體計算領域構建差異化優勢。隨著Claude、Gemini等頂級模型持續采用TPU架構,AI芯片市場的競爭格局面臨新的變量。













