晶片・2026-06-22

Google 揭 TPU 8i：為後訓練與高併發推理而生，加大片上記憶體

Google 這週揭曉了新一代自研晶片 TPU 8i。據 smol.ai 整理，它的定位很明確——專為「後訓練」與「高併發推理」這兩類工作優化，而不是只追求訓練超大模型的峰值算力。配置上的重點包括更大的片上 SRAM、一具集合通訊加速引擎（Collectives Acceleration Engine），以及一個叫 Boardfly 的新伺服拓撲。這幾項加起來，瞄準的是同時服務大量使用者、又要做複雜推理時的瓶頸。

為什麼是「後訓練與高併發推理」而不是純訓練？因為產業的算力需求重心正在移動。當前沿基礎模型的能力趨於拉平，真正燒錢、也真正決定使用者體驗的，變成怎麼把模型微調對齊（後訓練），以及怎麼在尖峰時段同時回應成千上萬個請求（高併發推理）。加大片上記憶體能減少資料在晶片內外搬運的開銷，對這兩類工作尤其有感。Google 把新晶片往這個方向調，等於押注「服務階段」才是下一波算力競爭的主場。

對台灣的科技與半導體圈，TPU 8i 是另一個值得追的訊號。雲端巨頭持續自研晶片，意味著它們想擺脫對單一 GPU 供應商的依賴、把算力成本握在自己手裡；而「為推理而生」的設計取向，也呼應了同一期投機解碼那條線——大家都在想盡辦法把伺服階段的單位成本壓下來。晶片、推論軟體、開源模型三條線，這陣子其實都指向同一個目標。

歸剛點評｜雲端巨頭把新晶片從「拚訓練」調向「拚伺服」，透露算力競爭的主場正在轉移。對追供應鏈的台灣讀者，這是觀察下一波資料中心需求往哪走的重要風向。

來源：smol.ai AINews

歸剛誒AI

Google 揭 TPU 8i：為後訓練與高併發推理而生，加大片上記憶體

同期其他文章