導讀:谷歌在舉行的 Google Cloud Next 大會上宣布推出兩款定制 AI ASIC 芯片,分別是為推理優(yōu)化的 TPU 8t 和面向智能體推理工作負載的 TPU 8i。
4 月 22 日消息,谷歌在舉行的 Google Cloud Next 大會上宣布推出兩款定制 AI ASIC 芯片,分別是為推理優(yōu)化的 TPU 8t 和面向智能體推理工作負載的 TPU 8i,兩款芯片也有承擔對方優(yōu)勢任務的能力。
TPU 8t 在處理大規(guī)模、計算密集型的訓練工作負載時表現(xiàn)出色,其設計具備更高的計算吞吐量和更強的縱向擴展帶寬。TPU 8i 則配備了更高的內存帶寬,專為處理對延遲最為敏感的推理工作負載而設計。
TPU 8t 的 Pod 規(guī)模從此前的 9216 顆進一步增加至 9600 顆,但總 FP4 算力規(guī)模提升則接近 2 倍。其單芯片橫向擴展 (Scale-out) 帶寬從 100Gbps 顯著增長至 400Gbps,這化解了大規(guī)?;ヂ?lián)中的瓶頸。
TPU 8i 則擁有 CAE 片上加速引擎,配備 384MB 片上 SRAM 和 288GB 片外 HBM,運行時的數(shù)據(jù)無需存取。其 Pod 規(guī)模從上代的 256 顆顯著提升至 1152 顆,每 Pod 的 FP8 算力和 HBM 內存容量分別提升 8.67 倍和 5.74 倍。
谷歌表示,TPU 8t 和 TPU 8i 的能效是上一代 TPU Ironwood 的兩倍。