Microsoft推出Maia 200晶片 FP4推理效能達Amazon Trainium三倍

Microsoft 宣佈推出全新自研晶片 Maia 200,這款專為 AI 推理設計的加速器,旨在為高速、高效及具成本效益的 AI 系統設立新標準,官方數據顯示其每美元效能較現有系統高出 30%。

在效能表現上,Maia 200 被 Microsoft 形容為至今部署過最高效能的 AI 推理系統。與市場上的競爭對手相比,Maia 200 展現了顯著優勢:其 FP4 推理效能是亞馬遜第三代 Trainium 的三倍,而在 FP8 效能方面則超越了 Google 的第七代 TPU。

這款晶片的強大效能建基於先進的製造工藝與記憶體系統。Maia 200 採用台積電 3 納米製程,專為大規模 AI 工作負載而設。其核心配備了原生 FP8/FP4 張量核心,能有效提升低精度運算效能。在記憶體方面,晶片搭載了 216GB 的 HBM3e 及 272MB 的片上 SRAM,頻寬高達 7 TB/s。這種高頻寬設計配合專屬的數據傳輸引擎,確保了大型模型能保持快速且高利用率的運行狀態。

除了晶片本身,Maia 200 在網絡架構與散熱設計上亦有革新。系統採用統一的乙太網絡架構,每個加速器提供 1.4 TB/s 的網絡頻寬,並透過 Maia AI 傳輸協議貫穿整個系統,實現無縫擴展。為了與數據中心完美整合,研發團隊引入了 Microsoft 第二代閉環液冷式熱交換單元,從而降低耗電量與總生命週期成本。

Microsoft 表示,目前已開始在內部的 AI 生態系統中部署 Maia 200。Microsoft 超級智慧團隊將率先利用新晶片進行合成數據生成和強化學習。隨後,Maia 200 將陸續應用於 Microsoft Foundry 及 Microsoft 365 Copilot 的運算支援,最終計劃將這項服務延伸至全球客戶。

其他人也看