作為亞馬遜首款采用3nm制程的芯片,Trainium3在計算性能、能效與內存帶寬上均實現顯著提升。
相比上一代,Trainium3計算性能最高提升4.4倍,能效提升4倍,內存帶寬也接近翻兩番。基于Trainium3構建的UltraServer系統支持互聯擴展,單系統可容納144枚芯片,并為單個應用提供多達100萬枚Trainium3芯片的算力支持,規模達到上一代的10倍。
亞馬遜表示,與采用圖形處理單元(GPU)的系統相比,使用Trainium3訓練和運行AI模型的成本可降低最多50%。
此外,亞馬遜已著手開發下一代產品Trainium4。據披露,Trainium4預計將帶來6倍的FP4計算性能、3倍的FP8性能,內存帶寬和容量分別提升至4倍與2倍,并支持通過NVLink Fusion和UALink實現縱向擴展。
對于與行業龍頭英偉達的關系,負責Trainium項目的AWS副總裁兼首席架構師Ron Diamant明確表示:“我不認為我們會試圖取代英偉達。
























網站客服
粵公網安備 44030402000946號