NVIDIA乙太網路技術加速全球最大AI超級電腦Colossus建設 助力xAI突破大型模型訓練

NVIDIA 29日宣布,人工智慧研究公司xAI在美國田納西州孟菲斯市啟用全球最大AI超級電腦“Colossus”,其基礎架構由 NVIDIA Spectrum-X 乙太網路平台提供支持。此超級電腦搭載10萬個NVIDIA Hopper Tensor核心GPU,旨在支援xAI的Grok系列大型語言模型訓練,以及為X Premium用戶提供先進的AI聊天功能。為應對巨量運算需求,xAI正著手擴展Colossus的規模至20萬個GPU。

Colossus的建設速度令人矚目,僅用122天便完成配套設施及系統建設。從安裝首個機架到啟動模型訓練僅歷時19天,成為業界速度標竿。作為全球最大的AI超級電腦,Colossus在運行Grok模型時,展現卓越的網路效能。其三層網路結構中未出現任何流量碰撞、封包遺失或應用程式延遲。憑藉Spectrum-X的壅塞控制功能,Colossus實現高達95%的資料輸送效率,而標準乙太網路僅能提供60%的資料傳輸,且伴隨數千次流量碰撞。

NVIDIA網路事業部資深副總裁Gilad Shainer表示:「AI成為現今關鍵業務需求,須具備更高效能、增強安全性和擴充能力。NVIDIA Spectrum-X乙太網路平台為xAI等創新公司提供前所未有的計算效能,使他們能夠更快速地處理並部署AI解決方案,縮短AI產品上市時間。」

Spectrum-X 平台的核心為 Spectrum SN5600 乙太網路交換器,具備高達800Gb/s的連接埠速度,並內建Spectrum-4交換器ASIC。xAI 進一步選用 NVIDIA BlueField-3 SuperNIC,以取得更高效能和可靠性。此乙太網路技術採用先進的自適應性路由、壅塞控制和NVIDIA Direct Data Placement技術,提供低延遲、短尾延遲的高擴充性頻寬,是生成式AI雲端及多租戶環境的理想方案。

xAI創辦人Elon Musk在X平台讚揚Colossus的建設成就:「Colossus 是世界上最強大的訓練系統,感謝 xAI 團隊、NVIDIA 及眾多合作夥伴的卓越貢獻。」xAI發言人則表示:「這是全球最大、性能最佳的AI超級電腦,NVIDIA Hopper GPU與Spectrum-X技術助力我們實現更大規模的AI訓練速度與效率。」

NVIDIA Spectrum-X不僅提升Colossus的效能,亦展示乙太網路在AI運算領域中的無限潛力,為AI大規模運算帶來革命性突破。

更多中時新聞網報導
連續32年配177元 「值得一輩子擁有」 3檔只進不出 杜大師:可當傳家寶
AI七雄本益比30起跳、台積電太委屈 億元教授「3檔和神山一起長大」點名2檔正便宜
台廠衰爆遭疑「華為白手套」 世芯怒炸發聲明駁斥