Tesla啟動AI超級電腦 1萬顆H100、Dojo同時運行

MoneyDJ新聞 2023-08-29 10:28:41 記者 郭妍希 報導

市場傳出,特斯拉(Tesla Inc.)週一(28日)啟動眾所矚目的超級電腦,準備用於各式人工智慧(AI)應用,其運算能力特別強大、甚至可用來執行高效能運算(HPC)任務。事實上,這款基於輝達(Nvidia Corp.)「H100」晶片的超級電腦,將成為全球最強大的電腦之一。

爆料可信度一向很高、同時也是特斯拉投資人的Sawyer Merritt透過社交平台X指出,特斯拉將在28日啟動的10,000顆H100 GPU叢集,會協助訓練全自動輔助駕駛(FSD)系統。H100 GPU的運算效能是前一代A100的五倍快,可加快特斯拉訓練FSD的速度、訓練成果也會比過去更優秀。不過,H100 GPU非常昂貴,單顆要價近40,000美元。

Merritt指出,由於輝達無法追上市場對GPU的需求,特斯拉只能斥資10多億美元打造自家超級電腦「Dojo」。Dojo使用公司高度最佳化的客製晶片,明(2024)年有望成為全球最強大的超級電腦之一。這款超級電腦也會訓練特斯拉的車隊並處理這些車隊傳回的資料。特斯拉執行長馬斯克(Elon Musk) 7月曾表示,「老實說,若輝達交出足夠GPU,我們也許不需要Dojo。」

Merritt表示,特斯拉的輝達H100 GPU叢集與Dojo將同時啟動,這能大幅拉升特斯拉的運算能力,目前沒有任何一家汽車業者能夠與之匹敵。Merritt並附上一張圖,顯示特斯拉內部預測,Dojo運算能力有機會在2024年10月達到100 Exa-Flops (見此)。

廣告

Merritt並指出,特斯拉的FSD V12版終端對終端訓練已觸及運算瓶頸,但該公司會積極確保未來不會如此。根據馬斯克說法,特斯拉光2023年就會耗資超過20億美元訓練運算力,2024年也會採取同樣行動。

Tom`s Hardware報導,特斯拉AI推論兼AI平台工程經理Tim Zaman 27日則解釋,特斯拉由10,000顆H100組成的AI叢集將在本週一(28日)啟動。在真實世界影片的訓練下,特斯拉擁有的也許是世界最大訓練資料庫,快取熱層的容量超過200PB,數量級(orders of magnitudes)比大型語言模型(LLMs)還高。

根據報導,10,000顆H100 GPU叢集對技術性運算的效能峰值可達340 FP64 PFLOPS,對於AI應用的效能峰值則可達39.58 INT8 ExaFLOPS。相較之下,Leonardo旗下的全球第四優秀超級電腦效能僅304 FP64 PFLOPS。

馬斯克:正在努力掃貨輝達GPU

馬斯克7月19日曾在特斯拉第二季財報電話會議透露,「我們使用很多輝達硬體.....只要輝達一有貨、我們就趕緊收購。」「超級欽佩黃仁勳和輝達,他們的工作成效驚人。老實說,若輝達供應足夠GPU,特斯拉或許不需要Dojo運算平台。但輝達沒辦法,他們有非常多客戶。」

特斯拉需要輝達硬體及相關軟體來改善其自駕系統。特斯拉的Dojo及輝達硬體可讓車輛具備自駕功能。馬斯克當時說,先進訓練資源確實有需求,特斯拉或許可在明年底前讓內部神經網路的訓練能力達到100 exaflops。

1 exaflop是運算效能的衡量指標,等於每秒執行1,000,000,000,000,000,000次浮點運算。這種運算能力可讓電腦駕駛車輛,或為高中生撰寫文章。

(圖片來源:特斯拉推特)

*編者按:本文僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。

延伸閱讀:

華碩推新AI伺服器搶市,搭載NVIDIA L40S GPU

瑞銀:華爾街低估甲骨文AI優勢,評等升至買進

資料來源-MoneyDJ理財網