《國際產業》字節跳動訓練新AI模型 傳採華為晶片

【時報編譯張朝欽綜合外電報導】據消息人士透露,TikTok母公司字節跳動計畫開發的人工智慧(AI)模型,主要將使用華為生產的晶片來執行訓練工作。目前美國的晶片限制措施,迫使字節跳動回到母國尋找機會。

自從美國在2022年開始限制輝達(Nvidia)晶片的出口,字節跳動已經對國內人工智慧晶片供應商進行了多元化發展,並加快自己的研發。

知情人士表示,字節跳動在人工智慧競賽中的下一步,是利用華為的Ascend 910B晶片來訓練大語言AI模型。

另一位消息人士說,字節跳動正計畫推出新的AI模型,但他無法說出,是否會使用華為晶片。

字節跳動已將Ascend 910B用於計算強度較低的推理工作,這些工作主要涉及讓預先訓練好的AI模型做出預測。

而去訓練AI模型,要求則高得多,而且需要大量資料,因此需要使用超高效能晶片,例如輝達的高階圖形處理器。

其中一名知情人士表示,依照計算參數來衡量,新模型的效能和複雜性將低於字節跳動現有的AI模型豆包(Doubao)。

TikTok在華盛頓的發言人Michael Hughes代表字節跳動表示:「這裡整個前提都是錯誤的,沒有開發任何新模型」。

一位消息人士說,字節跳動今年訂購了超過10萬顆Ascend 910B晶片,但截至7月,收到的還不到3萬顆,速度太慢,無法滿足公司需求。

兩名知情人士表示,與輝達在中國銷售的晶片相比,華為供應受限、運算能力有限,已使字節跳動無法為款模型設定時間表。

字節跳動目前的AI技術為2023年8月啟動的大語言模型,並被更名為「聊天機器人豆包」,以及其它應用程式,包括文字轉視訊工具「即夢」(jimeng)。

此外在六月有新聞報導傳出,字節跳動正在與博通合作,開發5奈米AI晶片,製造工作將交給台積電進行。