字節跳動新AI模型 傳採華為晶片
外媒引述知情人士報導,TikTok母公司字節跳動計劃開發新的人工智慧(AI)模型,並使用華為昇騰(Ascend)910B晶片來訓練新模型。為此字節跳動已向華為訂購3萬顆910B晶片。
路透報導,自2022年美國開始限制輝達(Nvidia)先進AI晶片出口至中國大陸以來,字節跳動就轉向中國國內的AI晶片供應商,來加速自身發展。
報導引述知情人士表示,字節跳動在AI競賽中的下一步,是使用昇騰910B晶片來訓練大語言AI模型。另一知情人士說,該公司計劃推出新的AI模型,但無法透露是否會使用華為晶片。
報導表示,字節跳動目前的AI技術包括2023年8月推出的大語言模型、之後更名為聊天機器人的「豆包」,還有AI創作平台「即夢AI」等多種應用。由於相關應用程式使用量增加,字節跳動成為華為晶片最大買家之一。
知情人士說,字節跳動今年已訂購超過10萬塊910B晶片,但截至7月,收到的晶片還不到3萬塊,速度太慢無法滿足字節跳動的需求。
報導提到910B晶片的侷限時表示,訓練AI模型的要求極高,需要大量數據,以及運用超高性能晶片,如輝達的GPU。對此知情人士說,字節跳動主要將910B晶片用於計算密集程度較低的推理任務。從計算參數來衡量,新模型的能力及複雜性將不如字節跳動現有的AI模型豆包。
字節跳動派駐美國華府發言人Michael Hughes否認上述消息,表示沒有開發新的模型。