雷軍重金招攬AI天才少女羅福莉,助小米壯大AI大模型

【財訊快報/陳孟朔】手機起家轉戰造車領域的中國科企大廠小米(1810.HK)計劃大力投入AI大模型領域,中媒報導,小米創辦人兼董事長雷軍以千萬元人民幣年薪,招攬DeepSeek開源大模型DeepSeek-V2的關鍵開發者羅福莉,領導小米AI大模型團隊。羅福莉被喻為95後AI「天才少女」。公開數據顯示,她本科就讀於北京師範大學電腦專業,碩士畢業於北京大學電腦語言學專業。她2019年在北大讀碩士時,在人工智慧領域頂尖國際會議ACL發表8篇論文,登上知乎熱搜。

羅福莉碩士畢業後,進入阿里巴巴旗下的達摩院專研人工智慧(AI)研究,從事預訓練語言模型相關工作,負責阿里達摩院Alice Mind開源項目,主導開發多語言預訓練模型VECO。

2022年,她加入幻方量化從事深度學習相關策略建模與演算法研究,後來跳槽到DeepSeek擔任深度學習研究員,參與研發MoE大模型DeepSeek-V2。

DeepSeek是中國最早開啟大模型降價的廠商,也是大模型價格戰的源頭與推動者。其發布DeepSeek-V2後,字節跳動、阿里巴巴(9988.HK)、百度(9888.HK)等廠商紛紛跟進降價。同時,DeepSeek也是中國互聯網大廠以外,唯一一家儲備萬張A100晶片的公司,這為其早期的技術研發提供堅實的算力基礎。

小米擬以重金招攬羅福莉,是公司全面發力AI大模型的其中一個動作。早前有報導,小米正大力投入AI大模型,並著手搭建自家GPU萬卡集群,據悉,其大模型團隊在成立時已有6500張圖像處理器(GPU)資源。