雷軍開出年薪千萬 親自出馬挖角95後「AI天才少女」
陸媒報導,小米創辦人雷軍親自出馬,開出人民幣千萬年薪的條件挖角被譽為「AI 天才少女」的 95 後羅福莉,領導小米 AI 大模型團隊。羅福莉是中國國產大模型 DeepSeek「DeepSeek-V2」的關鍵開發者之一。
《新浪財經》引述知情人士透露,雷軍認為小米在 AI 大模型領域發力太晚,於是親自出馬挖角。
報導稱,為了邀請羅福莉加入小米,雷軍展現極大的誠意和熱情,他安排一場精心準備的會面,地點選在小米總部的科技展廳,該地展示小米最新的科技成果和未來的願景。
小米 AI 實驗室的大模型團隊自 2023 年 4 月成立以來,已擴展至 1,200 多人,單是北京就開放了 59 個大模型相關職位。另有媒體報導稱,小米目前擁有 6,500 張 GPU 的算力資源,並計劃建置萬卡級 GPU 集群。
公開資料顯示,羅福莉本科就讀於北京師範大學電腦專業,碩士畢業於北京大學電腦語言學專業。她 2019 年在北大讀碩士時,在人工智能領域頂尖國際會議 ACL 發表了 8 篇論文,登上知乎熱搜,她提出的詞義消歧方法和文本風格轉換框架在業界引發轟動。
羅福莉研究所畢業後,先進入阿里達摩院做人工智能研究,從事預訓練語言模型相關的工作,負責阿里達摩院 AliceMind 開源項目,主導開發多語言預訓練模型 VECO。
直至 2022 年,羅福莉加入幻方量化從事深度學習相關策略建模和算法研究,後跳槽至 DeepSeek 擔任深度學習研究員,參與研發 MoE 大模型 DeepSeek-V2。
雷軍曾在公開演講中表示,小米做 AI 大模型的想法和許多公司不太一樣,選擇主力突破的是輕量化和本地部署。如何在燒錢的大模型業務中平衡成本,無疑是雷軍考慮的核心問題。而這也是擁有 DeepSeek-V2 研發背景的羅福莉被雷軍看中的原因。