在小米近期舉辦的“人車家全生態大會”上,一位新面孔引發了科技圈的廣泛關注——小米MiMo大模型負責人羅福莉首次公開亮相。這位被貼上“AI天才少女”標簽的年輕科學家,以近乎學術化的演講風格,將技術思考與行業洞察娓娓道來,迅速成為輿論焦點。
1995年出生于四川宜賓的羅福莉,學術履歷堪稱亮眼:北京師范大學計算機本科畢業后,她進入北京大學計算語言學研究所深造,2019年憑借在國際頂級會議ACL發表的8篇論文嶄露頭角。此后,她先后在阿里達摩院和DeepSeek擔任核心研發角色,直至今年11月通過朋友圈官宣加盟小米。據知情人士透露,雷軍為招攬這位技術新星,曾開出千萬級年薪,相關話題一度登上熱搜榜。
在演講中,羅福莉提出了對智能體發展的核心判斷:當代AI必須突破單純的語言交互,構建以代碼能力和工具調用為核心的“高效溝通語言”。她指出,當前智能體間的交互帶寬嚴重不足,唯有通過重構模型架構提升推理效率,才能實現從“回答問題”到“完成任務”的跨越。這一觀點與小米正在推進的大模型戰略形成強烈呼應——今年以來,小米以月為單位密集發布新模型:4月推出推理模型MiMo,5月上線多模態MiMo-VL,9月端到端語音模型MiMo-Audio問世,11月更是針對家庭場景推出Miloco系統。
數據印證著小米的生態野心:截至第三季度,其AIoT平臺全球連接設備突破10.4億臺。羅福莉的加入,被視為小米破解“人車家”生態中模型理解世界難題的關鍵一步。她帶領團隊在入職不足10天時便公開首篇論文,提出跨具身基座模型MiMo-Embodied,嘗試打通自動駕駛與具身智能兩大領域。這一研究方向與她此前在朋友圈的宣言一脈相承:“智能終將從語言邁向物理世界,我們正在構建這樣的未來。”
物理AI的概念正在成為行業新風向。按照英偉達的定義,這類模型通過運動技能理解現實世界,常見于機器人和自動駕駛汽車等自主系統。羅福莉將其簡化為更直觀的表述:“真正的智能要在交互中‘活出來’。”這種理念直接指向小米的核心生態:在“人車家”體系中,AI需要嵌入具體業務場景,承擔感知、決策與執行的三重角色。12月16日公布的MiMo-V2-Flash開源模型(總參數量309B,活躍參數量15B),正是這一思路的實踐成果——該模型已初步具備模擬世界的能力,實現了低成本與高速度的平衡。
小米的生態布局正顯現出系統性特征。據集團總裁盧偉冰披露,MiMo系列已形成覆蓋推理、視覺、多模態、音頻與具身的多層級架構。其中,11月推出的Xiaomi Miloco智能家居方案尤為引人注目:通過端側視覺語言大模型MiMo-VL-Miloco-7B,系統可結合攝像頭實時數據,將傳統“單一條件觸發”升級為“多維度場景感知”。用戶只需口語化表達需求,系統便能自動創建智能規則,無需手動設置復雜觸發條件。
行業觀察家指出,Miloco的核心突破在于打破設備孤島。資深互聯網分析師丁道師認為:“未來連桌椅板凳都可能融入智能家居系統,本地大模型能自動感知需求、切換場景,同時保護用戶隱私。”這種“主動服務”模式,正在重塑人機交互范式。GKURC智庫分析師丁少將則強調,Miloco展現的集中式操作系統趨勢,可能催生類似AI手機的統一調度中樞,但關鍵在于能否建立跨品牌協議標準,“一旦突破生態壁壘,智能家居將從‘單點智能’躍升為自主決策的‘空間智能體’”。













