小米認領爆款模型!雷軍稱MiMo-V2-Pro超馬斯克xAI,羅福莉透露將開源

   時間:2026-03-19 13:20 來源:天脈網作者:顧青青

近日,小米在AI領域投下一枚重磅炸彈,正式發布MiMo-V2家族三款全新模型——MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-TTS。其中,此前匿名上線OpenRouter并引發廣泛關注的Hunter Alpha,被證實為MiMo-V2-Pro的早期測試版本;另一神秘模型Healer Alpha則對應MiMo-V2-Omni。這一消息不僅揭開了此前匿名模型的神秘面紗,更讓小米在AI領域的布局浮出水面。

據小米官方披露,Hunter Alpha上線全球最大API聚合平臺OpenRouter后,調用量持續攀升,連續多日登頂日榜,累計調用量突破1T tokens。經過一周的迭代優化,正式版MiMo-V2-Pro在長文處理能力和Agent場景穩定性上實現顯著提升。雷軍在發布會上直言,該模型在榜單表現已超越馬斯克旗下xAI的Grok,并透露小米今年在AI領域的研發和資本投入將超過160億元。

作為家族旗艦,MiMo-V2-Pro專為高強度Agent場景打造,總參數量超1T,激活參數42B,采用混合注意力架構,支持1M超長上下文。該模型在OpenClaw、Claude Code等框架中展現出卓越的端到端任務完成能力,可自主完成復雜工作流編排、長程規劃和精準工具調用。官方稱其整體體驗超越Claude Sonnet 4.6,逼近Claude Opus 4.6,但API定價僅為后者的1/5。技術規格上,MiMo-V2-Pro將混合注意力比例從5:1提升至7:1,在參數規模擴大的同時維持高效推理,并引入輕量級MTP層提升生成速度。

研發團隊負責人羅福莉在推特發文透露,MiMo-V2-Pro的訓練始于數月前,最初目標是提升長上下文推理效率。她將此次突破稱為"安靜的突襲",強調從Chat范式向Agent范式的轉變速度超出預期。她特別提到,團隊通過強制體驗"編排式上下文"系統,激發了研究人員的想象力,這種想象力迅速轉化為研發推進速度。對于未來規劃,她表示模型將在穩定后開源,并總結道:"必須在回報出現前一年就做出戰略判斷,后訓練階段的敏捷性則依賴產品直覺驅動的極致迭代周期。"

與MiMo-V2-Pro形成互補的是全模態交互模型MiMo-V2-Omni。該模型在音頻理解方面支持環境聲分類、多說話人分離和長音頻連續理解,綜合表現超越Gemini 3 Pro;圖像理解能力逼近頂尖閉源模型,可處理復雜圖表分析;視頻理解則實現原生音視頻聯合輸入,具備情境感知與未來推理能力。目前,MiMo-V2-Omni已開放API服務,支持256K上下文,定價為輸入0.4美元/百萬tokens,輸出2美元/百萬tokens。

第三款模型MiMo-V2-TTS聚焦高表現力語音生成,采用自研Audio Tokenizer與多碼本聯合建模架構,經過上億小時語音數據預訓練和多維度強化學習。該模型支持多粒度語音風格控制,既能整體定調也能精準調節局部情緒表達,在韻律自然度、音質穩定性、字詞準確性等維度持續優化。得益于多層碼本建模,模型可在離散token空間中高保真建模語音,使強化學習獎勵信號更直接作用于生成過程。

為推動Agent生態發展,小米宣布將聯合OpenClaw、OpenCode等五大開發框架團隊,為全球開發者提供MiMo-V2-Pro和MiMo-V2-Omni為期一周的限時免費接口支持。這一舉措被視為小米構建AI生產力系統的關鍵一步,其"全棧模型家族"戰略正引發行業關注。此前,Hunter Alpha在Claw-eval測試中擊敗智譜GLM-5-Turbo的消息,已讓市場對小米的AI實力重新評估。

隨著小米正式入局,國內大模型競爭格局再生變數。有分析指出,小米的"萬億參數隱形冠軍"策略與DeepSeek形成直接對壘。據悉,DeepSeek-V4將于4月發布,該模型在Coding能力和長期記憶方面取得突破,并強化了視覺處理和AI搜索功能。隨著各家戰略調整和人才流動,今年大模型市場的技術路線之爭將更加激烈。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號