小米MiMo大模型三連更!神秘模型現(xiàn)真身,還能免費(fèi)體驗養(yǎng)蝦新玩法

   時間:2026-03-20 00:18 來源:快訊作者:智東西

小米公司今日宣布,其自主研發(fā)的MiMo大模型系列迎來重大更新,推出旗艦基座大模型MiMo-V2-Pro、全模態(tài)Agent模型MiMo-V2-Omni以及語音合成大模型MiMo-V2-TTS。此次更新聚焦于提升智能體能力,旨在為用戶提供更高效、更智能的交互體驗。

MiMo-V2-Pro作為旗艦基座模型,總參數(shù)量超過1T,激活參數(shù)量達(dá)到42B,支持100萬上下文長度。該模型在編程Agent、通用Agent和工具使用方面展現(xiàn)出強(qiáng)大能力,性能與Claude Sonnet 4.6、GPT 5.2、Gemini 3.0 Pro等國際領(lǐng)先模型相近。在OpenClaw標(biāo)準(zhǔn)評測榜單PinchBench和Claw-eval上,MiMo-V2-Pro排名第三,僅次于Claude Sonnet 4.6和Claude Opus 4.6。MiMo-V2-Pro的API定價僅為Claude Opus 4.6的1/5,具有顯著的價格優(yōu)勢。

全模態(tài)基座模型MiMo-V2-Omni則專注于多模態(tài)交互與執(zhí)行場景,支持文本、視覺、語音全模態(tài)輸入。該模型在音頻理解、圖像理解和視頻理解方面均表現(xiàn)出色,能夠跨模態(tài)理解復(fù)雜環(huán)境、自主制定并執(zhí)行計劃,并在遇到異常時實時修正策略。例如,MiMo-V2-Omni可以像人一樣操控瀏覽器,根據(jù)用戶指令在小紅書查找信息、在京東比價下單,甚至與客服砍價。該模型還支持接入WPS Office,通過自然語言指令直接生成Word、Excel、PPT和PDF等文檔。

語音合成大模型MiMo-V2-TTS則致力于讓智能體擁有更自然、更富有情感的聲音。該模型基于小米自研的Audio Tokenizer和多碼本語音-文本聯(lián)合建模架構(gòu),經(jīng)過上億小時語音數(shù)據(jù)的大規(guī)模預(yù)訓(xùn)練和多維度強(qiáng)化學(xué)習(xí),實現(xiàn)了高度可控的多粒度語音風(fēng)格控制。MiMo-V2-TTS支持多方言、多角色、多語氣生成,能夠智能識別文本中的標(biāo)點(diǎn)符號、語氣詞和強(qiáng)調(diào)標(biāo)記,并將其轉(zhuǎn)化為恰當(dāng)?shù)恼Z音表達(dá)。該模型還支持高質(zhì)量的歌聲合成,讓智能體既能說、能演,也能唱。

據(jù)悉,MiMo-V2-Pro和MiMo-V2-Omni的早期測試版曾以匿名模型Hunter Alpha和Healer Alpha的身份在全球最大API聚合平臺OpenRouter上引發(fā)熱議,其API調(diào)用量多天登頂日榜。目前,這兩個匿名模型仍在OpenRouter向開發(fā)者免費(fèi)開放。MiMo-V2-Pro和MiMo-V2-Omni還將聯(lián)合OpenClaw、OpenCode、KiloCode、Blackbox及Cline等智能體開發(fā)框架團(tuán)隊,為全球開發(fā)者提供為期一周的限時免費(fèi)接口支持。

 
 
更多>同類天脈資訊
全站最新
熱門內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟(jì)之聲!
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)隱私  |  RSS訂閱  |  違規(guī)舉報 魯公網(wǎng)安備37010202700497號