通義實驗室開源MAI-UI模型:可跨應用執行復雜任務 提升交互效率

   時間:2025-12-29 15:01 來源:快訊作者:鳳凰網科技

通義實驗室多模態交互團隊近日宣布,其研發的通用GUI智能體基座模型MAI-UI正式開源。這一模型專注于屏幕界面理解與操作執行,能夠跨應用完成多步驟復雜任務,例如查詢車票信息、在通訊群組中同步內容,或調整會議安排等日常高頻場景。

據團隊介紹,MAI-UI的核心優勢在于其主動交互能力。當用戶指令模糊時,模型會通過提問澄清需求,避免因理解偏差導致任務失敗。模型支持調用結構化工具,例如地圖搜索或路線規劃API,直接替代繁瑣的界面點擊操作,顯著提升任務執行效率與成功率。目前,該模型已推出2B和8B兩種參數規模的版本,其中2B與8B版本均已開源,供開發者自由使用。

在性能驗證方面,MAI-UI在ScreenSpot-Pro、AndroidWorld等多個GUI理解與任務執行基準測試中表現優異,成績位居當前領先水平。其應用場景覆蓋手機、電腦等主流操作系統,能夠適應不同設備的界面交互需求。這一特性使其在跨平臺任務自動化領域具有廣泛潛力。

開源后,MAI-UI有望推動智能體技術在終端設備上的落地應用。開發者可基于其基座模型,快速構建定制化解決方案,例如自動化辦公助手、智能客服系統等。團隊表示,未來將持續優化模型性能,并探索更多場景下的交互可能性。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號