天脈網 | 天脈新媒體中心主辦！
手機版
二維碼

時事快聞

當前位置：首頁 > 天脈資訊 > 財經人物 > 正文內容

阿里通義千問推出QVQ-72B-Preview，視覺推理能力媲美物理大師？

時間：2024-12-26 14:05 來源：天脈網作者：沈如風

阿里通義千問團隊近日宣布了一項重要進展，他們基于Qwen2-VL-72B模型，成功推出了名為QVQ-72B-Preview的開源視覺推理模型。這款新模型在解決復雜物理問題方面展現出卓越的能力，仿佛一位物理學大師，能夠冷靜地通過邏輯推理找到問題的解決方案。

為了全面評估QVQ-72B-Preview的性能，阿里通義千問團隊在四個專業數據集上進行了測試。首先是MMMU數據集，這是一個涵蓋多學科、多模態的大學級別評測集，旨在考察模型在視覺相關領域的綜合理解和推理能力。還有MathVista數據集，它專注于數學相關的視覺推理，包括拼圖測試圖形的邏輯推理、函數圖的代數推理以及學術論文圖形的科學推理等。MathVision數據集則來自真實的數學競賽，提供了更多樣化、更廣泛學科的問題，相比MathVista更具挑戰性。最后，OlympiadBench數據集是一個奧林匹克競賽級別的雙語多模態科學基準測試集，包含了來自奧林匹克數學和物理競賽的8476個問題，甚至包括中國高考題目，每個問題都附有專家級的詳細注釋。

測試結果顯示，QVQ-72B-Preview在MMMU基準測試中取得了70.3的高分，顯著超越了其前身Qwen2-VL-72B-Instruct。同時，在MathVista、MathVision和OlympiadBench這三個專注于數學和科學問題的基準測試中，QVQ-72B-Preview也表現出色，有效縮小了與當前最先進的o1模型之間的差距。

盡管QVQ-72B-Preview在視覺推理方面取得了顯著進步，但阿里通義千問團隊也坦誠地指出了該模型目前存在的幾個限制。首先，模型在處理多語言問題時，可能會意外地混合或切換語言，從而影響響應的清晰度。其次，在遞歸推理方面，模型有時會陷入循環邏輯模式，產生冗長的響應而無法得出明確的結論。團隊還強調了安全和倫理考慮的重要性，指出模型需要進一步增強安全措施，以確保可靠和安全的性能，用戶在部署時應保持謹慎。

同時，團隊也提醒用戶注意QVQ-72B-Preview的性能和基準限制。盡管該模型在視覺推理方面有所改善，但它并不能完全替代Qwen2-VL-72B的能力。特別是在多步驟視覺推理過程中，模型可能會逐漸失去對圖像內容的關注，導致產生幻覺。因此，用戶在使用QVQ-72B-Preview時，需要充分考慮這些限制因素。

更多>同類天脈資訊

三七互娛一季度投資收益飆升：游戲主業穩健，AI布局成果初顯

04-28

中鎢高新2025年研發投入加碼創新驅動營收凈利雙增長

04-28

阿里HappyHorse上線實測：讓科技大佬“對簿公堂”，視頻生成潛力初顯

04-28

Agent時代團隊協作新范式：誰在重塑原生協作空間？

04-28

閱星曈獲超億元融資：AI超便攜電子紙賽道發力創始人履歷亮眼

04-28

雄安新區首條TIR國際公路運輸線直抵莫斯科開啟國際物流新篇章

04-28

阿里HappyHorse 1.0上線實測：生成GTA式畫面，馬斯克奧爾特曼“隔空交鋒”

從這幾個案例來看，在提示詞要求較為詳細時，HappyHorse 1.0可以較好地理解并執行復雜的畫面構圖、鏡頭運動和風格氛圍要求，生成的人物形體與基礎物理交互也相對穩定；但在高精度音畫同步、微觀物理細節以及…

04-27

算力概念股領漲，多只漲停股封單資金雄厚，這些個股受關注

04-27

OpenAI跨界入局手機市場，聯發科高通助力，蘋果生態護城河受挑戰？

郭明錤同時發布了一張AI agent手機界面概念設計圖，用以展示這一新形態手機與現有產品在交互邏輯上的根本差異——用戶不再是打開一堆應用程序，而是通過手機直接執行任務、滿足需求。由于手機硬件供應鏈已高度成熟…

04-27

谷歌“Agent Skill”工具箱開源：云服務與AI深度融合，開發者迎來高效開發新時代

事實上，早在谷歌發布這款官方 Agent Skill 庫之前，谷歌云 AI 總監、Gemini 工程負責人 Addy Osmani在領英上宣布開源了一款 Agent Skills 庫：為 AI 編碼智能…

04-27

容知日新2025年研發投入增至1.37億夯實技術壁壘拓展成長空間

04-27

企業禮品定制全攻略：從需求匹配到效果量化，打造品牌長期價值

04-27

深圳華強成資金博弈場：機構力挺與量化拋售同現江海股份獲多路資金追捧

04-27

具身智能賽道融資熱潮涌動星動紀元無界動力雙雙獲投商業化加速跑

04-27

黑芝麻開盤一字跌停涉嫌信披違規公司及時任董事長遭立案調查

上證報中國證券網訊（記者李五強）4月27日，黑芝麻開盤后一字跌停，股價報4.59元/股。截至早盤收市，該股封單逾32萬手。黑芝麻4月24日晚公告，公司及公司時任董事長韋清文先生于2026年4月24日收到中…

04-27

點擊查看更多 +

全站最新

湖南前首富陳邦：眼科擴張遇阻，個人地產投資“火力全開”？

湖南前首富陳邦：眼科擴張遇阻，個人地產投資“火力全開”？

湖南黃金一季度業績亮眼董事長退休換屆 ESG投入彰顯責任擔當

湖南黃金一季度業績亮眼董事長退休換屆 ESG投入彰顯責任擔當

美克生能源沖刺港交所：女掌門魏瓊與首席科學家嚴曉共筑能源新篇

美克生能源沖刺港交所：女掌門魏瓊與首席科學家嚴曉共筑能源新篇

恒興股份北交所IPO將上會董事長李皞丹與辭任董事晏映泉曾同為獄警

恒興股份北交所IPO將上會董事長李皞丹與辭任董事晏映泉曾同為獄警

智度股份前董事長陸宏達辭職后被曝在美疑涉性侵，智度集團緊急回應無刑事責任

智度股份前董事長陸宏達辭職后被曝在美疑涉性侵，智度集團緊急回應無刑事責任

阿里HappyHorse 1.0上線實測：生成GTA式畫面，馬斯克奧爾特曼“隔空交鋒”

阿里HappyHorse 1.0上線實測：生成GTA式畫面，馬斯克奧爾特曼“隔空交鋒”

熱門內容

媒體信息

新傳播周刊

新傳播，傳播新經濟之聲！

本欄最新

阿里HappyHorse 1.0上線實測：生成GTA式畫面，馬斯克奧爾特曼“隔空交鋒”

阿里HappyHorse 1.0上線實測：生成GTA式畫面，馬斯克奧爾特曼“隔空交鋒”

黑芝麻開盤一字跌停涉嫌信披違規公司及時任董事長遭立案調查

黑芝麻開盤一字跌停涉嫌信披違規公司及時任董事長遭立案調查

追覓科技CEO俞浩連發微博炮轟小紅書

追覓科技CEO俞浩連發微博炮轟小紅書

小馬智行彭軍：L3自動駕駛權責難界定或難成現實核心是“人車分責”

小馬智行彭軍：L3自動駕駛權責難界定或難成現實核心是“人車分責”

庫克交棒特努斯：折疊屏首秀啟新程，十大新品線蓄勢待發

庫克交棒特努斯：折疊屏首秀啟新程，十大新品線蓄勢待發

上?？铺財M轉戰北交所IPO：2025年營收增長利潤下滑董事長胡平身兼多職

上?？铺財M轉戰北交所IPO：2025年營收增長利潤下滑董事長胡平身兼多職

網站首頁 | 關于我們 | 聯系方式 | 版權隱私 | RSS訂閱 | 違規舉報魯公網安備37010202700497號

天脈網由天脈文化中心主辦，立足北京，放眼全中國，做首都圈新經濟、新文化、新科技資訊平臺！
2009-2021 天脈網 (c) All Rights Reserved 魯ICP備2022032383號-1