商湯發布日日新V6大模型,徐立與馬云共話AI融入日常生活

   時間:2025-04-11 17:54 來源:天脈網作者:朱天宇

在人工智能領域,多模態大模型正逐漸成為行業發展的新風向。繼DeepSeek憑借卓越的文本推理能力和高性價比脫穎而出后,業界對于多模態推理領域的下一個領軍者充滿期待。

近日,商湯科技在2025技術交流日上震撼發布了日日新SenseNova V6(簡稱“日日新V6”)大模型體系,其在多模態推理能力上堪稱國內翹楚,與OpenAI的o1相媲美,同時在數據分析能力上遠超GPT-4。更令人矚目的是,從性價比角度來看,其多模態訓練和推理成本刷新了業界最低記錄。

2025年被視為大模型應用的關鍵之年。在這場交流日上,兩位行業大佬不約而同地強調了AI應深入百姓生活的理念。商湯科技董事長兼首席執行官徐立表示:“AI之道,在于百姓之日用?!睙o獨有偶,馬云也在阿里云新財年啟動會上提出,高科技不僅要仰望星空,更要腳踏實地,服務于人們的日常生活??萍既藛T的使命不是讓AI取代人類,而是讓AI更加理解人類,更好地為人類服務。

日日新V6作為一款擁有超過6000億參數的MoE原生多模態通用大模型,在長思維鏈、數理能力、多模態推理以及全局記憶等方面實現了重大技術突破。其數據分析能力遙遙領先GPT-4,多模態深度推理能力更是位居國內首位,與OpenAI的o1不相上下。

基于超過200B的高質量多模態長思維鏈數據,商湯通過多智能體協作,成功合成了長思維鏈,并進行了驗證。這使得日日新V6具備了出色的多模態推理能力,能夠支持最長64K的多模態長思維鏈,讓模型具備了長時間的思考能力。在處理真實世界的復雜問題時,日日新V6展現出了卓越的混合圖文理解推理能力,一個模型就能應對文本、多模態等各類任務。

日日新V6還打破了市面上大模型只能解析短視頻的限制,實現了對10分鐘視頻的全幀率解析,與Gemini 2.5 Turbo相比,達到了同類型最強。例如,輸入一段《黑神話:悟空》的游戲錄屏,日日新V6就能自動剪輯出游戲高光時刻,并生成解說文案,完成一段精彩的游戲解說。

商湯是如何實現如此驚人的記憶和理解能力的呢?原來,它能夠將畫面、語音、音效、字幕、口語和時間軸邏輯進行對齊,形成多模態統一時序表征。通過細粒度級聯信息壓縮和內容敏感的動態過濾,實現了長視頻的高比例壓縮,10分鐘視頻可以壓縮到16K tokens,同時保留關鍵語義。

去年,商湯大模型的實時交互能力就曾引起廣泛關注。此次,商湯推出了全新的輕量級全模態交互模型SenseNova V6 Omni,帶來了國內頂尖的多模態交互體驗。當你將手機對準一本英文周刊或論文時,它能實時翻譯你手指所指的內容,讓你享受自然直觀的指讀交互體驗。當你忙于工作時,孩子纏著你講故事,你就可以把講故事的任務交給日日新V6。它還能擔任文旅導游、數學老師,甚至扮演各種角色。

SenseNova V6 Omni已經在多個行業和場景中得到了應用,成為國內首個商業化的全模態實時交互模型。在現場,《IT時報》記者見證了傅利葉等多品牌的機器人搭載商湯大模型后,具備了更加自然、類人的實時交互能力,讓人形機器人擁有了眼睛、嘴巴、耳朵和大腦。

商湯在此次發布會上還帶來了一個驚喜,推出了搭載日日新V6的商量App。通過這個入口,C端用戶將能夠體驗到文字、圖像、視頻等多種模態的流式交互。不過,目前商量App還處于內測階段,用戶可以在商量網頁端體驗日日新V6的強大功能。只有更加懂人、更像人的AI,才能更快地融入人們的日常生活,成為不可或缺的“日用品”。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號