AI大模型新突破:豆包上線圖片理解功能,引領實用化浪潮

   時間:2024-12-04 08:03 來源:天脈網作者:趙云飛

近期,國內AI大模型應用領域迎來了一場“多元化”的變革。

據業內消息,字節跳動旗下的豆包應用近期上線了一項名為“圖片理解”的新功能。無論是通過豆包APP還是PC端,用戶只需上傳圖片,即可讓應用識別并理解圖片中的內容。這一功能突破了傳統OCR識別技術的局限,不再局限于文字識別,而是能夠全面解析圖片信息。

舉例來說,用戶詢問某個景點的位置或動漫人物的身份,豆包都能夠迅速給出準確的回答。這一功能的強大之處在于其對于圖片內容的深度理解,而不僅僅是簡單的文字識別。

不僅如此,豆包還能夠解析復雜的圖像內容,如四格漫畫。以一幅描繪物理學家發現牛頓發明重力的幽默漫畫為例,豆包能夠準確解讀出漫畫中的文字與圖像信息,進而解析出漫畫所表達的笑話含義。漫畫中,物理學家在戰場上看到士兵倒地,不是考慮士兵的死活,而是思考其背后的科學原理,最終得出牛頓發明了重力的結論,諷刺了物理學家有時不切實際的思考方式。

豆包的這一功能并非孤例。此前,馬斯克的人工智能公司xAI也曾為其產品Grok增加了圖像理解功能,并展示了Grok理解并解釋笑話的能力。這些案例表明,AI大模型在圖像理解領域取得了顯著的進展。

隨著AI技術的飛速發展,越來越多的企業開始將AI大模型應用于更實用的場景中。圖片理解功能正是其中之一,它能夠滿足用戶在搜索、查找評估、文本寫作等多個場景中的需求,使AI大模型更加貼近實際應用。

數據顯示,2024年10月,AI原生應用行業的月活躍用戶規模已達到8976萬,同比增長373%。這些應用廣泛應用于情感陪伴、職場辦公、趣味休閑、文案寫作、教育學習、生活助手、圖像生成、行業顧問等多個領域。其中,字節跳動的豆包App憑借其強大的功能和豐富的應用場景,已成為中國日活用戶最高的AI大模型產品之一。

在網頁端和移動端,AI原生應用同樣表現出強勁的增長勢頭。Kimi智能助手、文心一言、豆包、通義千問等應用均擁有龐大的用戶群體。其中,豆包在移動端的月活躍用戶數量更是高達4839萬,遙遙領先于其他競爭對手。

AI技術的快速發展不僅推動了相關應用的普及,也為全球科技創新帶來了新的契機。據預測,到2030年,全球AI領域的市場規模將超過1.8萬億美元。這一巨大的市場潛力將吸引更多的企業和投資者進入AI領域,推動AI技術的不斷創新和應用。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號