字節跳動豆包大模型全面升級,視頻生成模型或成AI競爭新焦點

   時間:2024-12-19 14:10 來源:天脈網作者:陸辰風

在科技日新月異的今天,大模型技術正以前所未有的速度蓬勃發展?;鹕揭婵偛米T待形象地比喻道:“面對一列高速行駛的列車,最重要的是確保自己能夠搭乘其上?!边@一觀點在近期火山引擎Force大會上得到了進一步印證。

會上,字節跳動推出了豆包視覺理解模型,標志著視覺理解模型也正式邁入“厘時代”。這一模型不僅為企業提供了極具性價比的多模態大模型能力,更預示著AI技術在視覺領域的深度應用即將迎來新的突破。據悉,豆包視覺理解模型能夠精準識別視覺內容,具備強大的理解和推理能力,可完成復雜任務如分析圖表、處理代碼及解答學科問題等。其細膩的視覺描述和創作能力,使得千tokens輸入價格僅為3厘,一元錢即可處理284張720P的圖片,相比行業價格便宜了85%。

譚待表示,豆包視覺理解模型不僅將極大地拓展大模型的能力邊界,還將降低人們與大模型交互的門檻,解鎖更多應用場景。目前,該模型已接入豆包App和PC端產品,注重多模態輸入,包括語音、視覺等能力,并已通過火山引擎開放給企業客戶。

火山引擎總裁譚待

會上還首次亮相了豆包3D生成模型,該模型與火山引擎數字孿生平臺veOmniverse結合使用,能夠高效完成智能訓練、數據合成和數字資產制作,成為支持AIGC創作的物理世界仿真模擬器。豆包大模型的多款產品也迎來了重要更新:豆包通用模型pro已全面對齊GPT-4o,使用價格僅為后者的1/8;音樂模型從生成60秒的簡單結構升級到生成3分鐘的完整作品;文生圖模型2.1版本則首次實現了精準生成漢字和一句話P圖的產品化能力。

即夢Dreamina 張楠

即夢Dreamina的張楠認為,生成式AI技術能夠將人們腦海中的奇思妙想快速視覺化,像做夢一樣。即夢希望成為“想象力世界”的相機,記錄每個人的奇思妙想,幫助每個人輕松表達和自由創作。而豆包大模型的應用也在加速落地,截至12月中旬,豆包通用模型的日均tokens使用量已超過4萬億,較首次發布時增長了33倍。在B端,豆包大模型已與八成主流汽車品牌合作,接入多家智能終端,覆蓋終端設備約3億臺。

豆包大模型應用場景

與企業生產力相關的場景,豆包大模型也備受青睞。最近3個月,豆包大模型在信息處理場景的調用量增長了39倍,客服與銷售場景增長16倍,硬件終端場景增長13倍,AI工具場景增長9倍,學習教育等場景也有大幅增長。譚待認為,豆包大模型市場份額的爆發,將讓AI成為每一家企業都能用得起、用得好的普惠科技。隨著大模型時代的到來,云計算也在經歷變革?;鹕揭嬲J為,下一個十年的計算范式應從云原生進入到AI云原生的新時代,并基于此推出了新一代計算、網絡、存儲和安全產品。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!