豆包視覺大模型來襲,一元解鎖284張720P圖片處理,性價比爆棚!

   時間:2024-12-18 14:14 來源:天脈網作者:顧青青

字節跳動在近期的一次重大技術發布會上,正式推出了其全新的豆包視覺理解模型,標志著視覺理解技術也步入了“厘時代”的嶄新階段。這一創新舉措,無疑為企業用戶提供了前所未有的高性價比多模態大模型服務。

在火山引擎Force大會上,豆包視覺理解模型驚艷亮相,其每千個tokens的輸入費用僅為3厘,這一價格優勢意味著企業僅需一元錢便能處理多達284張720P分辨率的圖片,相較于市面上的同類服務,成本降低了85%。這一突破性定價,無疑將極大地推動AI技術的普及與應用發展。

豆包視覺理解模型不僅具備精準的視覺內容識別能力,更在理解和推理方面展現出卓越實力。它能夠根據圖像信息進行復雜的邏輯運算,無論是分析圖表、處理代碼,還是解答學科問題,都游刃有余。該模型還擁有細膩的視覺描述和創作能力,為用戶帶來了更加豐富多樣的使用體驗。

豆包視覺理解模型演示圖

據了解,豆包視覺理解模型已順利接入豆包App及PC端產品,其便捷性和高效性得到了用戶的廣泛好評。豆包戰略研究負責人周昊表示,豆包團隊一直致力于提升用戶的輸入體驗,通過不斷優化多模態輸入功能,包括語音、視覺等,使得用戶能夠更加快速、方便地使用豆包產品。這些先進的模型技術,現已通過火山引擎平臺向企業客戶全面開放。

在發布會上,豆包3D生成模型也首次公開亮相。該模型與火山引擎的數字孿生平臺veOmniverse強強聯合,能夠高效完成智能訓練、數據合成以及數字資產制作等任務,為AIGC創作提供了一套強大的物理世界仿真模擬器。

豆包大模型的多款產品也迎來了重要更新。豆包通用模型pro已全面對標GPT-4,但使用價格僅為后者的八分之一。音樂模型從原先只能生成60秒的簡單結構,升級到了能夠創作3分鐘的完整音樂作品。而文生圖模型2.1版本,更是首次在業界實現了精準生成漢字和一句話P圖的產品化能力,并已成功接入即夢AI和豆包App。

豆包3D生成模型演示圖

火山引擎總裁譚待在會上透露,豆包視頻生成模型1.5版將于2025年春季推出,具備更強的長視頻生成能力。同時,豆包端到端實時語音模型也將很快上線,為用戶帶來多角色演繹、方言轉換等全新功能。譚待強調,盡管豆包大模型發布時間相對較晚,但其憑借快速的迭代和進化,已成為國內技術最領先、功能最全面的大模型之一。

數據顯示,截至12月中旬,豆包通用模型的日均tokens使用量已超過4萬億,較首次發布時增長了33倍。豆包大模型已廣泛應用于各行各業,與八成主流汽車品牌建立了合作關系,并接入了多家手機、PC等智能終端,覆蓋終端設備約3億臺。在智能終端上,豆包大模型的調用量在半年內增長了100倍。

在企業生產力相關的場景中,豆包大模型同樣備受青睞。近三個月來,豆包大模型在信息處理場景的調用量增長了39倍,客服與銷售場景增長了16倍,硬件終端場景增長了13倍,AI工具場景增長了9倍,學習教育等場景也實現了大幅增長。譚待認為,豆包大模型市場份額的快速增長,得益于火山引擎“更強模型、更低成本、更易落地”的發展理念,讓AI真正成為每家企業都能輕松使用的高效科技。

豆包大模型應用場景圖

火山引擎在發布會上還升級了火山方舟、扣子和HiAgent三款平臺產品,助力企業構建自身的AI能力中心,高效開發AI應用。火山方舟推出了大模型記憶方案,并引入了prefix cache和session cache API,以降低延遲和成本。同時,火山方舟還推出了全域AI搜索服務,提供場景化搜索推薦一體化和企業私域信息整合等功能。

火山方舟平臺界面圖

云原生作為過去十年最重要的計算范式,如今正迎來大模型時代的變革?;鹕揭嬲J為,下一個十年的計算范式將從云原生邁入AI云原生的新時代。為此,火山引擎推出了新一代計算、網絡、存儲和安全產品,以滿足大模型時代的需求。在計算層面,火山引擎GPU實例通過vRDMA網絡,支持大規模并行計算和P/D分離推理架構,顯著提升訓練和推理效率,降低成本。在存儲方面,新推出的EIC彈性極速緩存能夠實現GPU直連,使大模型推理時延降低至原來的五十分之一,成本降低20%。在安全層面,火山引擎將推出PCC私密云服務,構建大模型的可信應用體系,實現用戶數據在云上推理的端到端加密,且性能優異,推理時延與明文模式相比差異在5%以內。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號