在AI技術飛速發展的當下,企業級應用正迎來新的突破。近日,火山引擎在FORCE原動力大會上宣布,豆包大模型1.8版本正式發布,同時推出多項創新技術,為企業AI應用提供更強大的支持。這一系列舉措標志著AI技術正從實驗室走向規模化落地,為企業帶來實實在在的生產力提升。
豆包大模型1.8版本在多模態理解和Agent能力方面實現了顯著提升。該模型在設計之初就針對多模態Agent場景進行了優化,在多輪交互、復雜指令遵循以及操作系統級Agent操作等方面表現出色。特別是在視覺能力上,新版本進行了底層升級,能夠以低幀率處理超長視頻,并在視頻語義解析、空間關系理解和文檔結構化處理等方面取得突破性進展。原生支持的智能上下文管理機制,使模型在執行超長、多步驟任務時能夠自動清理歷史信息,確保任務持續穩定完成。
火山引擎總裁譚待在大會上分享了一組令人矚目的數據:截至目前,豆包大模型的日均Token使用量已突破50萬億,較去年同期增長超過10倍,自發布以來更是增長了417倍。已有超過100家企業客戶的累計Token使用量超過一萬億,顯示出企業級AI應用正在快速規模化。譚待強調,火山引擎一直致力于通過技術創新降低成本,推動模型降價策略,目前已有更多廠商跟進這一趨勢,共同做大市場蛋糕。
在視頻生成領域,火山引擎也取得了重要進展。去年春季發布的視頻模型Seedance 1.0,如今已升級至1.5 Pro版本。新版本采用原生音視頻聯合生成架構,支持環境音、背景音樂和人聲等多種元素,實現了毫秒級的音畫同步輸出。更值得一提的是,Seedance 1.5 Pro支持多人跨語對話,能夠根據畫面中說話角色的數量和景深信息,實現精準的口型匹配,有效解決了"張口不發聲"或口型錯位等問題。該模型還原生支持多語言及多種中文方言,包括四川話、粵語和上海話等,大大拓展了視頻內容創作的實用邊界。
為了幫助企業更好地實現Agent的規模化落地,火山引擎推出了推理代工服務,支持極致彈性伸縮、全棧推理優化和分布式緩存。這項服務就像一臺已調校完成的頂級賽車,企業只需將模型"插入發動機"即可快速運行。針對企業構建Agent過程中面臨的身份權限管理、黑盒測試、存量系統智能化等挑戰,火山引擎發布了AI Agent平臺AgentKit+HiAgent技術體系。
AgentKit構建了一套讓Agent走向生產規模化落地的基礎設施底座,具備身份認證、運行時管理、云沙箱、網關、記憶庫、可觀測性、評測和安全圍欄等功能。與傳統開發方式相比,AgentKit大幅簡化了開發流程。傳統開發需要手動調用模型、解析結果并處理各種狀態和異常,前后端代碼量至少需要1500至2000行。而使用AgentKit后,前端Agent僅需約50行代碼,后端十幾行即可完成簡單串聯,整套實現控制在61行以內,代碼量減少約96%,同時開發和運行穩定性也大幅提升。
去年發布的HiAgent解決方案也在不斷迭代,今年推出了"1+N+X"體系,即一個統一AI任務調度入口、N個企業通用智能體和X個業務定制智能體應用,幫助企業加速Agent的規模化落地。這些創新技術正在推動AI從技術潛力轉化為實實在在的行業生產力,為企業帶來新的增長機遇。












