谷歌Nano Banana 2圖像模型登場:響應更快、理解更強,修復中文亂碼等難題

   時間:2026-02-27 13:18 來源:快訊作者:IT之家

谷歌近日正式發布了新一代圖像生成模型Nano Banana 2,該模型基于Gemini 3.1 Flash Image架構開發,在響應速度、語義理解能力以及提示詞解析精準度方面實現顯著提升。相較于前代產品,新模型不僅優化了核心性能,還針對性解決了中文用戶長期面臨的字符顯示異常問題。

技術團隊重點改進了模型的多語言處理能力,通過優化字符編碼機制,成功消除此前版本中普遍存在的中文亂碼現象。測試數據顯示,在處理復雜語義的中文提示時,新模型的文本還原準確率提升至98.7%,同時有效減少了畫面中出現非預期偽影的概率。針對角色一致性難題,開發人員引入動態特征綁定技術,使模型能夠在跨圖像生成時保持最多5個角色形象的高度統一。

在圖像質量維度,Nano Banana 2將輸出分辨率上限從2K提升至4K,并支持單張畫面融合多達14個獨立元素。通過改進的注意力分配算法,模型能夠更精準地解析包含多重條件的復雜提示,例如"在雨夜的城市街道上,穿著紅色風衣的長發女子牽著金毛犬,背景需包含霓虹招牌和復古路燈"這類詳細描述。

該模型將通過分階段部署策略逐步替代舊版本,首批上線平臺包括谷歌Gemini智能助手、Google AI Studio開發環境以及Google Flow創意工具套件。商業用戶可通過付費API接口調用增強版功能,廣告客戶則能在Google Ads系統中直接使用模型生成營銷素材。開發團隊透露,后續版本計劃引入3D場景構建能力,并優化對小眾語言的支持效率。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號