谷歌近日推出全新圖像生成模型Nano Banana 2,在分辨率、生成一致性及多語言支持方面實現顯著突破。該模型基于Gemini 3.1 Flash Image架構升級,圖像輸出分辨率從2K提升至4K,同時優化了文本渲染精度與畫面元素融合能力。據實測反饋,此前版本存在的中文字符亂碼、語義錯亂及畫面偽影等問題已得到大幅改善。
技術整合方面,Nano Banana 2融合了Gemini Flash的極速響應特性與Nano Banana Pro的龐大知識庫,支持在單一工作流中保持最多5個角色形象的一致性,并可實現單張畫面內14個元素的有機融合。模型創新性地引入實時網絡搜索功能,可動態調用最新信息輔助圖像生成,同時支持圖像內文本的精準翻譯與多語言渲染。
在應用場景拓展上,該模型將覆蓋Gemini應用、谷歌搜索(AI模式與Lens)、Google AI Studio等12個核心產品平臺,服務范圍擴展至141個新增國家和地區,并支持8種新語言環境。其中,Gemini應用將默認啟用Nano Banana 2替代原Pro版本,但專業版與旗艦版訂閱用戶仍可通過菜單選項切換回舊版模型。
據開發團隊披露,新模型通過改進的注意力機制與多模態對齊算法,顯著提升了復雜場景下的元素協調性。在涉及多人物互動或混合文化元素的測試案例中,系統展現出了更強的語義理解能力,能夠準確呈現不同語言背景下的視覺表達需求。這一升級或將推動生成式AI在廣告設計、教育內容制作等領域的深度應用。














