DeepMind Genie 2引領變革:機器人訓練邁入新紀元?

   時間:2025-04-22 10:47 來源:天脈網作者:江紫萱

谷歌DeepMind在機器人訓練領域取得重大突破,其最新AI模型Genie 2展現出前所未有的潛力。

DeepMind的聯合創始人兼首席執行官Demis Hassabis在一檔知名節目中親自展示了這一創新技術。他強調,Genie 2不僅能夠創建可交互的3D環境,更能在加速機器人學習方面發揮巨大作用。

據介紹,Genie 2具有從單一靜態圖像生成可探索3D虛擬世界的能力。這一功能為AI代理和機器人提供了一個極為逼真的模擬環境,使它們能夠在其中進行各種學習和訓練。

在一次演示中,DeepMind的研究科學家Jack Parker-Holder向觀眾展示了一張加州瀑布頂部的照片。通過Genie 2的處理,這張照片被轉化為了一個類似第一人稱視角的視頻游戲場景。用戶或AI代理可以在這個虛擬環境中自由移動,探索瀑布周圍的各個角落,甚至發現原始照片中并未呈現的景象。

實機演示:Genie 2將加州瀑布照片轉化為視頻游戲場景

Hassabis指出,Genie 2的“世界模型”能夠動態生成環境,并模擬現實世界的物理特性。這使得它不僅在娛樂領域有著廣泛的應用前景,如生成游戲和視頻內容,更重要的是為AI和機器人的訓練提供了一個高效且低成本的平臺。

傳統的機器人數據采集過程復雜且成本高昂,數據量有限且收集速度緩慢。而Genie 2的模擬環境則可以生成近乎無限的數據量,允許機器人在虛擬世界中進行初步的學習,之后再通過少量的現實世界數據進行微調,從而大幅提升訓練效率。

在另一個演示中,一個由AI控制的騎士角色在由Genie 2生成的3D環境中自主完成了任務,如從多個門廊中選擇正確的路徑并爬上樓梯。Hassabis表示,這種技術可以讓機器人在模擬環境中學習復雜的導航、物體交互和決策制定等任務,從而減少對現實世界數據的依賴。

實機演示:AI騎士在Genie 2生成的3D環境中自主完成任務

Hassabis還透露,DeepMind正在探索利用谷歌地圖、谷歌地球和街景視圖等地理數據來進一步增強AI的世界理解能力。這些數據將為AI提供豐富的現實世界背景信息,有助于機器人更好地適應真實環境。

Genie 2還能將靜態圖像(如街景照片或個人度假照片)轉化為交互式3D場景,為機器人訓練和用戶體驗帶來了全新的可能性。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號