馬斯克Grok 3 AI登頂排行榜,20萬GPU訓練成果能否顛覆行業?

   時間:2025-02-18 21:46 來源:天脈網作者:江紫萱

馬斯克旗下人工智能公司xAI終于揭曉了其備受期待的AI模型Grok 3。這款一度推遲發布的模型,在2月17日晚的直播發布會上迎來了全球超過百萬觀眾的矚目。

Grok 3被視為xAI對OpenAI的o3-mini和DeepSeek的R1等模型的直接回應。馬斯克在發布會前夕就在其社交平臺X上預熱,稱Grok 3為“地球上最聰明的人工智能”。

發布會中,馬斯克與三位xAI工程師共同展示了Grok 3的多種功能。據馬斯克介紹,Grok 3在AIME(評估模型解決數學問題的能力)和GPQA(評估模型在博士級物理、生物和化學問題上的表現)等基準測試中,超越了市面上所有現有的AI模型。

AI基準測試開放平臺lmarena.ai的數據也證實了這一點。早期版本的Grok 3(代號chocolate)在Arena排行榜上位居第一,成為首個突破1400分的模型。這一成績標志著Grok 3在數學、科學和編程等多個領域的卓越表現。

然而,盡管Grok 3在發布會上大放異彩,一些用戶和測試者卻指出了其存在的問題。有用戶表示,Grok 3在回答關于《流放之路2》游戲的問題時,給出的結論錯誤頻出。同時,在經典的多邊形小球編程問題上,Grok 3也未能給出正確答案。

xAI在直播中還透露了Grok 3背后強大的算力支持。馬斯克表示,原本計劃使用十萬塊H100 GPU的超級計算機集群Colossus來訓練Grok模型,但實際上,在訓練進行到92天時,集群的規模已經擴大到了20萬塊GPU。

為了展示Grok 3的強大功能,演示團隊還進行了物理學和游戲的實例演示。Grok 3成功生成了一段代碼,繪制了從地球發射火箭到火星并返回的三維動畫圖表,以及一個結合了俄羅斯方塊和寶石迷城的游戲。

除了基本的模型能力外,Grok 3還具備智能體功能。xAI為Grok 3開發了類似于OpenAI的DeepSearch智能體,可以全面搜索互聯網并為用戶提供詳盡的整合報告。然而,一些用戶在體驗后發現,Grok 3在某些領域的表現并未達到預期。

盡管Grok 3在發布會上受到了廣泛關注,但一些用戶和專家的反饋也提醒我們,AI模型的發展仍需時間和努力。未來,我們期待看到更多像Grok 3這樣的創新模型,為人類帶來更多便利和驚喜。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號