馬斯克Grok 3模型亮相,能否超越DeepSeek成AI新標桿?

   時間:2025-02-19 00:46 來源:天脈網作者:蘇婉清

在AI領域的競技舞臺上,一場前所未有的風暴正席卷而來。就在近日,科技巨頭馬斯克攜其神秘AI團隊xAI,正式揭曉了被譽為“地球上最聰慧的人工智能”——Grok 3。這場發布會,盡管延續了馬斯克一貫的風格,略顯姍姍來遲,卻無疑點燃了全球科技愛好者的熱情。

發布會歷時一小時,馬斯克攜手xAI天團(其中包括兩位華人成員),全方位展示了Grok 3的驚人實力。據稱,該模型在多項性能指標上均超越了谷歌、OpenAI及DeepSeek等業界巨頭的明星產品。直播結束后,網絡上瞬間炸開了鍋,部分幸運用戶已搶先體驗,其中不乏對Grok 3推理能力的高度評價,認為其可與o1-pro相媲美,甚至略勝一籌于DeepSeek R1和Gemini。

國內外媒體對Grok 3的報道鋪天蓋地,諸如“首個突破1400分(Imarena.ai競技場得分)的模型”、“首個十萬卡集群訓練出的模型”等頭銜,讓人目不暇接。世超亦全程觀看了這場發布會,雖不至于用“炸裂”形容,但Grok 3確實再次印證了AI領域“大力出奇跡”的規律。

目前,Grok 3僅對X平臺部分Premium+會員開放。發布會上,xAI團隊首先將Grok與GPT的模型迭代速度進行了直觀對比,針對性十足。在模型性能方面,Grok 3更是展現出了與眾多頂尖模型一較高下的決心。

Grok 3家族分為非推理模型和推理模型兩大系列。非推理模型方面,Grok 3與Grok 3 mini在AIME '24數學競賽、GPQA(研究生水平科學知識問答基準測試)及代碼測試中,均大幅領先GPT-4o、Gemini 2.0 pro、DeepSeek V3及Claude 3.5 Sonnet等競品。盡管Grok 3 mini與其他模型差距不大,但其犧牲部分準確性以換取更快回答速度的特點,同樣引人注目。

推理模型方面,Grok 3 Reasoning Beta與Grok 3 mini Reasoning同樣表現出色。在測試中,盡管未加時情況下與其他模型差距不大,但一旦增加思考時間,其優勢便顯而易見。現場演示中,Grok 3推理模型在2025年AIME數學競賽上的表現,更是令人印象深刻。Grok 3還能生成3D動畫代碼及結合多種游戲規則的新游戲,其游戲制作能力若如演示般強大,將對游戲圈產生深遠影響。

Grok 3的強大離不開馬斯克提及的10萬卡集群,該集群僅用122天便搭建完成,后擴展至20萬卡,為Grok 3的誕生奠定了堅實基礎。然而,盡管Grok 3看似無敵,但搶先體驗的用戶分享中也不乏與宣傳不符的實際測試案例,部分測試中Grok 3的表現甚至不及o3 mini和Claude 3.5 Sonnet。

關于Grok 3是否開源的問題也備受關注。馬斯克表示,xAI通常在新模型發布后再開源舊版本,因此即便開源,也將是Grok 2。此舉似乎表明,馬斯克的主要目標仍是與老對手(暗指OpenAI)競爭,而非回應開源陣營的壓力。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號