馬斯克Grok 3模型問世,能否超越DeepSeek成AI新霸主?

   時間:2025-02-19 11:17 來源:天脈網作者:江紫萱

在人工智能領域,一場前所未有的競賽正在激烈上演。就在近日,備受矚目的“地球上最聰明的人工智能”——Grok 3,終于由特斯拉創始人馬斯克攜手xAI團隊正式發布。

這場發布會,一如既往地秉承了馬斯克的風格,雖然預告十二點準時開始,但最終還是讓等待的觀眾多等了近二十分鐘。然而,當發布會正式拉開帷幕,近一個小時的直播內容瞬間點燃了整個AI界。

馬斯克攜xAI天團,全方位展示了Grok 3的強大實力。據官方數據,Grok 3在多項測試中均超越了谷歌、OpenAI和DeepSeek等明星公司的招牌模型,引發了業內外的廣泛關注。

國內外關于Grok 3的報道鋪天蓋地,“首個突破1400分(模型在Imarena.ai競技場的得分)的模型”、“首個十萬卡集群訓練出來的模型”等頭銜讓人眼前一亮。在知危編輯部看來,Grok 3雖不至于“炸裂”,但至少從直播內容來看,它再次延續了AI領域“大力出奇跡”的神話。

目前,Grok 3僅對部分X的Premium+會員開放。馬斯克在發布會上,將Grok與GPT的模型迭代速度進行了對比,針對性十足。他強調,Grok 3實際上是一個模型家族,包括非推理模型和推理模型兩種。

在非推理模型方面,Grok 3和Grok 3 mini在AIME’24美國數學競賽、GPQA(研究生水平科學知識問答能力的基準測試)和代碼三項測試中,成績遠超其他模型。而mini版本則可以通過犧牲一定程度的準確性,來換取更快的回答速度。在Chatbot Arena的盲測中,Grok 3的早期版本“巧克力”更是以史無前例的1400分登頂,整體風格控制、編碼、數學和創意寫作等多個方面均獲第一。

在推理模型方面,Grok 3 Reasoning Beta和Grok 3 mini Reasoning同樣表現出色。盡管在測試中,如果不算上加時賽(即給模型更多思考時間),Grok 3的推理模型與其他模型的差距并不明顯,但一旦加上時長,其優勢便立即顯現。這似乎說明,Grok 3的推理能力可以隨著時間線性增長,具有巨大的成長空間。

現場演示中,馬斯克團隊展示了Grok 3推理模型在2025年AIME數學競賽上的測試結果,并直接讓Grok 3生成3D動畫代碼和結合俄羅斯方塊與寶石迷陣的新游戲。這不僅讓人聯想到馬斯克此前實錘的xAI將成立AI游戲工作室的消息,更預示著Grok 3在游戲制作方面的巨大潛力。

馬斯克還透露,Grok 3在未來的兩到三年內,可能參與到特斯拉的生產和火箭發射過程中。同時,基于Grok 3構建的Deepsearch智能搜索引擎也正式發布,為用戶提供了更加智能、高效的搜索體驗。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號