在科技界的聚光燈下,一場關于人工智能巔峰對決的戲碼正式拉開帷幕。據行業權威媒體透露,埃隆·馬斯克旗下的xAI公司最新發布的Grok 3模型,在X平臺上吸引了超過200萬觀眾的目光,成為業界焦點。
Grok 3以其驚人的計算能力和卓越表現震撼業界。相較于上一代模型,Grok 3的計算量提升了10倍,使用了龐大的20萬張GPU卡集群進行訓練。整個訓練過程分為兩個階段:第一階段歷時122天,使用了10萬張GPU進行同步全面訓練;第二階段則在92天內擴展到20萬張GPU卡,再次進行訓練和推理。這一壯舉不僅彰顯了xAI的技術實力,也預示著人工智能領域的新里程碑。
在數學能力測試(AIME24)中,Grok 3以52分的成績超越了DeepSeek-V3的39分以及OpenAI的o3-mini等模型。在科學知識評估(GPQA)和編程能力測試(LCB Oct-Feb)等方面,Grok 3同樣表現出色。在最新的AIME 2025性能測試中,Grok 3 Reasoning Beta版本在推理和計算時間復合評分上獲得了93分的高分,其精簡版本Grok-3 mini也達到了90分,遠超DeepSeek-R1和Gemini-2 Flash Thinking等其他模型。
馬斯克在直播中親自展示了Grok 3的強大功能,包括解決復雜的物理問題和創作融合《寶石迷陣》與《俄羅斯方塊》元素的游戲。盡管Grok 3的推理模型仍處于測試版,并仍在訓練中,但其展現出的潛力已足以令業界震撼。
然而,并非所有人都對Grok 3持完全樂觀態度。有分析指出,在“推理+測試時間計算”這一測試中,盡管Grok 3使用了20萬張GPU卡,但其數學性能相較于o3-mini-high模型和DeepSeek R1模型并未展現出顯著優勢。馬斯克也承認,Grok 3的語音模式仍存在一定的不穩定性。
盡管如此,xAI公司仍信心滿滿。馬斯克表示,Grok 3模型擁有強大的AI推理能力,在測試中表現優于市面上任何已知產品。從今天開始,X平臺的Premium Plus訂閱用戶將率先獲得Grok 3的訪問權限,而獨立應用程序則需要訂閱Super Grok服務,具體售價尚未公布。
這場直播的同時,OpenAI方面也傳來了新動向。為抵御馬斯克的收購要約,OpenAI正考慮賦予其非營利性董事會特殊投票權,以確保其對重組后的公司保持控制權,并能夠否決包括微軟和軟銀等現有投資者以及董事會的決策。這一舉措被外界視為OpenAI對馬斯克敵意收購的防御措施。
回溯歷史,馬斯克與OpenAI的淵源頗深。他曾是OpenAI的聯合創始人之一,但因理念不合于2018年離開公司。隨著ChatGPT的火爆,馬斯克創立了xAI公司,旨在與OpenAI展開競爭。過去一年多時間里,xAI團隊發布了多個版本的Grok模型,并不斷推動技術進步。
如今,馬斯克終于迎來了證明自己的時刻。他坦言,Grok 3將成為AI領域的真正顛覆者。xAI公司基于合成數據進行訓練,能夠通過反復檢查數據來反思所犯的錯誤,從而實現邏輯一致性。這一特點使得Grok 3在解決問題時更加準確和高效。
然而,這場AI領域的巔峰對決遠未結束。隨著DeepSeek等開源模型的崛起,無論是國外的OpenAI和xAI,還是國內的百度、騰訊等科技大廠,都面臨著新的挑戰和機遇。開源與閉源、應用與解決方案之間的較量正愈演愈烈。
在這場沒有硝煙的戰爭中,每一位參與者都在努力尋找自己的定位和優勢。而最終誰將問鼎AI領域的巔峰,還需時間來揭曉。











