在萬眾矚目中,馬斯克麾下的xAI公司正式揭曉了其最新力作——Grok 3大型語言模型。這一盛況通過視頻直播形式呈現,吸引了超過百萬觀眾的在線圍觀,連馬斯克本人也親臨直播間助陣。
據馬斯克親自介紹,Grok 3在極短時間內實現了功能的飛躍式提升,相較于其前代Grok 2,其能力已躍升一個數量級。Grok 3及其精簡版Grok 3 mini在多項性能指標上均表現出色,甚至超越了Gemini、DeepSeek和ChatGPT等業界佼佼者。
xAI的工程師團隊透露,盡管Grok系列起步較晚,但其在MMLU(一種評估語言模型多任務語言理解能力的基準測試)上的得分正以驚人的速度逼近ChatGPT。Grok 3的訓練量是Grok 2的十倍之多,且已在xAI內部穩定運行了兩周時間。

xAI還推出了名為Deepsearch的Grok 3智能搜索引擎。這款工具被工程師們譽為xAI的首款廣泛代理工具,它不僅能夠幫助專業人士編寫代碼,還能為普通人解答日常生活中的各種疑問。
馬斯克在現場親自演示了Grok 3的搜索能力。例如,當詢問“下一次星艦發射的時間”時,Grok 3會像DeepSeek一樣展示其處理過程,包括瀏覽的網頁、思考路徑,以及信息的可信度驗證,最終以列表形式給出預測結果。

Deepsearch在深度思考過程中還會展示不同的子任務,這種功能相較于現有的搜索引擎更為強大,能夠節省大量時間,這得益于其對搜索引擎算法和邏輯的重構。
關于用戶何時能體驗到這款“地球上最聰明的人工智能”,馬斯克表示將首先向預定用戶開放。由于模型仍在持續優化中,蘋果應用商店的Grok版本可能會稍顯滯后,而網頁版將保持最新狀態。據透露,Grok 3的語音模式有望在一周后推出。
在直播的尾聲,馬斯克和xAI工程師回答了網友們的提問。當被問及是否考慮開源時,馬斯克給出了肯定的答復,并表示每次發布新版本時都會開源上一個版本,Grok 3將在幾個月后開源。對于“Grok 3是男性還是女性”這一有趣問題,馬斯克笑稱性別是模型自我定義的,并幽默地提醒網友“不要愛上Grok”。
馬斯克還分享了開發Grok 3過程中的最大挑戰,即模型的訓練和100%邏輯推理過程,其復雜程度堪比預測宇宙的發展態勢。
如果Grok 3的推理能力真如其宣傳般強大,那么它或將引領AI領域從“生成答案”向“邏輯推導”的新階段邁進。
xAI公司成立于2023年7月,此前已成功推出Grok-1、Grok-1.5、Grok-1.5 Vision和Grok-2等大模型產品。其中,Grok-1是迄今為止參數量最大的開源大語言模型;Grok-1.5在推理能力和上下文長度上有所改進;Grok-1.5 Vision則是首個多模態智能模型;而Grok-2在Chatbot Arena榜單上排名第18位。
然而,當前的大模型行業競爭異常激烈。在Grok 3發布的同一天,OpenAI的首席執行官奧特曼在社交媒體上透露,GPT-4.5的測試體驗遠超預期,似乎預示著GPT-4.5的發布已為期不遠。谷歌也在近期發布了一系列新模型,包括Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及旗艦大模型Gemini 2.0 Pro的實驗版本。面對這些強勁的競爭對手,Grok 3能否占據市場主導地位仍需時間檢驗。













