在科技界掀起的一波巨浪中,埃隆·馬斯克再次站在了舞臺中央。近日,他通過X平臺向全球觀眾直播,親自揭曉了其人工智能公司xAI的最新力作——Grok 3旗艦AI大模型。

這場備受矚目的直播吸引了超過200萬在線觀眾,馬斯克在直播中毫不吝嗇地贊譽Grok 3為“地球上最聰慧的人工智能”。Grok 3此番推出了兩個版本:標準版與迷你版(Grok 3 mini)。盡管Grok 3 mini在響應速度上更勝一籌,但其準確性相較于標準版略遜一籌。
為了直觀展示Grok 3的實力,xAI團隊在直播中公布了一系列對比測試結果。數據顯示,Grok 3在AIME、GPQA及LCB等多個基準測試中,力壓GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3及Gemini-2 Pro等知名模型,尤其在數學、科學及代碼處理領域展現出卓越性能。

不僅如此,Grok 3的早期版本chocolate在Chatbot Arena這一國際大模型競技平臺上同樣表現出色,分數遙遙領先。據xAI官方透露,Grok 3的訓練計算量是前代Grok 2的十倍有余,這一巨大投入為其性能飛躍奠定了堅實基礎。
Grok 3不僅在計算力上實現了突破,更解鎖了測試時計算能力,使其推理功能得到顯著提升。在對比測試中,Grok 3 Reasoning與Grok 3 mini Reasoning憑借更多測試時間計算,超越了o3 mini、o1及DeepSeek-R1等高配模型。

操作界面上,Grok 3與Grok 3 mini配備了DeepSearch、Think及BigBrain三大功能按鈕,覆蓋了研究、頭腦風暴、數據分析、圖像生成及代碼生成等多重應用場景。Think模式讓Grok系列能夠深入思考問題,類似于OpenAI的o3 mini等推理模型;而Big Brain模式則專為解決復雜數學、科學及編程問題設計,提供更全面、細致的推理服務。

值得注意的是,Grok 3新增的DeepSearch功能,旨在與OpenAI的DeepResearch等功能一較高下。該功能能夠深度搜索互聯網及X平臺信息,提供精煉摘要回答用戶問題,進一步提升了用戶體驗。為了享受Grok 3的優先使用權,用戶需訂閱X Premium+服務;而SuperGrok訂閱(每月30美元或每年300美元)則能解鎖更多推理、深度搜索查詢功能,并無限制使用圖像生成服務。
馬斯克透露,Grok 3即將增加語音模式,預計在未來一周左右上線。幾周后,Grok 3模型將與DeepSearch功能一同整合至xAI的企業API中。他還承諾在幾個月內將前代產品Grok 2開源,以回饋社區。
“我們習慣于在新版本發布時,將舊版本開源。”馬斯克表示,“當Grok 3達到成熟穩定階段,我們計劃在幾個月內將Grok 2開源。”隨著Grok 3的強勁推出,其在教育領域的應用前景備受期待。然而,其實際效果仍需市場與用戶的進一步檢驗。但可以肯定的是,這場AI軍備競賽正深刻影響著教育領域的發展。











