馬斯克旗下人工智能公司xAI近日宣布,其最新研發的Grok 4.1大模型正式上線,并面向全球用戶免費開放。這一版本被官方稱為Grok系列迄今為止最重大的技術升級,在對話智能、情緒理解及現實場景應用能力上實現全面突破,多項核心測試指標超越競爭對手,引發行業廣泛關注。
根據xAI公布的測試數據,Grok 4.1在四大權威榜單中登頂。在Arena競技場榜單中,該模型以1483分的Elo評分位居第一,其衍生版本Grok 4.1-thinking緊隨其后,較排名第三的非xAI模型領先31分,形成顯著優勢。情緒智商測試EQ-Bench中,Grok 4.1-thinking以1586分刷新紀錄,在情緒識別、共情能力及人際理解等維度展現卓越表現。創意寫作測試Creative Writing V3顯示,新模型得分達1722分,較上一代暴漲600分,性能直逼早期GPT-5.1 Polaris。官方宣稱Grok 4.1的幻覺率較早期版本降低超3倍,成為該系列中最可靠的模型。

用戶實際體驗反饋進一步驗證了技術升級的實效性。xAI透露,在11月初針對部分用戶的灰度測試中,65%的對比場景下用戶更傾向于選擇Grok 4.1的回答。這一結果不僅體現在參數優化層面,更直接反映了模型在真實交互場景中的用戶體驗提升。馬斯克本人在社交平臺轉發消息時強調,用戶將明顯感知到系統響應速度與回答質量的雙重飛躍。

與行業常見策略不同,xAI選擇將Grok 4.1完全免費開放。非訂閱用戶可通過grok.com、grok.x.com及移動端應用(grok.com/download)直接體驗最新功能。這種開放模式被解讀為xAI加速市場滲透的重要舉措,旨在通過技術優勢快速建立用戶基礎。
分析人士指出,Grok 4.1的升級路徑凸顯了xAI的差異化競爭策略。該模型重點強化三大核心能力:情緒理解與共情技術、任務執行可靠性及創意生成效率。在情緒智能領域,Grok通過EQ-Bench的領先表現,開辟了區別于ChatGPT、Gemini等競品的獨特賽道;在實用場景中,低幻覺率特性使其在搜索、決策支持等結構化任務中更具競爭力;而快速推理與創意寫作的結合,則為其拓展創作工具及社交應用場景奠定基礎。從“風格鮮明”到“全能助手”的定位轉變,標志著Grok系列正式加入下一代AI助手的核心競爭行列。













