時事快聞

馬斯克發布Grok 3，宣稱性能超越ChatGPT與DeepSeek，能否稱雄AI界？

時間：2025-02-18 15:24 來源：天脈網作者：沈瑾瑜

在萬眾矚目中，馬斯克麾下的xAI公司正式揭曉了其最新力作——Grok 3大型語言模型。這一盛況通過視頻直播形式呈現，吸引了超過百萬觀眾的在線圍觀，連馬斯克本人也親臨直播間助陣。

據馬斯克親自介紹，Grok 3在極短時間內實現了功能的飛躍式提升，相較于其前代Grok 2，其能力已躍升一個數量級。Grok 3及其精簡版Grok 3 mini在多項性能指標上均表現出色，甚至超越了Gemini、DeepSeek和ChatGPT等業界佼佼者。

xAI的工程師團隊透露，盡管Grok系列起步較晚，但其在MMLU（一種評估語言模型多任務語言理解能力的基準測試）上的得分正以驚人的速度逼近ChatGPT。Grok 3的訓練量是Grok 2的十倍之多，且已在xAI內部穩定運行了兩周時間。

xAI還推出了名為Deepsearch的Grok 3智能搜索引擎。這款工具被工程師們譽為xAI的首款廣泛代理工具，它不僅能夠幫助專業人士編寫代碼，還能為普通人解答日常生活中的各種疑問。

馬斯克在現場親自演示了Grok 3的搜索能力。例如，當詢問“下一次星艦發射的時間”時，Grok 3會像DeepSeek一樣展示其處理過程，包括瀏覽的網頁、思考路徑，以及信息的可信度驗證，最終以列表形式給出預測結果。

Deepsearch在深度思考過程中還會展示不同的子任務，這種功能相較于現有的搜索引擎更為強大，能夠節省大量時間，這得益于其對搜索引擎算法和邏輯的重構。

關于用戶何時能體驗到這款“地球上最聰明的人工智能”，馬斯克表示將首先向預定用戶開放。由于模型仍在持續優化中，蘋果應用商店的Grok版本可能會稍顯滯后，而網頁版將保持最新狀態。據透露，Grok 3的語音模式有望在一周后推出。

在直播的尾聲，馬斯克和xAI工程師回答了網友們的提問。當被問及是否考慮開源時，馬斯克給出了肯定的答復，并表示每次發布新版本時都會開源上一個版本，Grok 3將在幾個月后開源。對于“Grok 3是男性還是女性”這一有趣問題，馬斯克笑稱性別是模型自我定義的，并幽默地提醒網友“不要愛上Grok”。

馬斯克還分享了開發Grok 3過程中的最大挑戰，即模型的訓練和100%邏輯推理過程，其復雜程度堪比預測宇宙的發展態勢。

如果Grok 3的推理能力真如其宣傳般強大，那么它或將引領AI領域從“生成答案”向“邏輯推導”的新階段邁進。

xAI公司成立于2023年7月，此前已成功推出Grok-1、Grok-1.5、Grok-1.5 Vision和Grok-2等大模型產品。其中，Grok-1是迄今為止參數量最大的開源大語言模型；Grok-1.5在推理能力和上下文長度上有所改進；Grok-1.5 Vision則是首個多模態智能模型；而Grok-2在Chatbot Arena榜單上排名第18位。

然而，當前的大模型行業競爭異常激烈。在Grok 3發布的同一天，OpenAI的首席執行官奧特曼在社交媒體上透露，GPT-4.5的測試體驗遠超預期，似乎預示著GPT-4.5的發布已為期不遠。谷歌也在近期發布了一系列新模型，包括Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及旗艦大模型Gemini 2.0 Pro的實驗版本。面對這些強勁的競爭對手，Grok 3能否占據市場主導地位仍需時間檢驗。

更多>同類天脈資訊

2026年鋼管矯直機市場：技術升級下的趨勢洞察與服務商優選指南

04-14

Mano-P 1.0全球領先！13個榜單登頂，GUI智能體開啟個性化AI新紀元

在官方演示中，Mano-P 完成了一套從視頻生成、上傳、分析、剪輯到二次評測的全流程自動化，其中同時涉及網頁操作和專業剪輯軟件的混合使用 ——這對依賴瀏覽器協議的方案來說是不可能完成的任務。」「這也…

04-14

南非科技部長恩齊曼迪：期待與中國深化多領域合作共促科技創新發展

南非科學、技術與創新部長布萊德·恩齊曼迪日前在比勒陀利亞接受新華社記者專訪時表示，南非期待同中國進一步深化在人工智能、清潔能源以及青年科技人才交流等領域的合作，不斷推動兩國科技創新合作邁上新臺階。恩齊曼迪…

04-14

蘋果智能眼鏡進入密集測試階段 2027年或攜多款鏡框及實用功能登場

觀點網訊：4月13日，據馬克·古爾曼透露，蘋果公司智能眼鏡項目已進入密集測試階段，至少四種鏡框款式正在同步研發，預計將于2027年正式亮相。據介紹，該設備并非AR眼鏡，而是一款輕量化智能穿戴產品，功能介于A…

04-14