在科技界引發轟動的時刻終于到來,特斯拉創始人埃隆·馬斯克攜其人工智能實驗室xAI的核心團隊,通過一場視頻直播,向全球揭曉了他們的最新力作——Grok 3,自詡為“地球上最聰慧的人工智能”。

這場發布會背后,是xAI動用了一個由20萬塊先進GPU構建的超大規模計算中心,其規模之龐大,令人嘆為觀止。盡管外界對Grok 3的完整性尚存疑慮,但其在“跑分”測試中展現的實力,已足以震撼整個業界,特別是科技愛好者群體。發布會后,市場上熱炒數周的DeepSeek概念股遭遇重創,仿佛預示著新王者的誕生。
在思維能力的測試中,Grok 3展現出了其先進性。Andrej提到,Grok 3能夠成功創建一個類似《卡坦島》的六邊形網格棋盤游戲網頁,這是許多頂級模型都難以完成的任務。然而,在面對一個復雜的“表情符號之謎”時,Grok 3卻未能解開隱藏的信息,這一挑戰連DeepSeek-R1都只能部分解碼。
在解決井字棋棋盤問題上,Grok 3表現出了清晰的思路,但在提高難度后要求生成“棘手”棋盤時卻失敗了。同時,在知識問答環節,Grok 3在沒有搜索的情況下,成功估算了訓練GPT-2所需的FLOPs數量,這一表現甚至超越了OpenAI自家的頂級思維模型o1-pro。

Andrej還嘗試了一些有趣的LLM陷阱查詢,以測試Grok 3的應對能力。結果顯示,Grok 3在解決某些簡單謎題時表現出色,但在幽默感和復雜倫理問題上仍有待提升。例如,在生成笑話時,Grok 3的表現并不盡如人意,生成的笑話往往缺乏新意和幽默感。同時,在面對復雜的倫理問題時,Grok 3也顯得過于謹慎,甚至拒絕回答某些問題。
盡管存在這些不足,但Andrej對Grok 3的總體印象仍然積極。他認為,考慮到xAI團隊從零開始僅用一年時間就達到了如此先進的水平,這一成就無疑是前所未有的。同時,他也提醒說,這些模型具有隨機性,每次給出的答案可能會有所不同,因此還需要等待更多評估結果來驗證Grok 3的真正實力。
最后,Andrej對xAI團隊表示了祝賀,并期待將Grok 3納入他的“LLM委員會”,聽取它對未來的見解。這場科技盛宴不僅展示了xAI的強大實力,也為人工智能領域帶來了新的希望和期待。












