近期,科技界迎來了一場震撼發布——馬斯克麾下的xAI公司推出了全新人工智能模型Grok 3。在一場吸引了百萬觀眾的線上直播中,馬斯克親自揭開了這款被譽為“地球上最聰明AI”的神秘面紗,瞬間點燃了全球對AI技術的討論熱情。
Grok 3的強大,得益于其背后的超級計算機集群Colossus,該集群配備了20萬塊GPU,為模型的訓練提供了前所未有的算力支持。在發布會上,馬斯克展示了Grok 3在多個AI基準測試中的卓越表現,特別是在數學、科學和編程領域,其成績遠超ChatGPT。例如,在美國數學邀請賽中,Grok 3獲得了52分,而ChatGPT僅得20分;在GPQA測試中,Grok 3更是以滿分75分遙遙領先ChatGPT的57分。

更令人驚嘆的是,Grok 3還具備生成復雜動畫和游戲的能力,這在AI領域堪稱前所未有。然而,盡管在基準測試中大放異彩,Grok 3在實際應用中卻遭遇了用戶的質疑。部分用戶反饋稱,在處理特定問題時,Grok 3的回答會出現錯誤,尤其是在經濟學和社會學等領域,其回答的精準度有待提高。這或許意味著,盡管Colossus提供了強大的算力支持,但Grok 3的模型訓練仍需進一步完善。

盡管Grok 3在多個方面表現出色,但它仍未解決長期困擾AI模型的“表情符號之謎”。這一難題,即便是對于這款新晉的“地球上最聰明AI”來說,也依然是個挑戰。


目前,Grok 3已成為AI基準測試平臺lmarena.ai上得分最高的模型,其1400分的成績遠超其他模型,如ChatGPT的1000多分。然而,面對用戶的實際應用反饋,xAI團隊仍需不斷努力,以進一步提升Grok 3的穩定性和精準度。未來,Grok 3能否真正打破AI的瓶頸,成為用戶心目中的“AI之王”,還需時間給出答案。











