科技巨頭馬斯克的人工智能公司xAI近日宣布,其最新研發的人工智能大模型Grok 3已正式發布。馬斯克自豪地宣稱,這款模型是“地球上最聰明的人工智能”。
據悉,Grok 3是基于20萬塊英偉達芯片的強大算力訓練而成,其運算能力相較于上一代提升了整整10倍。在xAI的直播演示中,馬斯克與三位工程師共同見證了Grok 3在數學、科學和編程基準測試中的卓越表現。測試中,Grok 3成功擊敗了包括谷歌Gemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4在內的多個競爭對手。
馬斯克透露,Grok 3的訓練過程使用了大量的合成數據,并通過反復檢查數據以確保邏輯一致性。在發現錯誤數據時,Grok 3能夠自我反思并刪除這些數據。在AIME'24數學能力測試、GPQA科學知識評估以及LCB Oct - Feb編程能力測試等多項測試中,Grok 3均取得了高于DeepSeek的成績。Grok 3擁有1萬億級別的參數量和“思維鏈”推理機制,能夠像人類一樣逐步拆解復雜任務。
盡管Grok 3在多項測試中表現出色,但其在數學和編程方面的優勢并未與DeepSeek拉開明顯差距。而DeepSeek在中文理解和多模態交互方面一直表現穩定,并在實際應用場景中得到了廣泛驗證。Grok 3的成本極高,其訓練量是前代Grok 2的10倍,訓練成本據傳高達30億美元。xAI旗下的超算中心算力已經翻倍,以支持Grok 3的運行。
為了盡快推出Grok 3,馬斯克決定自建數據中心。在短短四個月內,團隊成功構建了第一批擁有10萬個GPU的數據中心。隨后,他們僅用92天就將超算集群的算力翻倍,達到了20萬塊GPU的規模。以英偉達H100為例,20萬塊GPU的硬件采購成本就高達60億美元,這還不包括配套服務器、網絡設備、電力和冷卻設施等額外成本。
相比之下,DeepSeek的訓練成本僅為600萬美元,遠低于GPT-4的7800萬美元。DeepSeek憑借創新的工程設計與高效的訓練方法,在實現與OpenAI模型同等性能的同時,僅需要對方5%的算力。這一低成本模式直接顛覆了美國科技巨頭在AI領域的主導地位,為其他國家自主發展AI提供了希望。












