Grok 3遭遇尷尬!答不出9.11與9.9大小,馬斯克承諾每日快速改進

   時間:2025-02-19 16:06 來源:天脈網作者:陸辰風

近期,科技界迎來了一場轟動性事件,特斯拉創始人埃隆·馬斯克攜其xAI團隊,在一場備受矚目的直播活動中,正式揭曉了備受期待的人工智能系統——Grok 3。此前,馬斯克通過一系列預熱活動,已經將公眾對Grok 3的期待推向了巔峰。

在發布會上,馬斯克自信滿滿地宣布,Grok 3在數學、科學與編程等領域的基準測試中,已經超越了所有主流的人工智能模型。他甚至透露,計劃將這一系統應用于SpaceX的火星任務計算,并預測在未來三年內,Grok 3有望實現諾貝爾獎級別的科學突破。

然而,發布會后不久,一些媒體就對Grok 3的Beta版進行了測試,并提出了一個經典難題:“9.11與9.9哪個大?”這一看似簡單的問題,卻意外地讓號稱“地球上最聰明的人工智能”Grok 3栽了跟頭。它未能給出正確答案,這一失誤迅速在網絡上引發了熱議,網友們戲稱Grok 3為“不屑回答簡單問題的天才”。

據相關媒體報道,針對這一問題,記者對12個大模型進行了測試。結果顯示,阿里通義千問、百度文心一言、Minimax和騰訊元寶等模型給出了正確答案,而ChatGPT-4o、字節豆包、月之暗面kimi等多個知名模型則回答錯誤,且錯誤方式各不相同。值得注意的是,即便是在限定了數學語境的情況下,一些大模型如ChatGPT仍然未能給出正確答案。這一結果表明,大模型在數學能力上的欠缺仍然是一個亟待解決的問題。

業內人士指出,生成式語言模型在設計上更偏向于文科思維,而非理科邏輯。不過,通過針對性的語料訓練,未來或許能夠逐步提升這些模型的理科能力。然而,Grok 3在發布會上的另一場“翻車”事件,卻讓人對其能力產生了更大的質疑。

在xAI發布會直播過程中,當Grok 3被用來分析游戲《流放之路 2》的職業與升華效果時,它給出了大量錯誤答案。令人驚訝的是,即便是這些明顯的錯誤,馬斯克也未能及時發現。這一事件進一步加劇了公眾對Grok 3能力的質疑。

面對這些質疑和錯誤,馬斯克在社交媒體上表示,Grok 3的版本將每天進行快速改進,并邀請用戶反饋使用過程中遇到的問題。這一表態顯示出了馬斯克對Grok 3的信心和決心,但能否真正解決這些問題,還有待時間的檢驗。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號