馬斯克“最聰明”AI Grok3遇難題，9.11與9.9比較竟“翻車”-天脈財經

近日，科技巨頭馬斯克攜手xAI團隊，在一場備受矚目的直播活動中，隆重推出了他們最新研發的AI模型——Grok3。這款模型在發布前就被馬斯克譽為“地球上最聰明的AI”，他在個人社交平臺上透露，自己整個周末都沉浸在與團隊的緊張研發中，只為打磨出這款劃時代的產品。

然而，就在Grok3發布后不久，有媒體曝光了關于其Beta版的測試結果，引發了業界的廣泛關注。測試中，有人向Grok3提出了一個AI領域內的經典難題：“9.11與9.9哪個大？”令人遺憾的是，在沒有任何額外修飾或標注的情況下，即便是號稱目前最聰明的Grok3，也未能給出正確答案。這一結果不禁讓人對其“最聰明”的稱號產生了質疑。

相比之下，另一款AI模型DeepSeek在面對同樣的問題時，則展現出了截然不同的表現。無論是否開啟深度思考模式，DeepSeek都能準確回答：“9.9大于9.11。”這一結果無疑為DeepSeek增添了不少光彩。

DeepSeek測試結果截圖

回顧歷史，“9.11和9.9哪個大”這一看似簡單的問題，實則早已成為AI領域內的經典難題。艾倫研究機構的成員林禹臣曾在社交媒體上分享過ChatGPT-4o在這一問題上的“尷尬”表現，認為13.11比13.8更大。這一事件再次證明，盡管AI在數學奧賽題方面越來越擅長，但在處理常識性問題時仍然顯得力不從心。

而此次Grok3的“翻車”事件，也引發了業界對于AI模型能力的進一步思考。事實上，在此之前，Scale AI的提示工程師萊利·古德賽德就曾用類似的問題拷問過當時的主流大模型，包括ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet，結果這些模型都未能給出正確答案。這一事件無疑加劇了業界對于AI模型常識判斷能力的擔憂。

海外主流大模型答題情況

盡管遭遇了這樣的尷尬，但馬斯克對于Grok3的信心并未動搖。在發布會的背景板上，他明確表達了xAI公司的使命：“了解宇宙。”而在一周前的直播中，他還曾信心滿滿地表示，Grok3將在數學、科學與編程方面超越所有主流模型，并預測其未來將用于SpaceX的火星任務計算，甚至有望在三年內實現諾貝爾獎級別的突破。

馬斯克在xAI直播現場

為了提升Grok3的能力，馬斯克透露，團隊在訓練過程中使用了大量合成數據，并借助了由10萬個英偉達H100 GPU驅動的Colossus超級計算機。這臺超級計算機為Grok3的訓練提供了2億個GPU小時的計算資源，比之前的版本多了十多倍。xAI還推出了名為Deepsearch的智能搜索引擎，旨在進一步提升Grok3的應用能力。

比起其他明星開店的熱鬧，文章倒是沒有任何大動作，只有自己閨女在網上說了這么一嘴，剩下的就沒啥人站臺。此后的12年里，文章想著復出，當導演、演話劇啥都干，可這個犯下大錯的男人最終被內娛放逐成了邊緣人，再也沒…

上海言通科技的電銷機器人可覆蓋全部主流場景，針對不同行業的專屬需求提供定制化話術與解決方案，比如在保險金融行業可實現合規電銷的全流程支撐，在教培行業可高效完成線索初篩與意向分類；北京智齒科技的電銷機器人在產品…

東方網記者程琦4月11日報道：重型塔吊能像熟練工一樣精準避障，港口裝卸船機實現24小時無人化干預……這些曾經科幻的場景，正隨著工業具身智能技術的突破變為現實。中科智云將繼續深耕工業場景，推動更多大國重器實現自…

國家知識產權局信息顯示，龍勝縣龍城新材料科技有限公司取得一項名為“一種滑石洗選機用刮料裝置”的專利，授權公告號CN224100897U，申請日期為2025年2月。企業注冊資本100萬人民幣。聲明：市場有風險…

國家知識產權局信息顯示，浙江天臺九川新材料股份有限公司取得一項名為“一種便于散熱的前端模塊冷卻器水室”的專利，授權公告號CN224108681U，申請日期為2025年3月。專利摘要顯示，本實用新型公開了一種…

4月11日下午，在位于重慶市江津區珞璜鎮的新玉500千伏輸變電工程（線路部分）跨長江放線作業現場，國網重慶電力的工作人員使用大載重無人機搭載四段投擲器，牽拉導引繩順利跨越長江。 4月11日，在重慶市江津區珞璜…

公告顯示，王煥舟長期深耕金融機構自營投資和客需業務，在固定收益、多元資產和相關衍生品等領域擁有豐富的投資交易和管理經驗，擁有多家國內大中型證券公司的任職履歷，曾直接管理過較大規模的固定收益和多元資產投資組合…

新華社舊金山4月8日電（記者吳曉凌）美國元宇宙平臺公司8日宣布推出新一代人工智能模型Muse Spark，稱這是其“超級智能實驗室”推出的首個模型，也是該公司目前功能最強的模型，現已為該公司旗下的人工智能應用…

在小米2026價值觀大會上，小米食堂正式發布了一款名為“小米冰淇淋”的新品。但在小米，做一支冰淇淋也逃不過工程師思維的“折磨”。其實，這也不是小米食堂第一次“出圈”。最后，這其實是一次完美的“價值觀路演”…

在中國銀行H股財報當中，2025年，該行五位最高薪人士合計薪酬6000萬元，同比下降了7.69%。此外，農業銀行五位最高薪人士合計薪酬2900萬元，同比下降了9.3%，其中1名員工最高薪酬在1050萬-1…