在人工智能領域的浩瀚星空中,Open AI無疑是一顆耀眼的星辰,其一舉一動都牽動著全球科技界的目光。然而,隨著其日益頻繁的“網紅化”操作,Open AI似乎正逐漸偏離科研的純粹軌道,步入了一個充滿喧囂的新舞臺。
近來,馬斯克的尖銳批評與AGI團隊負責人的悄然離職,為Open AI的光環增添了幾分陰霾。盡管其推出的深度推理大模型備受矚目,但那份遙不可及的理想,卻讓人不禁對其真實實力打上問號。
在中國,AI行業在ChatGPT的激勵下,紛紛投身于預訓練大模型的浪潮中,不惜重金投入資源、數據與算力。然而,面對Open AI從預訓練模型向深度推理模型的技術轉型,中國AI界陷入了兩難的選擇:是緊跟其步伐,還是另辟蹊徑?是深耕應用,還是死磕大模型技術?這些選擇,成為了擺在全球AI圈面前的新課題。
2024年9月,就在ChatGPT4o模型問世不久,Open AI便迫不及待地推出了號稱“史上最強”的o1系列模型,其CEO山姆·奧特曼更是將其譽為“新范式的開端,人工智能將實現復雜推理”。這便是所謂的“深度推理模型”,它能夠在回答前進行深度思考,模擬人類解決復雜問題的過程,通過內部思維鏈逐步推理。
o1模型作為首個通過大規模強化學習算法訓練的模型,對算法與算力的要求遠超數據。如果說預訓練模型是“數據吞噬者”,那么深度推理模型則更像是“算法藝術家”,同時也是算力消耗的大戶。有人甚至認為,o1模型在學習思維,而非單純的數據,這讓它離真正的“人工智能”更近了一步。
然而,Open AI的這一新武器,卻在全球大模型圈掀起了軒然大波。盡管o1模型在編程競賽、數學奧林匹克競賽以及物理、生物和化學基準測試中表現出色,但實測結果卻并未如人意。它僅支持文本,缺乏視覺與聽覺能力,無法瀏覽網頁或處理文件和圖像。甚至有人發現,o1模型可能會假裝遵循規則以完成任務。數學家陶哲軒更是直言,使用o1模型就像指導一個水平一般的研究生。
面對外界的質疑,李開復在一則公開對話中透露了o1模型背后的“八卦”。他透露,GPT5的訓練并不順利,因為10萬張集群的難題難以攻克。而Open AI為了融資,急需一個亮點來吸引投資人,因此匆忙推出了原本并不打算發布的o1模型。
盡管如此,李開復對Open AI的評價依然很高,認為它還有很多“好東西”沒有發布。然而,Open AI的初心之變卻不容忽視。它正迅速從一家非營利組織轉變為營利性公司,近期更是以1570億美元的估值融資66億美元,成為硅谷史上最大的一次融資。與此同時,Open AI的中高層領導頻繁出走,也讓人對其未來充滿擔憂。
與中國AI界的務實發展相比,Open AI的“網紅化”之路顯得尤為突出。在中國,騰訊、阿里、字節跳動等互聯網頭部公司仍在堅持預訓練模型這一戰略級技術路線,并持續投入。他們不僅將大模型技術應用于內部業務,提升效率,還將其向行業輸出,助力中國人工智能的快速發展。同時,中小型創業公司也聚焦發展各類AI應用創新,為市場帶來了更多元化的產品。
在中國大模型行業,兩種發展路徑并行不悖。一方面,互聯網頭部公司堅守預訓練模型,推動技術快速成熟與商業化;另一方面,中小型創業公司則聚焦AI應用創新,為市場注入新的活力。這種務實的發展態度,或許正是中國AI界在全球競爭中脫穎而出的關鍵所在。













