GPT5.5深夜突襲發布,OpenAI憑實力打響翻身漂亮仗

   時間:2026-04-27 00:29 來源:快訊作者:虎嗅APP

4月24日深夜,OpenAI在未提前預告的情況下突然發布GPT5.5,這款主打"實際工作與智能體任務"的新型模型迅速引發行業震動。與前代產品飽受爭議的更新不同,此次升級在多個專業領域展現出顯著優勢,甚至被部分開發者稱為"AI工作方式的革命性轉變"。

根據第三方測評機構數據,GPT5.5在20小時長周期軟件工程測試中取得73.1%的成功率,較GPT5.4提升4.6個百分點。在復雜命令行工作流測試Terminal-Bench2.0中,其82.7%的得分大幅領先Claude Opus 4.7的69.4%。更引人注目的是,該模型在網絡安全領域表現突出,CyberGym測試得分81.8%,CTF奪旗挑戰得分88.1%,均創下同類模型新高。

OpenAI特別強調,這次升級的核心突破在于賦予模型"自主執行能力"。與傳統AI工具僅提供輔助建議不同,GPT5.5能夠理解復雜目標、拆解任務步驟、調用外部工具并自我修正。公司財務團隊的實際應用案例顯示,該模型已完成24771份、總計7萬余頁的稅表審核工作,效率較人工處理提升數倍。

技術層面,GPT5.5在保持智能水平提升的同時,將服務響應速度維持在GPT5.4水平。更令人驚喜的是,其Token消耗量降至前代的1/36,這意味著盡管API價格上調至每百萬Token 5美元(Pro版30美元),但實際使用成本因效率提升而變化不大。OpenAI總裁格雷格·布羅克曼表示:"我們致力于讓前沿AI技術同時服務于企業和個人用戶。"

盡管表現亮眼,GPT5.5仍存在明顯局限。多個評測指出,該模型對任務描述的依賴性增強,當用戶需求表述模糊時,模型傾向于按現有信息執行而非主動補全。這種"嚴格服從"特性在需要精確控制的場景中是優勢,但在創意類任務中可能成為短板。

行業格局因這次更新發生微妙變化。長期與OpenAI競爭的Anthropic近期陷入多重危機:安全丑聞、付費用戶限流、大規模封號等問題持續發酵,疊加不斷上漲的Token費用,導致用戶流失嚴重。反觀OpenAI,憑借充足的算力儲備和持續的技術突破,正在拉開與競爭對手的差距。

目前,GPT5.5已向ChatGPT和Codex的Plus、Business、Enterprise用戶開放,API服務預計隨后推出。OpenAI內部數據顯示,超過85%的員工已跨部門使用搭載新模型的Codex工具。這場深夜發布的"技術突襲",不僅重塑了AI行業的競爭態勢,更預示著智能體技術從實驗室走向實際應用的關鍵轉折。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號