GPT-5.5 Instant上線:更懂你更智能,奧特曼邀馬斯克共赴AI派對

   時間:2026-05-06 09:20 來源:快訊作者:孫雅

OpenAI 宣布正式推出 GPT-5.5 Instant,這款全新模型將取代此前的 GPT-5.3 Instant,成為 ChatGPT 的默認版本,并向所有用戶開放使用。作為 Instant 系列的主力產品,該模型每天服務數億用戶,官方表示,即便在如此龐大的用戶基數下,即使是微小的改進也能帶來顯著效果。此次升級聚焦三大核心目標:提升準確性、優化回復風格、增強個性化能力。

在高風險領域,新模型的準確性提升尤為突出。內部測試數據顯示,GPT-5.5 Instant 在醫療、法律和金融類問題上的“幻覺率”較上一版本下降了 52.5%,用戶標記過的錯誤對話的錯誤率也減少了 37.3%。圖片分析、理科問題解答質量以及主動調用搜索工具的判斷能力均有所改善。數學和科學能力的提升尤為顯著:在 AIME 2025 競賽數學測試中,GPT-5.5 Instant 得分 81.2,而 GPT-5.3 Instant 僅為 65.4;博士級科學測試 GPQA 的得分從 78.5 升至 85.6,多模態推理基準 MMMU-Pro 的得分從 69.2 升至 76,科學圖表理解 CharXiv 從 75 升至 81.6,文檔解析錯誤率則從 14.6% 降至 12.5%。

OpenAI 通過一道代數題展示了兩個版本的差異。用戶提交了一道根式方程的解題過程并詢問是否正確,GPT-5.3 Instant 發現 x=3 代入原方程不成立后,直接判定“無實數解”,未進一步追查;而 GPT-5.5 Instant 同樣發現 x=3 無效,但隨后定位到用戶展開 (x-1)2 時的具體錯誤,并給出了正確解答。

回復風格的優化是此次更新的另一重點。新模型更注重簡潔性,減少了格式堆砌和表情符號的使用,同時降低了不必要的追問。例如,當用戶詢問如何委婉地讓話多的同事少說話時,GPT-5.3 Instant 提供了五種分類策略,并附上“不該做什么”清單,結構完整但略顯冗長;而 GPT-5.5 Instant 的回復字數減少了 30.2%,行數減少了 29.2%,語氣更像朋友給出的建議,重點放在如何將問題引導至自己的專注需求上,而非直接批評對方的說話習慣。

個性化能力是此次升級的另一大亮點。Plus 和 Pro 用戶可以授權模型調取歷史對話、上傳文件以及關聯的 Gmail 內容,從而獲得更貼合個人情況的回答,無需每次重新解釋背景。例如,當用戶詢問茶館推薦時,GPT-5.3 Instant 僅根據用戶所在城市舊金山推薦了幾家熱門茶館;而 GPT-5.5 Instant 則從歷史對話中提取用戶常去 Asha Tea House、偏好高山茶而非重糖奶茶的記錄,推薦了風格更匹配的 Ceré Tea 和 Song Tea & Ceramics,并詳細說明了推薦理由。

GPT-5.3 Instant 將保留三個月供付費用戶使用,之后正式下線。個性化功能目前向 Plus 和 Pro 用戶的網頁端開放,移動端及免費、Go、企業等版本的推送計劃將在未來幾周內陸續跟進,具體功能因地區而異。對開發者而言,GPT-5.5 Instant 已通過 API 以“chat-latest”名稱提供。

值得一提的是,OpenAI 創始人奧特曼在 Stripe Sessions 的一場對談中透露,他在籌備 GPT-5.5 上線派對時,曾詢問模型希望舉辦什么樣的派對。模型認真給出了一份清單:希望派對定在美國當地時間 5 月 5 日,演講環節越短越好,要有人類創造者上臺致祝酒詞,但自己不想上臺祝酒。它還提議現場設一個專門收集 GPT-5.6 建議的環節,并將這些建議反饋給自己。奧特曼認為這些要求“很美好”,最終將派對時間定在下午 5 點 55 分,地點選在 OpenAI 舊金山總部,非本地嘉賓的機票和酒店由 OpenAI 負責。受邀名單由 Codex 從推文回復中篩選,報名鏈接于 4 月 30 日下午 5 點 55 分關閉,24 小時內有超過 8000 人報名,已有用戶曬出了收到的邀請郵件。未被選上的人也收到了一封郵件,OpenAI 將他們的 Codex 調用額度提升了 10 倍。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號