在人工智能領域,一場圍繞“Token”的變革正悄然興起,成為行業關注的焦點。從英偉達創始人兼首席執行官黃仁勛在GTC大會上的演講,到阿里巴巴集團CEO吳泳銘宣布的組織調整,Token正從幕后走向臺前,成為推動AI發展的核心要素。
黃仁勛在演講中反復強調“Token即商品”這一全新定義,將Token的地位提升到了前所未有的高度。他指出,隨著生成式AI、推理AI以及能夠實際投入工作的AI(如Claude Code)的相繼出現,Token的使用量呈現出指數級增長。從ChatGPT開啟生成式AI時代,讓Token成為人與機器對話的語言;到ChatGPT o1等推理AI使模型開始“思考”,Token用途擴展至反思、規劃、問題拆解;再到Claude Code讓AI能夠讀取文件、編寫代碼、測試、迭代,Token已成為AI運行不可或缺的“血液”。
這一趨勢帶來了對計算能力的巨大需求。黃仁勛透露,去年英偉達與AI原生企業的合作呈爆炸式增長,AI初創企業獲得的風險投資高達1500億美元,而這些公司普遍都需要大量的計算能力來創建、構建或整合Token。市場對英偉達GPU的計算需求因此“爆表”,他相信過去幾年計算需求增長了100萬倍,并預測2025到2027年期間,這一需求增長將至少為英偉達帶來1萬億美元收入。
為了適應這一變革,黃仁勛提出了“數據中心即Token工廠”的顛覆性概念。他表示,傳統的文件數據中心正轉變為Token生產工廠,每瓦特電力的Token產出成為衡量效率的核心指標。在這個新工廠里,目標是在有限的能源和空間內,最大化Token的吞吐量。因為每個數據中心從定義上來說都是電力受限的,所以在給定功率下,每瓦吞吐量越高,就能產生越多的Token。未來,每一家CSP、計算機公司、云公司、AI公司乃至所有企業,都會關注其Token工廠的效率。黃仁勛展示的一張關鍵圖表,以Token吞吐量為縱軸、推理速度為橫軸,揭示了AI工廠未來發展的核心方向——吞吐量和Token生成速度將直接決定企業明年的收入。
英偉達在這一變革中占據了領先地位。黃仁勛宣布,英偉達的Token成本是全球最低的,無可匹敵。通過架構創新,在一個1吉瓦的工廠里,英偉達將把Token生成速度從200萬提高到7億,增長350倍。當天發布的Vera Rubin平臺是這一創新的集中體現,它包含7款芯片、5套機架級系統以及一臺面向代理式AI的超級計算機。與Blackwell平臺相比,Vera Rubin NVL72機架僅需四分之一數量的GPU即可訓練大型混合專家模型,每瓦特推理吞吐量最高可提升10倍,同時每Token成本僅為原平臺的十分之一。而Groq 3 LPX機架與Vera Rubin的聯合,更使每兆瓦的推理吞吐量提升高達35倍,為萬億參數模型帶來了多達10倍的營收機遇。
Token的變革不僅限于技術層面,還催生了全新的“Token經濟學”。黃仁勛提出,不同層級的AI服務對應不同的Token定價策略。高吞吐量低生成速度的方案可用于免費層級,而更大、更快、支持更長上下文的模型屬于中間層級,免費、每百萬Tokens收費3美元、每百萬Tokens收費6美元等階梯定價模式將逐步形成。隨著AI模型越來越智能,每一次點擊都可能推動價格上漲,未來甚至可能出現每百萬Tokens收費45美元甚至150美元的高級模式。黃仁勛描繪了一個Token驅動的未來:未來公司每一位工程師都需要年度Token預算,每一家軟件公司都將成為Token制造商,為員工、為客戶制造Token。
無獨有偶,阿里巴巴也在積極布局Token領域。阿里巴巴集團CEO吳泳銘宣布成立Alibaba Token Hub事業群,圍繞“Token的創造、輸送與應用”整合阿里內部多個AI相關業務板塊,標志著阿里AI戰略正式進入“Token驅動”階段。在吳泳銘看來,Token正成為阿里AI戰略的全新引擎。
從英偉達到阿里巴巴,Token正成為人工智能領域的新焦點。它不僅是技術的產物,更是新時代的語言與貨幣,正在重塑從數據中心到太空、從智能汽車到機器人的各個領域。圍繞Token的變革,正在開啟一個全新的AI時代。











