曦望徐冰:專注推理場景,以“芯片+系統+生態”布局引領AI新征程

   時間:2026-01-29 21:57 來源:天脈網作者:趙云飛

在近日舉辦的曦望首屆Sunrise GPU Summit上,一款專為AI推理場景設計的新一代GPU芯片——啟望S3正式登場。與此同時,曦望科技還對外公布了圍繞推理場景打造的算力產品體系,以及共建推理云生態的宏偉計劃。這一系列動作標志著,AI產業正加速從“訓練驅動”向“推理驅動”轉型,而曦望科技正試圖在這場變革中占據核心地位。

曦望科技董事長徐冰在現場演講中指出,隨著大模型技術的日益成熟,AI的應用場景正迅速擴展,推理需求隨之激增。據德勤最新報告預測,到2026年,推理算力在整體AI算力中的占比將達到66%,超越訓練算力成為主流。這一結構性變化,不僅要求算力提供商具備更強的長期交付能力和系統穩定性,還對其成本控制提出了更高要求。

徐冰強調,曦望科技并非一家單純的芯片銷售商,而是致力于構建“芯片+系統+生態”的全方位布局。通過整合芯片設計、系統優化和生態合作,曦望科技希望將推理算力打造成為可規模化、可持續的基礎設施,為AI產業的快速發展提供堅實支撐。

曦望科技的前身是商湯科技的大芯片部門,自2020年獨立運營以來,便深耕AI推理領域。憑借與商湯科技及國內早期AI應用項目的緊密合作,曦望科技積累了豐富的實戰經驗,從人臉識別到自動駕駛,再到如今的大模型和多模態AI,完整經歷了AI技術的各個發展階段。這種獨特的背景,使得曦望科技能夠更精準地把握市場需求,設計出更符合實際應用場景的芯片產品。

面對2025年全球大模型token消耗量激增100倍的挑戰,曦望科技團隊夜以繼日地投入研發,終于將打磨多年的技術和產品推向市場。這支由來自英偉達、AMD、昆侖芯、商湯等頂尖企業精英組成的團隊,平均擁有15年行業經驗,是曦望科技最寶貴的財富。

在商業模式上,曦望科技采取了差異化的策略。不同于傳統芯片廠商,曦望科技不僅提供推理GPU卡、一體化服務器等硬件產品,還致力于成為現有算力系統的推理分流和成本優化層。通過與商湯、范式等AI巨頭及各類算力廠商的深度合作,曦望科技希望構建一個開放、共贏的推理云生態。

徐冰透露,曦望科技已累計投入20億元用于研發,成功量產了S1和S2兩款芯片。其中,S1和S2的成功不僅證明了曦望科技的技術實力和市場認可度,更為其后續產品的研發奠定了堅實基礎。此次發布的啟望S3,以及未來S4和S5的規劃路徑,展示了曦望科技在推理芯片領域的持續創新能力和遠見卓識。

徐冰表示,曦望科技的目標是將推理成本降低90%,同時提供穩定可靠的服務。這一目標若得以實現,將極大地推動AI技術的普及和應用,助力全行業實現盈利增收。為此,曦望科技正與整個產業攜手共進,努力將中國的推理成本拉低至“百萬token一分錢”的新水平。

在徐冰看來,推理時代的到來,為算力提供商帶來了前所未有的機遇。曦望科技正致力于成為那個讓算力變得便宜、穩定、到處可用的核心底座。這個底座一頭連接著芯片架構、制造工藝和能耗模型等底層技術,另一頭則與國家對AI基礎設施和能源效率的長期規劃緊密相連。中間部分,則是云廠商、算力中心、AI公司以及千行百業的廣泛合作,共同推動AI技術的快速發展和應用。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號