對話曦望徐冰:從商湯走出,以推理芯片重構中國AI產業新未來

   時間:2026-01-28 18:53 來源:天脈網作者:柳晴雪

專注于推理GPU研發的曦望(Sunrise)近日正式發布新一代推理GPU芯片啟望S3,這是該公司在完成近30億元戰略融資后的首次重大亮相。此次發布標志著曦望在AI芯片領域邁出關鍵一步,也引發業界對國產推理芯片未來發展的廣泛關注。

曦望董事長徐冰在發布會上透露,公司前身是商湯科技的大芯片部門,自2020年獨立運營以來,已聚集了來自英偉達、AMD、昆侖芯等企業的三百余名芯片研發精英。團隊核心成員平均擁有15年行業經驗,這為曦望在AI芯片領域的技術突破奠定了堅實基礎。徐冰強調,曦望的研發理念源于真實業務場景的打磨,而非紙上談兵,這種實踐導向使公司更懂AI應用的實際需求。

公司兩位聯席CEO的組合被內部稱為"越湛越勇",形成了能力互補的黃金搭檔。負責研發的王勇曾是AMD昆侖芯核心架構師,在百度昆侖芯工作期間積累了20年芯片研發經驗,他主導了曦望兩代芯片的研發并實現一次性點亮成功。另一位聯席CEO王湛作為百度創始團隊成員和首任產品經理,成功打造了百度鳳巢系統,擁有豐富的產品化和商業化經驗。2025年初加入曦望后,他全面負責產品化和商業化工作,并推動組織文化建設。

在融資方面,曦望獲得了產業資本和財務投資者的雙重認可。投資方包括三一集團旗下華胥基金、杭州數據集團、IDG資本、高榕創投等機構,以及誠通混改基金等國資背景資本。商湯科技作為單一最大股東,繼續在技術和業務層面與曦望保持深度合作。發布會上,商湯董事長兼CEO徐立親自到場,宣布與曦望啟動百萬token推流合作。

徐冰指出,AI產業正從訓練主導轉向推理主導。根據德勤報告,到2026年推理算力占比將達66%,超越訓練需求。智能體物理AI的爆發將使推理從配角變為主力,多模態推理需求正在快速增長。當前推理成本已占AI應用總成本的70%,成為制約行業發展的關鍵因素。曦望選擇專注推理賽道,正是看準了這一結構性變革帶來的機遇。

與傳統訓推一體GPU不同,曦望從底層架構開始就為推理場景重新設計。公司摒棄了追求峰值TFLOPS的通用計算思路,轉而專注于提升真實業務場景中的token成本效益、能耗表現和服務穩定性。徐冰表示,英偉達等企業的產品在推理場景中算力利用率常低于10%,而曦望通過專用架構設計,可將這一指標提升至更高水平。

發布會上,曦望展示了S3芯片的性能數據,并公布了S4、S5的研發路線圖。徐冰透露,公司已累計投入20億元研發資金,成功量產S1和S2兩代產品。S3的推出標志著曦望進入規模化應用階段,其目標是將推理成本降低90%,推動行業向"百萬token一分錢"的新標準邁進。此前國內已有企業將推理價格降至百萬token一元水平,曦望計劃在此基礎上再壓低一個數量級。

除了芯片本身,曦望還推出了完整的解決方案。公司提供標準化的一體化服務器、整機和集群方案,幫助客戶快速部署推理基礎設施。在生態合作方面,曦望與商湯、范式等AI企業建立戰略合作,共同優化推理成本;與杭鋼數字科技、浙江算力科技等本地平臺合作,將推理基礎設施覆蓋至浙江并輻射全國;還與三一、協興等企業簽約,將推理技術嵌入制造、能源等具體場景。

徐冰強調,曦望的定位不僅是芯片供應商,更是推理基礎設施的構建者。公司通過芯片+系統+生態的布局,致力于解決AI企業的算力瓶頸問題。他比喻道,就像過去十年光纖和基站支撐了中國互聯網發展,未來十年高性價比的推理基礎設施將成為AI時代的根基。曦望的目標是持續降低推理成本,讓企業不再為算力"卡脖子"、電費發愁或受芯片限制,從而專注于構建未來的AI爆款應用。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號