華為張迪煊:昇騰算力賦能,攜手伙伴共赴AI“能辦事”的Agent新時代

   時間:2026-03-23 03:02 來源:快訊作者:吳婷

在華為中國合作伙伴大會期間,以“與時代 共昇騰”為主題的昇騰人工智能伙伴峰會在深圳成功舉辦。華為昇騰計算業務總裁張迪煊在會上發表了題為《一起昇騰,共贏行業智能化》的演講,深入探討了AI技術演進趨勢與行業智能化落地的實踐路徑。

張迪煊指出,2025年是昇騰技術沉淀與開源生態建設的關鍵一年。自去年8月宣布CANN和Mind系列軟件全面開源以來,昇騰已向第三方社區貢獻超過11萬行代碼,并與50多個主流開源項目實現兼容。通過技術解耦與架構創新,昇騰聯合科大訊飛開發的大EP技術成功填補多機推理加速領域的空白,相關特性已納入vLLM社區,顯著提升了開發者創新效率。在模型適配方面,智譜基于昇騰架構三個月內完成多模態大模型GLM-Image訓練,該模型采用自回歸與擴散混合架構,開源后迅速登頂Hugging Face趨勢榜首位。

面對行業智能化需求,昇騰構建了覆蓋大、中、小算力場景的系列化解決方案。針對大模型預訓練與強化學習場景,昇騰384超節點通過48TB統一內存編址技術,實現內存共享效率提升96倍,數據交互效率提高三倍,特別適用于AI Agent等需要低時延、高吞吐的場景。中算力場景聚焦醫療輔助、智慧教學等領域,通過中心模組與刀片服務器組合,伙伴已開發400余款一體機產品,服務2700余家客戶,占據國內市場80%份額。小算力場景則面向工業質檢、具身智能等邊緣計算需求,通過標準模組與板卡開放,助力伙伴打造多樣化終端設備。

在推理服務優化方面,昇騰推出超節點+大EP組合方案,提供三種技術路徑:支持MindIE成熟方案快速部署、通過插件集成vLLM/SGLang開源引擎、基于CANN深度定制開發。硅基流動等伙伴已據此構建金融領域推理引擎,使手機銀行等場景的多輪響應速度提升三倍。針對強化學習后訓練場景,昇騰首創異步流式數據引擎TQ技術,通過控制流與數據流解耦,將端到端性能提升40%,相關特性已應用于商業化廣告與信貸風控領域。

硬件升級方面,昇騰推出分級產品矩陣:A2標卡支持百億級模型實現100ms推理時延,單機服務器算力達業界2.3倍,雙機超節點可部署萬億級模型并突破20ms低時延。面向推薦、多模態等場景的Atlas 350加速卡,通過mxFP4低精格式與112GB片上內存,使多模態生成性能提升60%,訪存效率提高四倍。在行業應用層面,昇騰聯合20余家ISV開發金融、能源等領域解決方案,半年內落地十余個場景方案,服務180余家客戶。例如在智慧文旅領域,與海天瑞聲、陜文投合作的多模態AI伴游助手“小七”,已在陜西景區為400萬游客提供個性化服務。

生態建設層面,昇騰CANN實現三大升級:將原有8個組件拆分為29個可獨立升級模塊,部署效率提升80%;開源PyPTO編程范式,使SoftMax算子代碼量減少70%;今年6月將開放2000卡算力資源供開發者使用。為激勵生態創新,昇騰設立2000萬元首批創新基金,并升級NRE計劃投入5000萬元支持伙伴開發,優秀成果將通過AI應用市場與伙伴共享收益。目前已有20余家伙伴啟動Agent一體機研發,產品將覆蓋教育、醫療等核心領域。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號