"百萬卡算力時代:多DC分布式訓練如何驅動DCI需求飆升?"

   時間:2024-10-09 09:28 來源:天脈網作者:沈如風

近期,國聯證券發布了一份深度研究報告《百萬卡算力之路:多DC分布式訓練與DCI需求增長》,該報告深入剖析了當前AI大模型訓練中多數據中心(DC)分布式訓練技術的崛起趨勢,并展望了數據中心互聯(DCI)技術的市場需求增長前景。

報告指出,隨著AI模型規模的不斷擴大,meta、Google等海外科技巨頭已率先布局多DC分布式訓練,其中Google的Gemini 1 Ultra項目便是典型案例。同時,OpenAI與微軟也計劃進一步擴大其分布式訓練規模,以應對日益增長的計算需求。這一趨勢不僅推動了AI技術的邊界拓展,也對DCI技術提出了更高要求。

面對AI訓練進入十萬卡時代的新挑戰,跨DC協同訓練成為了必須克服的難題。AI訓練對網絡性能極為敏感,尤其是對數據丟包的容忍度極低。此外,大象流現象使得傳統負載分擔方法失效,萬卡集群中的流量瞬時并發量巨大,對DCI網絡構成了嚴峻考驗。報告強調,當前十公里跨機樓并行訓練的算效損失尚可控,但未來要實現百公里、千公里級跨地域并行訓練,必須采用更先進的技術手段,并加強長距離超寬DCI網絡的建設。

DCI網絡示意圖

在DCI互聯方案方面,報告指出,通過高階調制或DWDM技術可以實現更大的帶寬。其中,400G ZR相干光學技術因其簡潔性和高效性,有望在未來取代傳統WDM系統。不同DCI場景需要選擇適合的產品,如在園區內部優先采用光纜+LR光模塊,而在跨園區場景中則更傾向于DWDM+ZR光模塊。

報告還預測了DCI市場的廣闊前景。據估計,從2024年至2028年,400G LR、400G ZR等多種光模塊的出貨量和市場規模將持續增長,其中400G ZR產品的價值量尤為顯著。這一趨勢不僅反映了DCI技術的快速發展,也預示著AI大模型訓練對高性能DCI網絡需求的持續增長。

綜上所述,《百萬卡算力之路:多DC分布式訓練與DCI需求增長》報告為我們揭示了AI大模型訓練中多DC分布式訓練技術的崛起及其對DCI技術的新要求。隨著技術的不斷進步和市場的持續拓展,DCI網絡將在AI訓練中發揮越來越重要的作用。

---**摘要**:國聯證券報告指出,AI大模型訓練推動多DC分布式訓練興起,DCI需求激增,400G ZR等技術有望引領DCI市場增長。**關鍵詞**:#AI大模型訓練##多DC分布式訓練##DCI需求增長#
 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號