時事快聞

亞馬遜云科技：如何以加速計算推動生成式AI領域創新？

時間：2024-12-17 08:16 來源：天脈網作者：趙云飛

在近日舉行的Amazon Web Services re:Invent 2024大會上，亞馬遜云科技展示了其在加速計算和生成式人工智能領域的最新進展。此次大會聚焦于如何利用亞馬遜云科技的基礎設施，構建和擴展大規模生成式AI模型，并探索了其在不同行業中的應用案例。

亞馬遜云科技介紹了其加速計算產品組合的最新動態，包括基于GPU和亞馬遜云科技AI芯片的實例。這些實例為客戶提供了高效、低成本的解決方案，以支持從大型語言模型到多模態語言模型的訓練和推理任務。會上，多個領先企業分享了如何利用亞馬遜云科技在生成式AI領域取得突破性成果的真實案例。

在醫療保健領域，Amgen等公司利用基于Transformer的模型設計蛋白質，加速了藥物發現過程。這些模型能夠學習蛋白質的生物學語言，生成新藥物和療法的候選者。大型語言模型(LLM)也被用于簡化電子病歷的文檔編制和處理，減輕了醫療保健系統的行政負擔。

在工業和汽車領域，生成式AI被集成到機器人技術中，提高了機器人的安全性和效率。法拉利等公司利用生成式AI設計汽車，通過3D渲染讓客戶在車輛生產前進行可視化，從而重塑了客戶體驗。在金融服務行業，一些公司對年報和財務報表進行LLM微調，使數據更易于投資者獲取。亞馬遜推出的GPT基礎網站助手Rufus，則通過訓練產品目錄和客戶評論，為客戶提供個性化的購物建議。

在媒體和娛樂行業，Adobe等公司正在創建多模態模型，使用戶能夠通過簡單的文字輸入創建電影體驗。這一創新從根本上改變了創作過程，創作者可以與智能模型對話，快速創建、迭代和完善圖像和視頻內容。

亞馬遜云科技觀察到，LLM訓練規模持續增長，最大訓練任務已使用超過10,000個GPU進行同步分布式工作負載。同時，全球范圍內的LLM推理需求也顯著增加，即使是偏遠地區的用戶也能實時與行業最強大的模型互動。2024年預計將是多模態LLM的崛起之年，這些模型能夠處理視聽信息，對計算基礎設施提出了更高要求。

為了滿足這些需求，亞馬遜云科技提供了全面的加速計算實例組合，包括NVIDIA GPU驅動的G系列和P系列實例，以及定制的AI加速器如Inferentia和Trainium。其中，新推出的Trainium 2芯片驅動的Trn2實例，每個加速器配備96GB內存，支持高達1.5TB的聚合高帶寬內存，專為大型模型訓練設計。

在網絡方面，亞馬遜云科技設計了SRD協議，支持大規模分布式工作負載的高效、可靠和安全傳輸。新推出的P5bn實例進一步優化了EFA網絡，提高了分布式訓練的性能。亞馬遜云科技還提供了豐富的存儲選項，包括本地實例存儲、EBS和S3等，以滿足客戶在不同工作負載中的需求。

亞馬遜云科技還強調了安全性在生成式AI中的重要性。通過Nitro System等安全功能，確保計算環境的安全性。Nitro TPM能夠測量和驗證部署代碼的完整性，為客戶提供更大的信任保證。亞馬遜云科技還提供了諸如VPC加密等服務，確保數據在傳輸和存儲過程中的安全性。

在生成式AI技術棧方面，亞馬遜云科技提供了SageMaker等托管服務，幫助客戶高效地準備數據、訓練模型和部署模型。SageMaker Studio等工具提供了可擴展的數據清理和錯誤檢測功能，簡化了模型開發過程。Bedrock等服務簡化了對預訓練語言模型的微調和部署過程，使客戶能夠快速啟動并運行生成式AI應用。

meta的Kirimani分享了其團隊如何利用亞馬遜云科技構建多模態LLM的經驗。他們通過快速原型設計和實驗選擇了合適的架構，并在亞馬遜云科技的計算基礎設施上進行了大規模訓練。這一過程中，他們克服了文件系統故障、節點故障等挑戰，成功將模型擴展到數十億參數規模。亞馬遜云科技的計算能力、可靠性和可擴展性對meta實現其智能眼鏡的愿景至關重要。