MIT全新光子芯片:開啟超高速AI計算新時代!

   時間:2024-12-08 08:21 來源:天脈網作者:陸辰風

近日,深度神經網絡模型的快速發展給傳統電子計算硬件帶來了前所未有的挑戰。隨著模型規模和復雜性的不斷攀升,電子計算設備在處理高強度機器學習應用時顯得力不從心。

相比之下,光子硬件以其高速和低能耗的特點,在機器學習計算領域展現出了巨大潛力。然而,由于部分神經網絡計算難以通過光子設備獨立完成,當前仍需依賴芯片外的電子元件或其他輔助手段,這在一定程度上限制了光子硬件的速度和能效。

經過科研人員十多年的不懈努力,這一難題終于迎來了突破。來自麻省理工學院(MIT)等機構的科學家成功研發出一款全新的光子芯片,該芯片是一款完全集成的光子處理器,能夠在芯片上通過光學方式完成深度神經網絡的所有核心計算任務。

這款光學設備在執行機器學習分類任務時,表現出了卓越的性能。它不僅用時不到半納秒,而且準確率超過了92%,這一表現足以與傳統硬件相媲美。該芯片由多個互聯模塊構成,形成了一個功能強大的光學神經網絡,并通過商業代工制造,為技術的規模化應用和電子設備的整合提供了有力支持。

該光子處理器的研發,對于推動激光雷達、天文與粒子物理領域的科學研究,以及滿足高速通信等高計算需求的應用具有重要意義。它有望為這些領域帶來更快速、更高效的深度學習能力,從而推動相關技術的進一步發展。

研究的主導者Saumil Bandyopadhyay表示:“在許多應用場景中,計算速度同樣重要?,F在,我們擁有了一個端到端的系統,能夠以納秒級的時間運行神經網絡光學計算,這為我們在更高層次上思考應用和算法提供了全新的可能性?!?/p>

深度神經網絡由多個相互連接的神經元層組成,這些神經元層通過操作輸入數據來生成輸出。在深度神經網絡中,矩陣乘法是至關重要的操作之一,它利用線性代數原理,使數據在層與層之間傳遞時完成轉換。然而,除了線性操作外,深度神經網絡還需要執行非線性操作,如激活函數,這些操作使模型能夠學習更復雜的模式,從而具備解決復雜問題的能力。

早在2017年,MIT的Englund教授研究團隊就聯合物理學教授Marin Solja?i?的實驗室,展示了一種基于單片光子芯片的光學神經網絡,該網絡能夠利用光完成矩陣乘法。然而,當時這款設備無法在芯片上完成非線性操作,需要將光學數據轉換為電信號,再發送到數字處理器進行非線性運算。

“光學中的非線性非常具有挑戰性,因為光子之間很難相互作用。觸發光學非線性需要消耗大量能量,因此構建一個能夠以可擴展方式執行非線性操作的系統十分困難?!毖芯繄F隊的主要成員Bandyopadhyay解釋道。

為了克服這一難題,研究團隊開發出了名為非線性光學功能單元(NOFU)的設備。NOFU結合了電子和光學技術,成功實現了在芯片上的非線性操作。隨后,他們在光子芯片上構建了一個光學深度神經網絡,通過三層設備將線性和非線性操作相結合,從而大幅提升了網絡的性能。

研究團隊開發的系統從一開始就將深度神經網絡的參數編碼到光信號中,然后通過一組可編程的光束分離器對輸入數據進行矩陣乘法操作。接下來,數據會傳遞到NOFU,通過將少量光信號引導至光電二極管,將光信號轉化為電流,從而實現非線性運算。這種方法無需外部放大器,能耗極低。

“整個計算過程中,操作始終保持在光學域中,直到最后一步讀取結果。這使我們能夠實現極低的延遲?!盉andyopadhyay表示。超低延遲的實現讓團隊能夠高效地在芯片上訓練深度神經網絡,這種“原位訓練”過程在傳統數字硬件上通常會消耗大量能量。

“這一技術尤其適用于需要直接處理光信號的系統,如導航或通信系統,也適用于需要實時學習的設備?!盉andyopadhyay補充道。在訓練測試中,這一光子系統的準確率超過96%,推理階段的準確率也達到了92%以上,與傳統硬件表現相當。該芯片能在不到半納秒內完成關鍵計算。

Englund教授表示:“這項研究證明,計算的本質——將輸入映射為輸出——可以通過新的線性與非線性物理架構重新實現,從而帶來計算與資源投入間的全新比例規律。”整個電路通過與生產CMOS計算機芯片相同的基礎設施和代工工藝制造,這意味著可以利用成熟的技術實現芯片的大規模生產,并將制造過程中的誤差降至極低水平。

Bandyopadhyay指出,未來研究的重點將是擴大設備規模,并與現實中的電子系統(如攝像頭或通信系統)集成。團隊還計劃探索能夠充分利用光學優勢的算法,以實現更快、更高效的系統訓練。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號