芬蘭阿爾托大學(xué)的研究團(tuán)隊近日取得一項突破性進(jìn)展,成功演示了一種名為“并行光學(xué)矩陣-矩陣乘法器”(POMMM)的新型光學(xué)計算架構(gòu)。這項技術(shù)旨在破解人工智能(AI)模型訓(xùn)練與運(yùn)行過程中面臨的核心算力瓶頸,為大規(guī)模AI應(yīng)用提供更高效的計算解決方案。
現(xiàn)代AI模型,尤其是大語言模型(LLM),其性能提升受制于張量數(shù)據(jù)的處理速度。張量作為AI模型中組織數(shù)據(jù)的核心結(jié)構(gòu),其運(yùn)算效率直接決定了模型規(guī)模的上限。傳統(tǒng)電子計算在處理大規(guī)模張量運(yùn)算時,往往面臨能耗高、延遲長的困境,而光學(xué)計算雖在小規(guī)模場景中展現(xiàn)出速度與能效優(yōu)勢,卻因難以實現(xiàn)并行運(yùn)算而難以推廣。
研究團(tuán)隊指出,現(xiàn)有光學(xué)系統(tǒng)大多依賴線性運(yùn)算模式,無法像GPU那樣通過大規(guī)模并行處理提升算力。例如,OpenAI、Google等企業(yè)開發(fā)的頂級AI模型,均依賴數(shù)千塊GPU的并行運(yùn)行實現(xiàn)高效訓(xùn)練。這種依賴電子硬件的模式,不僅成本高昂,且在算力擴(kuò)展上逐漸觸及物理極限。
POMMM技術(shù)的核心創(chuàng)新在于,通過單次相干光傳播完成整個矩陣乘法運(yùn)算。其原理是將數(shù)字張量編碼為光的相位與振幅,利用透鏡組實現(xiàn)傅里葉變換后,運(yùn)算結(jié)果以干涉圖像形式被高速探測器捕獲。整個過程在光傳播的瞬間完成,無需電子回路或內(nèi)存讀取,實現(xiàn)了物理層面的“自然同步計算”。這種設(shè)計使運(yùn)算延遲降至納秒級,遠(yuǎn)超電子計算的微秒級水平。
研究團(tuán)隊基于商用光學(xué)元件搭建了原型機(jī),并在標(biāo)準(zhǔn)光學(xué)平臺上耗時六個月完成組裝。測試數(shù)據(jù)顯示,對于50x50規(guī)模的矩陣運(yùn)算,該原型的平均絕對誤差(MAE)低于0.15,歸一化均方根誤差(RMSE)控制在0.1以下,精度已能滿足邊緣推理等場景的需求。盡管當(dāng)前原型機(jī)的能效(2.62 GOP/J)仍低于頂尖GPU,但其擴(kuò)展?jié)摿Ρ粡V泛看好。
為推動技術(shù)落地,研究團(tuán)隊在GitHub平臺公開了所有代碼與數(shù)據(jù),吸引了全球光子學(xué)實驗室及AI加速器開發(fā)者的關(guān)注。團(tuán)隊坦言,目前技術(shù)仍面臨探測器動態(tài)范圍不足、校準(zhǔn)漂移等挑戰(zhàn),但已制定清晰的優(yōu)化路線:通過將空間光調(diào)制器與探測器陣列集成至低損耗氮化硅光子芯片,預(yù)計能效可提升百倍。
根據(jù)預(yù)測,集成專用光子芯片的升級版原型機(jī)有望在三年內(nèi)問世,其能效預(yù)計達(dá)300 GOP/J,遠(yuǎn)超當(dāng)前電子GPU約30 GOP/J的能效瓶頸。不過,受封裝工藝、溫控技術(shù)及激光器集成等工程難題限制,大規(guī)模量產(chǎn)可能需五年以上時間。






















