近日,UALink(Ultra Accelerator Link)聯(lián)盟宣布推出四項(xiàng)新一代加速器互連技術(shù)規(guī)范,旨在為人工智能(AI)領(lǐng)域提供更高效、靈活的硬件解決方案。這些規(guī)范涵蓋從數(shù)據(jù)鏈路到系統(tǒng)管理的多個(gè)層面,標(biāo)志著加速器互連技術(shù)向標(biāo)準(zhǔn)化、模塊化方向邁出重要一步。
其中,UALink通用規(guī)范2.0版本首次引入“網(wǎng)絡(luò)內(nèi)計(jì)算”概念,允許加速器在數(shù)據(jù)傳輸過(guò)程中直接完成部分計(jì)算任務(wù)。這一創(chuàng)新可顯著降低分布式AI訓(xùn)練與推理的延遲,同時(shí)優(yōu)化帶寬利用率,尤其適用于處理復(fù)雜多任務(wù)負(fù)載的場(chǎng)景。例如,在大型語(yǔ)言模型訓(xùn)練中,該規(guī)范可通過(guò)減少數(shù)據(jù)中轉(zhuǎn)次數(shù),將系統(tǒng)整體效率提升約30%。
針對(duì)物理層與數(shù)據(jù)鏈路的升級(jí),UALink 200G DL/PL規(guī)范2.0將相關(guān)標(biāo)準(zhǔn)從通用規(guī)范中獨(dú)立出來(lái)。這種模塊化設(shè)計(jì)使行業(yè)能夠快速適配新型物理接口或更高傳輸速率,而無(wú)需修改其他協(xié)議層。聯(lián)盟技術(shù)委員會(huì)成員解釋稱(chēng),此舉可幫助硬件廠商縮短產(chǎn)品迭代周期,應(yīng)對(duì)AI算力需求指數(shù)級(jí)增長(zhǎng)的挑戰(zhàn)。
在系統(tǒng)管理方面,UALink可管理性規(guī)范1.0構(gòu)建了集中式控制與管理平面,支持gNMI、Yang、SAI和Redfish等開(kāi)放協(xié)議。通過(guò)標(biāo)準(zhǔn)化API接口,運(yùn)維人員可實(shí)現(xiàn)對(duì)多加速器集群的統(tǒng)一監(jiān)控與資源調(diào)度,降低大型AI基礎(chǔ)設(shè)施的運(yùn)維復(fù)雜度。某云服務(wù)提供商測(cè)試顯示,該規(guī)范可將集群故障定位時(shí)間從小時(shí)級(jí)縮短至分鐘級(jí)。
針對(duì)芯粒(Chiplet)集成需求,UALink芯粒規(guī)范1.0定義了接口、封裝尺寸、流控機(jī)制等關(guān)鍵參數(shù),并完全兼容UCIe 3.0標(biāo)準(zhǔn)。這意味著芯片設(shè)計(jì)廠商可直接將UALink功能集成至多芯粒架構(gòu)中,加速異構(gòu)計(jì)算芯片的開(kāi)發(fā)進(jìn)程。某半導(dǎo)體企業(yè)透露,其基于該規(guī)范的新一代AI加速器已進(jìn)入流片階段,預(yù)計(jì)可降低40%的互連功耗。
UALink聯(lián)盟董事會(huì)主席Kurtis Bowman表示:“AI工作負(fù)載的進(jìn)化速度已超越傳統(tǒng)互連技術(shù)的更新周期。此次規(guī)范更新為行業(yè)提供了關(guān)鍵技術(shù)支撐,使UALink解決方案能夠更快融入各類(lèi)AI架構(gòu)。”他強(qiáng)調(diào),聯(lián)盟將持續(xù)通過(guò)開(kāi)放標(biāo)準(zhǔn)推動(dòng)AI基礎(chǔ)設(shè)施創(chuàng)新,助力前沿應(yīng)用落地。






















