摩爾線程在近日舉辦的MUSA開發(fā)者大會上,正式推出全新“花港”架構(gòu),并同步發(fā)布MUSA 5.0全棧軟件升級。此次發(fā)布會還亮相了兩款基于新架構(gòu)的芯片——“華山”與“廬山”,分別聚焦AI計算與圖形渲染領(lǐng)域,引發(fā)行業(yè)廣泛關(guān)注。
作為“花港”架構(gòu)的首款芯片,“華山”以AI訓(xùn)推一體化為核心,在算力密度與數(shù)據(jù)傳輸效率上實現(xiàn)突破。其搭載的新一代張量計算引擎支持TF32/FP16/INT8全精度MMA運算,F(xiàn)P6/FP4張量性能顯著提升。通過TCE-PAIR模式優(yōu)化內(nèi)部數(shù)據(jù)復(fù)用,配合MTFP8/6/4混合低精度計算技術(shù),可兼容MXFP與NVFP生態(tài)。該芯片還內(nèi)置異步編程模型,具備高效線程同步與線程束特化能力,適用于超十萬卡級AI工廠場景。
在互聯(lián)性能方面,“華山”芯片通過新一代Scale-up系統(tǒng)實現(xiàn)突破,兼容MTLink 4.0與多種以太協(xié)議,適配多類型Scale-up交換機,支持SHARP協(xié)議,片間互聯(lián)速率達(dá)1314 GB/s。這一特性使其在分布式AI訓(xùn)練場景中具備顯著優(yōu)勢,可滿足大規(guī)模集群的通信需求。
另一款芯片“廬山”則專注于高性能圖形渲染,依托“花港”架構(gòu)的新一代指令集,算力密度提升50%,能效比達(dá)到前代10倍。該芯片集成第一代AI生成式渲染架構(gòu)(AGR)與第二代光追硬件加速引擎,完整支持DirectX 12 Ultimate標(biāo)準(zhǔn)。其內(nèi)置的AI計算加速引擎可與幾何著色器、像素著色器及光追材質(zhì)著色器深度協(xié)同,配合UNITE渲染架構(gòu)優(yōu)化任務(wù)分配機制,實現(xiàn)渲染效率的全面提升。
值得關(guān)注的是,“花港”架構(gòu)的光線追蹤硬件加速引擎實現(xiàn)質(zhì)的飛躍,支持全場景光線遍歷求交,性能較春曉架構(gòu)提升50倍。這一技術(shù)突破將顯著提升實時渲染場景的光影表現(xiàn)力,為游戲、影視及工業(yè)設(shè)計等領(lǐng)域帶來更逼真的視覺效果。
據(jù)發(fā)布會透露,搭載“華山”與“廬山”芯片的硬件產(chǎn)品計劃于明年正式上市。兩款芯片的推出標(biāo)志著摩爾線程在GPU領(lǐng)域形成AI計算與圖形渲染雙線并進(jìn)的戰(zhàn)略布局,其技術(shù)突破有望推動國內(nèi)AI與圖形產(chǎn)業(yè)的生態(tài)發(fā)展。





















