在GTC 2026大會上,英偉達正式推出了專為智能體系統(tǒng)設(shè)計的Groq 3 LPX機架。這款新型機架聚焦于低延遲與長上下文處理需求,被定位為Vera Rubin平臺的AI推理加速器,預計將于今年下半年正式投入市場。
Groq 3 LPX機架采用全液冷散熱方案,基于MGX基礎(chǔ)設(shè)施架構(gòu)構(gòu)建。其核心配置包含32個1U計算托盤,每個托盤集成8顆Groq 3(LP30)芯片。每顆芯片搭載500MB片上SRAM,使得整個機架的片上存儲容量達到128GB,并實現(xiàn)40PB/s的SRAM帶寬。這種設(shè)計顯著優(yōu)化了輸出生成速度,同時將系統(tǒng)響應(yīng)延遲控制在極低水平。
在系統(tǒng)互聯(lián)方面,每顆LP30芯片通過96條112Gbps的C2C鏈路與其他組件連接。單個計算托盤可擴展至384GB DRAM內(nèi)存,通過結(jié)構(gòu)擴展邏輯與頭節(jié)點CPU實現(xiàn)內(nèi)存資源整合。這種分層存儲架構(gòu)既保證了片上SRAM的高效利用,又能在處理超大規(guī)模任務(wù)時提供DRAM作為補充支持。
據(jù)英偉達披露,Groq 3 LPX的部署將使Vera Rubin平臺的推理能效實現(xiàn)質(zhì)的飛躍。每兆瓦功耗下的推理吞吐量可提升35倍,特別在處理萬億參數(shù)級模型時,能為運營商帶來最高10倍的營收增長空間。這一突破主要得益于芯片架構(gòu)對長上下文處理的優(yōu)化,以及系統(tǒng)級內(nèi)存帶寬的指數(shù)級提升。






















