在華為中國合作伙伴大會上,一款名為Atlas 350的AI訓練推理加速卡正式亮相并宣布上市。這款加速卡搭載了華為最新推出的昇騰950PR處理器,憑借其強大的性能,迅速成為全場焦點。
昇騰950PR芯片于今年早些時候發(fā)布,采用SIMD架構(gòu),算力驚人。在FP8數(shù)據(jù)格式下,其算力可達1PFLOPS,而在FP4格式下更是高達2PFLOPS。該芯片支持多種數(shù)據(jù)格式,包括FP32、HF32、FP16等,互聯(lián)帶寬達到2TB/s,內(nèi)存容量和帶寬也分別達到了128GB和1.6TB/s。與前一代產(chǎn)品相比,昇騰950PR在低精度數(shù)據(jù)格式處理、向量算力、互聯(lián)帶寬以及自研HBM等方面均實現(xiàn)了顯著提升。
與英偉達的H20芯片相比,昇騰950PR在HBM容量上更勝一籌,達到了112GB,是H20的1.16倍。同時,其多模態(tài)生成速度提升了60%,內(nèi)存訪問顆粒度從512字節(jié)減少到128字節(jié),使得小算子的訪存效率提升了4倍。這些優(yōu)勢使得Atlas 350加速卡在性能上有了質(zhì)的飛躍。
Atlas 350加速卡的硬件參數(shù)同樣令人矚目。在FP4精度下,其算力高達1.56P,帶寬達到了1.4TB/s。盡管功耗為600W,是H20的1.5倍,但考慮到其卓越的性能,這一功耗水平仍在可接受范圍內(nèi)。
華為昇騰計算業(yè)務總裁張迪煊表示,Atlas 350的單卡算力是英偉達H20的2.87倍,是目前國內(nèi)唯一支持FP4低精度的推理產(chǎn)品。這意味著,搭載Atlas 350的服務器能夠支持更大規(guī)模的模型,實現(xiàn)更低的推理時延,從而提高計算速度和寄存器效率。
在實際應用中,Atlas 350加速卡已經(jīng)展現(xiàn)出了強大的實力。在互聯(lián)網(wǎng)推薦場景的實測中,該卡時延更低、響應更快,特別適合短視頻、電商、廣告推薦等高并發(fā)場景。同時,在大模型推理、文生圖、文生視頻等多模態(tài)場景中,其性能也與英偉達的L20相當。
基于Atlas 350等產(chǎn)品,華為昇騰還計劃打造大、中、小三大核心算力場景,以滿足不同客戶的差異化需求。在此次大會上,昆侖、華鯤振宇等7家華為核心伙伴發(fā)布了基于Atlas 350的服務器整機產(chǎn)品,標志著昇騰950代際推理算力正式進入商用階段。
其中,軟通動力旗下的軟通華方發(fā)布的“超強A860 A5”服務器備受關(guān)注。這款6U2路AI服務器產(chǎn)品搭載了鯤鵬920新型號處理器,可支持8塊昇騰Atlas350加速卡,具有超強算力、靈活拓展和安全可靠等特點,適用于AI大語言模型訓練和推理、AI加速計算、視頻分析等多種應用場景。
科大訊飛也宣布將新一代星火大模型與昇騰910/950系列算力底座進行充分適配,為用戶提供更加智能、高效的AI解決方案。華為昇騰還聯(lián)合20家行業(yè)頭部伙伴發(fā)布了2026昇騰AI應用場景解決方案,覆蓋輔助辦公、AI實訓、電子病歷等多個行業(yè)核心場景。
值得一提的是,近期基于OpenClaw的“養(yǎng)蝦”熱潮激發(fā)了相關(guān)AI一體機的需求。華為透露,過去一個多月已有十幾家合作伙伴推出了基于昇騰的OpenClaw一體機。截至目前,昇騰已聯(lián)合伙伴打造了400多款行業(yè)一體機,服務客戶超過2700家,占據(jù)國內(nèi)一體機市場80%以上的份額。






















