在華為中國(guó)合作伙伴大會(huì)2026上,一款備受矚目的AI訓(xùn)練推理加速卡Atlas 350正式亮相。這款加速卡搭載了華為全新研發(fā)的昇騰950PR(Ascend 950PR)處理器,標(biāo)志著華為在人工智能芯片領(lǐng)域又邁出了重要一步。
與前代昇騰芯片相比,昇騰950PR在多個(gè)關(guān)鍵性能指標(biāo)上實(shí)現(xiàn)了顯著提升。特別是在低精度數(shù)據(jù)格式處理、向量算力、互聯(lián)帶寬以及自研高帶寬內(nèi)存(HBM)方面,昇騰950PR展現(xiàn)出了強(qiáng)大的技術(shù)實(shí)力。這些提升使得Atlas 350在AI訓(xùn)練和推理任務(wù)中能夠更加高效地運(yùn)行。
據(jù)華為昇騰計(jì)算業(yè)務(wù)總裁張迪煊介紹,Atlas 350在單卡算力上達(dá)到了驚人的水平,是英偉達(dá)H20的2.87倍。這一數(shù)據(jù)表明,Atlas 350在處理復(fù)雜AI任務(wù)時(shí)具有更高的效率和更快的速度。同時(shí),Atlas 350還是目前國(guó)內(nèi)唯一支持FP4低精度的推理產(chǎn)品,這一特性使得它在處理特定類(lèi)型的AI任務(wù)時(shí)具有獨(dú)特的優(yōu)勢(shì)。
除了強(qiáng)大的算力外,Atlas 350在內(nèi)存配置方面也表現(xiàn)出色。其HBM容量達(dá)到了112GB,是H20的1.16倍。這一配置使得Atlas 350在處理大規(guī)模數(shù)據(jù)時(shí)能夠更加游刃有余。同時(shí),多模態(tài)生成速度的提升也達(dá)到了60%,進(jìn)一步增強(qiáng)了其在AI應(yīng)用中的實(shí)用性。內(nèi)存訪問(wèn)顆粒度的減小也顯著提高了小算子的訪存效率,使得Atlas 350在處理細(xì)粒度任務(wù)時(shí)更加高效。
在大會(huì)展廳的Atlas 350展臺(tái)上,華為公布了更多關(guān)于這款加速卡的詳細(xì)參數(shù)。Atlas 350的FP4精度算力為1.56P,帶寬達(dá)到了1.4TB/s,這些數(shù)據(jù)進(jìn)一步證明了其在AI領(lǐng)域的強(qiáng)大實(shí)力。然而,高功耗也是Atlas 350需要面對(duì)的挑戰(zhàn)之一,其功耗為600W,是H20的1.5倍。盡管如此,華為表示將通過(guò)優(yōu)化設(shè)計(jì)和散熱技術(shù)來(lái)降低功耗對(duì)整體性能的影響。
Atlas 350不僅支持FP16和FP8等常見(jiàn)精度格式,還支持更低精度的FP4。這一特性使得集成Atlas 350的服務(wù)器能夠支持更大規(guī)模的模型以及更低時(shí)延的推理任務(wù)。由于精度降低,計(jì)算速度得以加快,同時(shí)寄存器效率也得到了提升。這對(duì)于需要處理大量數(shù)據(jù)和復(fù)雜模型的AI應(yīng)用來(lái)說(shuō)具有重要意義。
張迪煊表示,基于Atlas 350等產(chǎn)品,華為將結(jié)合AI發(fā)展趨勢(shì)和客戶(hù)需求,打造大、中、小三大核心算力場(chǎng)景。這一戰(zhàn)略旨在幫助合作伙伴滿(mǎn)足不同場(chǎng)景下的差異化需求,共同深耕行業(yè)智能化領(lǐng)域。通過(guò)提供多樣化的算力解決方案,華為有望進(jìn)一步鞏固其在AI芯片市場(chǎng)的領(lǐng)先地位。




















