【智快網(wǎng)】11月29日消息,亞馬遜旗下的云計(jì)算部門AWS在美國時(shí)間周二舉辦的Reinvent大會上推出了全新的人工智能(AI)芯片,以滿足客戶對構(gòu)建和運(yùn)行人工智能應(yīng)用程序的需求,并計(jì)劃引入英偉達(dá)最新芯片。
為了在云服務(wù)領(lǐng)域脫穎而出,AWS正致力于提供各種高性價(jià)比的選擇。然而,與其它云服務(wù)提供商不同的是,AWS并非僅僅銷售自家品牌的產(chǎn)品。與亞馬遜在線零售市場類似,AWS的云計(jì)算服務(wù)將提供來自不同供應(yīng)商的頂級產(chǎn)品,包括英偉達(dá)的GPU等。
據(jù)智快網(wǎng)了解,自從人工智能初創(chuàng)企業(yè)OpenAI去年發(fā)布了ChatGPT聊天機(jī)器人以來,英偉達(dá)GPU的需求不斷攀升。ChatGPT聊天機(jī)器人以其出色的信息總結(jié)和真人文本撰寫能力引起廣泛關(guān)注,導(dǎo)致英偉達(dá)芯片短缺。多家公司爭相將類似生成式人工智能技術(shù)整合到產(chǎn)品中,使得亞馬遜采取了雙管齊下的策略,既推出自家芯片,又允許客戶使用英偉達(dá)最新芯片,以抗衡微軟等頭號競爭對手。微軟早些時(shí)候也發(fā)布了首款人工智能芯片Maia 100,并表示Azure云將采用英偉達(dá)H200 GPU。
具體而言,AWS宣布將提供英偉達(dá)最新的H200人工智能圖形處理單元,該公司還發(fā)布了Trainium2人工智能芯片和通用Graviton4處理器。
新的H200 GPU是H100的升級版,曾被OpenAI用于訓(xùn)練先進(jìn)的大語言模型GPT-4。在芯片供應(yīng)有限的情況下,大型公司、初創(chuàng)企業(yè)和政府機(jī)構(gòu)紛紛爭奪,因此從亞馬遜等云服務(wù)提供商那里租用芯片的需求也相應(yīng)增加。據(jù)英偉達(dá)表示,H200的輸出速度將是H100的近兩倍。
此外,亞馬遜推出的Trainium2芯片專為訓(xùn)練人工智能模型而設(shè)計(jì),支持OpenAI ChatGPT等聊天機(jī)器人的基礎(chǔ)模型。初創(chuàng)公司Databricks和亞馬遜支持的Anthropic計(jì)劃將使用新的Trainium2芯片構(gòu)建模型,性能將提高四倍。
Graviton4處理器基于Arm架構(gòu),相較于英特爾或AMD的芯片,能耗更低。AWS承諾Graviton4的性能將比現(xiàn)有的Graviton3芯片提高30%,實(shí)現(xiàn)更高的性價(jià)比。由于通貨膨脹率居高不下,央行提高利率,一些組織為了更好地應(yīng)對經(jīng)濟(jì)問題,可能考慮遷移到Graviton上以降低云服務(wù)賬單。
亞馬遜表示,已有超過5萬名AWS客戶在使用Graviton芯片。
作為加深與英偉達(dá)合作的一部分,AWS將運(yùn)營超過16000顆英偉達(dá)GH200 Grace Hopper超級芯片,其中包含英偉達(dá)GPU和基于Arm架構(gòu)的通用處理器。英偉達(dá)的研發(fā)團(tuán)隊(duì)和AWS客戶都將能夠充分利用這一基礎(chǔ)設(shè)施。
自2006年推出EC2和S3服務(wù)以來,AWS已經(jīng)推出了200多種云產(chǎn)品。盡管不是所有服務(wù)都取得了巨大成功,有些版本已經(jīng)很長時(shí)間沒有更新,甚至停產(chǎn),但亞馬遜仍在持續(xù)投資Graviton和Trainium項(xiàng)目,這表明其已經(jīng)認(rèn)識到市場需求。
盡管AWS尚未宣布搭載英偉達(dá)H200芯片的虛擬機(jī)實(shí)例的發(fā)布日期,以及使用Trainium2芯片的虛擬機(jī)實(shí)例的發(fā)布日期,但客戶現(xiàn)在已經(jīng)可以開始測試Graviton4的虛擬機(jī)實(shí)例,商業(yè)使用將在幾個(gè)月后啟動。























