在近日舉辦的英偉達GTC大會上,創(chuàng)始人兼CEO黃仁勛以一場長達兩小時的主題演講,將“Token”這一概念推向了行業(yè)焦點。幾乎在同一時間,阿里巴巴宣布成立Token事業(yè)群,明確提出“創(chuàng)造、輸送、應(yīng)用”的完整鏈路。兩大科技巨頭的同步動作,標志著AI產(chǎn)業(yè)正從模型競賽轉(zhuǎn)向以Token為核心的生產(chǎn)力競爭。
Token作為大模型處理文本的基本單元,其重要性正在重塑AI產(chǎn)業(yè)鏈的度量標準。傳統(tǒng)上,底層模型團隊關(guān)注參數(shù)規(guī)模,應(yīng)用層聚焦用戶增長,云服務(wù)則緊盯算力利用率。但隨著AI從感知、生成向推理階段演進,Token與收入的關(guān)聯(lián)愈發(fā)緊密——企業(yè)獲取的算力越多,生成的Token量越大,收入隨之增長,進而反哺模型智能化升級。這種正向循環(huán),讓英偉達成為最大受益者。
黃仁勛在演講中直言,推理計算量在過去兩年增長萬倍,使用量激增百倍,AI正從“能感知”邁向“能工作”。基于此,他提出英偉達的全新戰(zhàn)略:從數(shù)據(jù)中心轉(zhuǎn)型為“Token工廠”。按照規(guī)劃,未來每家AI公司都應(yīng)以Token生產(chǎn)效率為核心指標,甚至Token本身將成為按吞吐量和交互速度定價的“大宗商品”。英偉達為此設(shè)計了分層定價體系:免費層以廣告變現(xiàn),中級層每百萬Token收費3-6美元,高速層則高達45-150美元。黃仁勛強調(diào),新架構(gòu)將使免費層吞吐量極致提升,同時在高價值推理層級實現(xiàn)35倍效率飛躍。
為支撐這一目標,英偉達推出了專為智能體推理設(shè)計的Vera Rubin計算系統(tǒng)。該系統(tǒng)整合7款新芯片、5個機架和1臺超級計算機,其中72塊GPU通過NVLink高速互聯(lián),確保前填充計算與Token響應(yīng)速度的平衡;全球首款采用LPDDR5內(nèi)存的數(shù)據(jù)中心CPU——Vera CPU,則負責處理重復(fù)邏輯操作,解放GPU算力;BlueField 4+CX9存儲平臺與CPO Spectrum-X交換機,分別優(yōu)化數(shù)據(jù)流處理與網(wǎng)絡(luò)傳輸效率。整套系統(tǒng)采用液冷方案,安裝時間從兩天縮短至兩小時,預(yù)計2026年下半年出貨。據(jù)測試,其推理速度較上一代提升5倍,Token成本降低10倍,MoE模型所需GPU減少至四分之一。
面對異構(gòu)計算融合的挑戰(zhàn),英偉達將收購的Groq LPU平臺納入體系,并開發(fā)操作系統(tǒng)Dynamo協(xié)調(diào)任務(wù)分配。黃仁勛建議,高吞吐負載可全量使用Vera Rubin,而代碼生成等高價值場景可引入25%的Groq芯片。這種設(shè)計使數(shù)據(jù)中心在單位功耗下性能提升35倍,同時兼顧低延遲與高價值推理服務(wù)。英偉達還預(yù)告了2028年推出的Vera Rubin Ultra及Feynman架構(gòu),將3D堆疊、LPU集成、異構(gòu)存儲等技術(shù)列為未來核心。
黃仁勛的演講還涉及當前熱門的OpenClaw項目。他認為,這一智能體操作系統(tǒng)將重塑企業(yè)IT,推動SaaS公司向AaaS轉(zhuǎn)型,使2萬億美元的產(chǎn)業(yè)規(guī)模擴展至數(shù)萬億美元。為應(yīng)對安全風險,英偉達與開發(fā)者合作推出企業(yè)版NeMo Claw,通過“網(wǎng)絡(luò)護欄”和“隱私路由”等技術(shù)保障數(shù)據(jù)安全。黃仁勛甚至預(yù)言,Token可能成為硅谷工程師年薪的一部分,“入職配額”或成招聘新趨勢。
在圖形計算領(lǐng)域,英偉達發(fā)布了被黃仁勛稱為“圖形學GPT時刻”的DLSS 5技術(shù)。該技術(shù)融合3D圖形、結(jié)構(gòu)化數(shù)據(jù)與生成式AI,通過確定性框架與概率計算的結(jié)合,實現(xiàn)內(nèi)容的美觀、精確與可控。為解決非結(jié)構(gòu)化數(shù)據(jù)占比超九成的難題,英偉達同步推出cuDF和cuVS工具,分別處理結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),目前已被IBM、戴爾等企業(yè)整合進云服務(wù)體系。
從底層芯片到操作系統(tǒng),從異構(gòu)架構(gòu)到數(shù)據(jù)工具,英偉達正構(gòu)建覆蓋Token生產(chǎn)全鏈條的“生產(chǎn)力套件”。這場轉(zhuǎn)型不僅關(guān)乎技術(shù)路線,更預(yù)示著AI競爭規(guī)則的重寫——當模型性能趨于同質(zhì)化,誰能主導Token生產(chǎn),誰就能掌握下一代AI產(chǎn)業(yè)的主導權(quán)。






















