91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

螞蟻集團(tuán)推出萬(wàn)億參數(shù)思考模型Ring-2.5-1T,破解深度思考模型“不可能三角”難題

   發(fā)布時(shí)間:2026-02-15 00:00 作者:顧青青

深度思考模型領(lǐng)域長(zhǎng)期存在一個(gè)棘手難題:若要實(shí)現(xiàn)嚴(yán)密的推理邏輯,就必須承受極慢的解碼速度和巨大的顯存消耗。為突破這一困境,目前行業(yè)普遍采用混合專(zhuān)家模型(MoE)架構(gòu),通過(guò)激活部分參數(shù)來(lái)節(jié)省算力,DeepSeek、Kimi、MiniMax等頭部模型均采用此架構(gòu)。

如今,螞蟻集團(tuán)為這一難題提供了全新解法。該集團(tuán)正式開(kāi)源了全球首個(gè)基于混合線(xiàn)性架構(gòu)的萬(wàn)億參數(shù)思考模型——Ring-2.5-1T。這一模型成功實(shí)現(xiàn)了推理速度快、深度思考強(qiáng)、長(zhǎng)程任務(wù)執(zhí)行能力突出的三重突破,打破了以往深度思考模型難以兼顧這三項(xiàng)性能的局限。

在性能評(píng)測(cè)中,Ring-2.5-1T表現(xiàn)亮眼。在數(shù)學(xué)競(jìng)賽領(lǐng)域,它在國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽(IMO)中取得35分(滿(mǎn)分42分),達(dá)到金牌水平;在中國(guó)數(shù)學(xué)奧林匹克競(jìng)賽(CMO)中斬獲105分,遠(yuǎn)超國(guó)家集訓(xùn)隊(duì)分?jǐn)?shù)線(xiàn)。在長(zhǎng)文本生成場(chǎng)景中,面對(duì)32K以上的長(zhǎng)文本,其訪存規(guī)模僅為上一代的十分之一,生成吞吐量提升超過(guò)3倍,在搜索、編碼等復(fù)雜任務(wù)中展現(xiàn)出強(qiáng)大實(shí)力。

Ring-2.5-1T的速度優(yōu)勢(shì)源于其底層架構(gòu)的創(chuàng)新。該模型基于Ling 2.5架構(gòu),采用混合線(xiàn)性注意力機(jī)制,以1:7的比例混合MLA(多頭潛在注意力)和Lightning Linear Attention兩種注意力模塊。這一設(shè)計(jì)源自螞蟻此前發(fā)布的Ring-flash-linear-2.0技術(shù)路線(xiàn)。研發(fā)團(tuán)隊(duì)通過(guò)增量訓(xùn)練,將原有架構(gòu)中的GQA(分組查詢(xún)注意力)層轉(zhuǎn)化為L(zhǎng)ightning Linear Attention和MLA:前者負(fù)責(zé)在長(zhǎng)程推理中提升吞吐量,后者則極致壓縮KV Cache。為防止模型表達(dá)能力因架構(gòu)改造受損,團(tuán)隊(duì)還適配了QK Norm和Partial RoPE等特性。經(jīng)過(guò)改造,Ring-2.5-1T的激活參數(shù)量從上一代的51B提升至63B,但憑借線(xiàn)性時(shí)間復(fù)雜度的特性,推理效率大幅提升。與同為1T參數(shù)量級(jí)、僅有32B激活參數(shù)的Kimi K2架構(gòu)相比,Ling 2.5架構(gòu)在長(zhǎng)序列推理任務(wù)中的吞吐優(yōu)勢(shì)顯著,且隨著生成長(zhǎng)度增加,效率優(yōu)勢(shì)持續(xù)擴(kuò)大。這意味著長(zhǎng)程推理不再是高成本、高硬件要求的操作,而是可以規(guī)?;渴鸬妮p量級(jí)方案。

在思維訓(xùn)練方面,Ring-2.5-1T在RLVR(基于可驗(yàn)證獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí))基礎(chǔ)上引入密集獎(jiǎng)勵(lì)機(jī)制。與傳統(tǒng)僅關(guān)注最終答案正確性的方式不同,該機(jī)制會(huì)逐步考察推理過(guò)程中每個(gè)環(huán)節(jié)的嚴(yán)謹(jǐn)性,使模型在邏輯漏洞和高階證明技巧上得到顯著提升。團(tuán)隊(duì)還引入大規(guī)模全異步Agentic RL訓(xùn)練,大幅增強(qiáng)了模型在搜索、編碼等長(zhǎng)鏈條任務(wù)上的自主執(zhí)行能力,讓Ring-2.5-1T從單純的數(shù)學(xué)證明高手進(jìn)化為能在復(fù)雜實(shí)戰(zhàn)場(chǎng)景中獨(dú)當(dāng)一面的智能體。

在與開(kāi)源模型DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking,以及閉源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking等對(duì)比中,Ring-2.5-1T在高難度推理任務(wù)(如IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench)和長(zhǎng)時(shí)任務(wù)執(zhí)行基準(zhǔn)(如Gaia2-search、Tau2-bench、SWE-Bench Verified)上,均達(dá)到開(kāi)源最優(yōu)水平。在Heavy Thinking模式下,Ring-2.5-1T在多項(xiàng)數(shù)學(xué)競(jìng)賽和代碼生成基準(zhǔn)中超越所有對(duì)比模型,包括上述閉源API。尤其在IMO 2025(滿(mǎn)分42分)中取得35分,達(dá)到金牌水平;在CMO 2025(滿(mǎn)分126分)中獲得105分,大幅超過(guò)金牌線(xiàn)78分和國(guó)家集訓(xùn)隊(duì)選拔線(xiàn)87分。與上一代Ring-1T相比,新模型在推理邏輯的嚴(yán)謹(jǐn)性、高級(jí)證明技巧的運(yùn)用和答案表述的完整性上均有明顯進(jìn)步。

在生態(tài)適配與開(kāi)源落地方面,Ring-2.5-1T已適配Claude Code和OpenClaw等主流智能體框架,支持多步規(guī)劃與工具調(diào)用。模型權(quán)重與推理代碼已在Hugging Face、ModelScope等平臺(tái)同步開(kāi)放,官方Chat體驗(yàn)頁(yè)和API服務(wù)也即將上線(xiàn)。除Ring-2.5-1T外,螞蟻集團(tuán)同期還發(fā)布了擴(kuò)散語(yǔ)言模型LLaDA2.1和全模態(tài)大模型Ming-flash-omni-2.0。LLaDA2.1采用非自回歸并行解碼技術(shù),推理速度達(dá)535 tokens/s,在Humaneval+編程任務(wù)中甚至達(dá)到892 tokens/s,還具備獨(dú)特的Token編輯與逆向推理能力;Ming-flash-omni-2.0則在視覺(jué)、音頻、文本的統(tǒng)一表征與生成上實(shí)現(xiàn)突破,打通多模態(tài)的感知與創(chuàng)作能力,支持實(shí)時(shí)感官交互。螞蟻inclusionAI團(tuán)隊(duì)計(jì)劃將這些能力做成可復(fù)用的底座方案,為開(kāi)發(fā)者提供統(tǒng)一的能力入口,并將在視頻時(shí)序理解、復(fù)雜圖像編輯和長(zhǎng)音頻實(shí)時(shí)生成等方向持續(xù)發(fā)力,推動(dòng)全模態(tài)技術(shù)的規(guī)?;涞?。

隨著AI大模型應(yīng)用場(chǎng)景從短對(duì)話(huà)向長(zhǎng)文檔處理、跨文件代碼理解、復(fù)雜任務(wù)規(guī)劃等領(lǐng)域延伸,深度思考模型的效率瓶頸愈發(fā)突出。Ring-2.5-1T通過(guò)底層架構(gòu)的重構(gòu),為行業(yè)提供了一條兼顧性能、成本與擴(kuò)展性的技術(shù)路徑,有望推動(dòng)深度思考模型在更多領(lǐng)域的應(yīng)用。

 
 
更多>同類(lèi)內(nèi)容
全站最新
熱門(mén)內(nèi)容
 
智快科技微信賬號(hào)
微信群

微信掃一掃
加微信拉群
電動(dòng)汽車(chē)群
科技數(shù)碼群