精品国产乱码久久久久久软件大全 ,国产激情久久久久影院老熟女

螞蟻集團(tuán)推出萬(wàn)億參數(shù)思考模型Ring-2.5-1T，破解深度思考模型“不可能三角”難題

發(fā)布時(shí)間：2026-02-15 00:00 來(lái)源：快訊作者：顧青青

深度思考模型領(lǐng)域長(zhǎng)期存在一個(gè)棘手難題：若要實(shí)現(xiàn)嚴(yán)密的推理邏輯，就必須承受極慢的解碼速度和巨大的顯存消耗。為突破這一困境，目前行業(yè)普遍采用混合專(zhuān)家模型（MoE）架構(gòu)，通過(guò)激活部分參數(shù)來(lái)節(jié)省算力，DeepSeek、Kimi、MiniMax等頭部模型均采用此架構(gòu)。

如今，螞蟻集團(tuán)為這一難題提供了全新解法。該集團(tuán)正式開(kāi)源了全球首個(gè)基于混合線(xiàn)性架構(gòu)的萬(wàn)億參數(shù)思考模型——Ring-2.5-1T。這一模型成功實(shí)現(xiàn)了推理速度快、深度思考強(qiáng)、長(zhǎng)程任務(wù)執(zhí)行能力突出的三重突破，打破了以往深度思考模型難以兼顧這三項(xiàng)性能的局限。

在性能評(píng)測(cè)中，Ring-2.5-1T表現(xiàn)亮眼。在數(shù)學(xué)競(jìng)賽領(lǐng)域，它在國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽（IMO）中取得35分（滿(mǎn)分42分），達(dá)到金牌水平；在中國(guó)數(shù)學(xué)奧林匹克競(jìng)賽（CMO）中斬獲105分，遠(yuǎn)超國(guó)家集訓(xùn)隊(duì)分?jǐn)?shù)線(xiàn)。在長(zhǎng)文本生成場(chǎng)景中，面對(duì)32K以上的長(zhǎng)文本，其訪存規(guī)模僅為上一代的十分之一，生成吞吐量提升超過(guò)3倍，在搜索、編碼等復(fù)雜任務(wù)中展現(xiàn)出強(qiáng)大實(shí)力。

Ring-2.5-1T的速度優(yōu)勢(shì)源于其底層架構(gòu)的創(chuàng)新。該模型基于Ling 2.5架構(gòu)，采用混合線(xiàn)性注意力機(jī)制，以1:7的比例混合MLA（多頭潛在注意力）和Lightning Linear Attention兩種注意力模塊。這一設(shè)計(jì)源自螞蟻此前發(fā)布的Ring-flash-linear-2.0技術(shù)路線(xiàn)。研發(fā)團(tuán)隊(duì)通過(guò)增量訓(xùn)練，將原有架構(gòu)中的GQA（分組查詢(xún)注意力）層轉(zhuǎn)化為L(zhǎng)ightning Linear Attention和MLA：前者負(fù)責(zé)在長(zhǎng)程推理中提升吞吐量，后者則極致壓縮KV Cache。為防止模型表達(dá)能力因架構(gòu)改造受損，團(tuán)隊(duì)還適配了QK Norm和Partial RoPE等特性。經(jīng)過(guò)改造，Ring-2.5-1T的激活參數(shù)量從上一代的51B提升至63B，但憑借線(xiàn)性時(shí)間復(fù)雜度的特性，推理效率大幅提升。與同為1T參數(shù)量級(jí)、僅有32B激活參數(shù)的Kimi K2架構(gòu)相比，Ling 2.5架構(gòu)在長(zhǎng)序列推理任務(wù)中的吞吐優(yōu)勢(shì)顯著，且隨著生成長(zhǎng)度增加，效率優(yōu)勢(shì)持續(xù)擴(kuò)大。這意味著長(zhǎng)程推理不再是高成本、高硬件要求的操作，而是可以規(guī)?；渴鸬妮p量級(jí)方案。

在思維訓(xùn)練方面，Ring-2.5-1T在RLVR（基于可驗(yàn)證獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)）基礎(chǔ)上引入密集獎(jiǎng)勵(lì)機(jī)制。與傳統(tǒng)僅關(guān)注最終答案正確性的方式不同，該機(jī)制會(huì)逐步考察推理過(guò)程中每個(gè)環(huán)節(jié)的嚴(yán)謹(jǐn)性，使模型在邏輯漏洞和高階證明技巧上得到顯著提升。團(tuán)隊(duì)還引入大規(guī)模全異步Agentic RL訓(xùn)練，大幅增強(qiáng)了模型在搜索、編碼等長(zhǎng)鏈條任務(wù)上的自主執(zhí)行能力，讓Ring-2.5-1T從單純的數(shù)學(xué)證明高手進(jìn)化為能在復(fù)雜實(shí)戰(zhàn)場(chǎng)景中獨(dú)當(dāng)一面的智能體。

在與開(kāi)源模型DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking，以及閉源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking等對(duì)比中，Ring-2.5-1T在高難度推理任務(wù)（如IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench）和長(zhǎng)時(shí)任務(wù)執(zhí)行基準(zhǔn)（如Gaia2-search、Tau2-bench、SWE-Bench Verified）上，均達(dá)到開(kāi)源最優(yōu)水平。在Heavy Thinking模式下，Ring-2.5-1T在多項(xiàng)數(shù)學(xué)競(jìng)賽和代碼生成基準(zhǔn)中超越所有對(duì)比模型，包括上述閉源API。尤其在IMO 2025（滿(mǎn)分42分）中取得35分，達(dá)到金牌水平；在CMO 2025（滿(mǎn)分126分）中獲得105分，大幅超過(guò)金牌線(xiàn)78分和國(guó)家集訓(xùn)隊(duì)選拔線(xiàn)87分。與上一代Ring-1T相比，新模型在推理邏輯的嚴(yán)謹(jǐn)性、高級(jí)證明技巧的運(yùn)用和答案表述的完整性上均有明顯進(jìn)步。

在生態(tài)適配與開(kāi)源落地方面，Ring-2.5-1T已適配Claude Code和OpenClaw等主流智能體框架，支持多步規(guī)劃與工具調(diào)用。模型權(quán)重與推理代碼已在Hugging Face、ModelScope等平臺(tái)同步開(kāi)放，官方Chat體驗(yàn)頁(yè)和API服務(wù)也即將上線(xiàn)。除Ring-2.5-1T外，螞蟻集團(tuán)同期還發(fā)布了擴(kuò)散語(yǔ)言模型LLaDA2.1和全模態(tài)大模型Ming-flash-omni-2.0。LLaDA2.1采用非自回歸并行解碼技術(shù)，推理速度達(dá)535 tokens/s，在Humaneval+編程任務(wù)中甚至達(dá)到892 tokens/s，還具備獨(dú)特的Token編輯與逆向推理能力；Ming-flash-omni-2.0則在視覺(jué)、音頻、文本的統(tǒng)一表征與生成上實(shí)現(xiàn)突破，打通多模態(tài)的感知與創(chuàng)作能力，支持實(shí)時(shí)感官交互。螞蟻inclusionAI團(tuán)隊(duì)計(jì)劃將這些能力做成可復(fù)用的底座方案，為開(kāi)發(fā)者提供統(tǒng)一的能力入口，并將在視頻時(shí)序理解、復(fù)雜圖像編輯和長(zhǎng)音頻實(shí)時(shí)生成等方向持續(xù)發(fā)力，推動(dòng)全模態(tài)技術(shù)的規(guī)?；涞?。

隨著AI大模型應(yīng)用場(chǎng)景從短對(duì)話(huà)向長(zhǎng)文檔處理、跨文件代碼理解、復(fù)雜任務(wù)規(guī)劃等領(lǐng)域延伸，深度思考模型的效率瓶頸愈發(fā)突出。Ring-2.5-1T通過(guò)底層架構(gòu)的重構(gòu)，為行業(yè)提供了一條兼顧性能、成本與擴(kuò)展性的技術(shù)路徑，有望推動(dòng)深度思考模型在更多領(lǐng)域的應(yīng)用。

更多>同類(lèi)內(nèi)容

91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

螞蟻集團(tuán)推出萬(wàn)億參數(shù)思考模型Ring-2.5-1T，破解深度思考模型“不可能三角”難題

螞蟻集團(tuán)推出萬(wàn)億參數(shù)思考模型Ring-2.5-1T，破解深度思考模型“不可能三角”難題