91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

小米開源新模型MiMo-V2-Flash:性能比肩頭部,成本創(chuàng)新低引領(lǐng)AI新潮流

   發(fā)布時(shí)間:2025-12-17 22:24 作者:趙云飛

小米近日在人工智能領(lǐng)域投下一枚重磅炸彈,正式推出并開源新一代大模型MiMo-V2-Flash。這款模型憑借3090億總參數(shù)、150億活躍參數(shù)的規(guī)模,以及專家混合架構(gòu)(MoE)設(shè)計(jì),在性能上與DeepSeek-V3.2、Kimi-K2等頭部開源模型形成有力競(jìng)爭(zhēng)。更引人注目的是,其推理速度達(dá)到每秒150個(gè)token,輸入成本低至每百萬(wàn)token僅0.1美元,輸出成本0.3美元,在性價(jià)比維度上樹立了新標(biāo)桿。

在權(quán)威基準(zhǔn)測(cè)試中,MiMo-V2-Flash展現(xiàn)驚人實(shí)力:AIME 2025數(shù)學(xué)競(jìng)賽和GPQA-Diamond科學(xué)知識(shí)測(cè)試均躋身開源模型前兩名;編程能力尤為突出,SWE-bench Verified測(cè)試得分73.4%,超越所有開源競(jìng)品,直逼GPT-5-High水平。該測(cè)試要求模型修復(fù)真實(shí)軟件漏洞,73.4%的成功率意味著其已具備解決多數(shù)實(shí)際編程問(wèn)題的能力。在多語(yǔ)言編程測(cè)試SWE-Bench Multilingual中,模型同樣取得71.7%的解決率。

智能體任務(wù)表現(xiàn)同樣亮眼:在τ2-Bench分類測(cè)試中,通信類得分95.3、零售類79.5、航空類66.0;BrowseComp搜索代理得分45.4,啟用上下文管理后躍升至58.3。這些數(shù)據(jù)表明,模型不僅能編寫代碼,更能理解復(fù)雜任務(wù)邏輯,支持多輪智能交互。更值得關(guān)注的是,其文本生成質(zhì)量已接近頂級(jí)閉源模型,可勝任日常助手角色。

支撐這些突破的是兩項(xiàng)核心技術(shù)創(chuàng)新?;旌匣瑒?dòng)窗口注意力機(jī)制采用5層滑動(dòng)窗口與1層全局注意力交替的設(shè)計(jì),滑動(dòng)窗口固定為128個(gè)token。這種激進(jìn)方案使KV緩存存儲(chǔ)量減少近6倍,卻能維持256k超長(zhǎng)上下文窗口。項(xiàng)目負(fù)責(zé)人羅福莉透露,實(shí)驗(yàn)發(fā)現(xiàn)128是"最佳甜點(diǎn)值",盲目擴(kuò)大窗口反而導(dǎo)致性能下降,同時(shí)強(qiáng)調(diào)sink values機(jī)制對(duì)維持性能至關(guān)重要。

另一項(xiàng)突破是輕量級(jí)多Token預(yù)測(cè)(MTP)模塊。傳統(tǒng)模型逐token生成的方式被徹底顛覆,新模塊可并行預(yù)測(cè)多個(gè)token,實(shí)測(cè)平均接受2.8-3.6個(gè)token,推理速度提升2-2.6倍。在三層MTP設(shè)置下,編碼任務(wù)速度提升約2.5倍,有效解決了小批量強(qiáng)化學(xué)習(xí)中"長(zhǎng)尾樣本"導(dǎo)致的GPU空閑問(wèn)題。雖然目前MTP尚未完整集成RL訓(xùn)練循環(huán),但小米已開源三層實(shí)現(xiàn),供開發(fā)者自由使用。

訓(xùn)練效率的革命性提升源于FP8混合精度技術(shù)和多教師在線策略蒸餾(MOPD)框架。預(yù)訓(xùn)練階段在27萬(wàn)億token數(shù)據(jù)上完成,原生支持32k序列長(zhǎng)度;后訓(xùn)練階段通過(guò)MOPD框架,讓學(xué)生模型在自身策略分布上采樣,由多個(gè)專家教師提供實(shí)時(shí)反饋。這種模式僅需傳統(tǒng)方法1/50的算力即可達(dá)到同等性能,且支持動(dòng)態(tài)接入新教師,形成"教學(xué)相長(zhǎng)"的閉環(huán)進(jìn)化系統(tǒng)。

開發(fā)者生態(tài)建設(shè)同樣值得關(guān)注。模型已與Claude Code、Cursor、Cline等主流開發(fā)環(huán)境無(wú)縫對(duì)接,256k上下文窗口可支持?jǐn)?shù)百輪智能體交互。所有推理代碼已貢獻(xiàn)給SGLang社區(qū),技術(shù)報(bào)告完整披露模型細(xì)節(jié),基礎(chǔ)權(quán)重在Hugging Face平臺(tái)以MIT協(xié)議開源。目前API平臺(tái)正限時(shí)免費(fèi)開放,開發(fā)者可立即體驗(yàn)這款"性能怪獸"。項(xiàng)目團(tuán)隊(duì)透露,這僅是小米AGI路線圖的第二步,后續(xù)計(jì)劃通過(guò)擴(kuò)大模型規(guī)模和訓(xùn)練算力持續(xù)縮小與閉源模型的差距。

HuggingFace模型地址:http://hf.co/XiaomiMiMo/MiMo-V2-Flash
技術(shù)報(bào)告地址:http://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
 
智快科技微信賬號(hào)
微信群

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群