91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡媒體

小米AI新突破:羅福莉領銜打造萬億參數(shù)模型,獲林俊旸力贊

   發(fā)布時間:2026-03-21 15:59 作者:顧雨柔

近日,全球AI領域迎來一則重磅消息:小米正式發(fā)布首款自研旗艦大模型Xiaomi MiMo-V2-Pro,同時推出MiMo-V2-Omni和MiMo-V2-TTS兩款配套模型。這一動作標志著小米正式加入大模型競爭賽道,引發(fā)行業(yè)廣泛關注。此前,一款名為Hunter Alpha的神秘模型在OpenRouter平臺引發(fā)猜測,如今真相浮出水面——它正是MiMo-V2-Pro的內(nèi)部測試版本。

回溯至3月11日,OpenRouter平臺突然上線Hunter Alpha模型。該模型以"隱身模式"發(fā)布,未標注開發(fā)者信息且提供免費訪問權限。測試數(shù)據(jù)顯示,其具備1萬億參數(shù)規(guī)模和100萬token的上下文窗口,自稱"以中文訓練的中國AI模型"且知識截止時間為2025年5月。這些特征與DeepSeek此前模型風格高度相似,導致市場普遍猜測這是DeepSeek的秘密測試項目。然而,小米MiMo團隊近日正式認領該模型,揭開這場"烏龍事件"的真相。

此次發(fā)布的三款模型中,MiMo-V2-Pro作為旗艦基座模型備受矚目。該模型采用超大規(guī)模稀疏化設計,總參數(shù)達1萬億級,但單次推理僅激活420億參數(shù)。這種MoE(專家混合)架構通過動態(tài)激活部分子網(wǎng)絡,在保持計算效率的同時擴展模型容量。在注意力機制方面,創(chuàng)新性地引入分層組合的混合注意力結構,將局部窗口注意力與全局注意力相結合,既限制計算復雜度又保留長距離依賴關系,有效解決長上下文場景下的注意力退化問題。

技術突破帶來顯著性能提升。MiMo-V2-Pro的上下文窗口擴展至100萬token,支持在單次上下文中保留完整任務狀態(tài)、工具調(diào)用結果和歷史決策路徑。在匿名測試階段,該模型已展現(xiàn)出代碼生成、開發(fā)工具調(diào)用和自動化任務處理等強項?;鶞蕼y試數(shù)據(jù)顯示,其在通用Agent能力評估(Claweval)中得分61.5,逼近Claude Opus 4.6;編碼能力更超越Claude Sonnet 4.6,接近Opus級別。定價策略同樣具有競爭力,256K上下文長度下輸入單價為每百萬1美元,輸出3美元;擴展至100萬上下文時,輸入單價僅2美元,輸出6美元,約為Claude Opus 4.6的五分之一。

小米AI團隊領軍人物羅福莉是這場技術突破的關鍵推手。這位畢業(yè)于北京大學計算語言學研究所的科研人才,曾主導開發(fā)阿里多語言預訓練模型VECO,并在DeepSeek期間參與MoE大模型DeepSeek-V2的核心開發(fā)。2025年11月加入小米后,她帶領團隊歷時數(shù)月訓練出1T基礎模型。在社交平臺分享中,羅福莉透露團隊曾設定"每天與AI對話少于100次可辭職"的硬性指標,這種高強度研發(fā)模式推動模型快速迭代。她特別強調(diào)混合注意力機制的創(chuàng)新價值,認為這種架構決策為智能體時代構建了結構性優(yōu)勢。

行業(yè)對小米的AI轉型給予積極評價。前阿里巴巴通義千問核心技術負責人林俊旸在社交平臺點贊稱"太棒了",雷軍則在發(fā)布后第一時間宣布模型在全球大模型綜合智能排行榜Artificial Analysis上位列第八,按品牌排名超越xAI Grok。他坦言小米在AI領域長期保持低調(diào),但實際進展超出外界想象。為支持AI戰(zhàn)略,小米計劃今年投入超過160億元研發(fā)資金,展現(xiàn)布局智能時代的決心。隨著MiMo-V2-Pro的正式發(fā)布,這場由神秘模型引發(fā)的行業(yè)猜想,最終演變?yōu)橹袊萍计髽I(yè)在大模型領域的又一次重要突破。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群