三星高級(jí)AI研究院近日在人工智能領(lǐng)域投下一枚重磅炸彈——其研發(fā)的微型遞歸模型(TRM)以僅700萬參數(shù)的極簡架構(gòu),在結(jié)構(gòu)化推理任務(wù)中展現(xiàn)出與萬倍規(guī)模大模型抗衡的實(shí)力。該成果由研究院高級(jí)研究員Alexia Jolicoeur-Martineau團(tuán)隊(duì)完成,相關(guān)代碼、訓(xùn)練腳本及數(shù)據(jù)集已通過MIT許可證在GitHub平臺(tái)全面開源。
與傳統(tǒng)依賴龐大參數(shù)堆砌的AI模型不同,TRM通過"遞歸推理"機(jī)制實(shí)現(xiàn)了效率革命。該模型摒棄了分層推理模型(HRM)的雙網(wǎng)絡(luò)架構(gòu),轉(zhuǎn)而采用僅含兩層神經(jīng)元的精簡結(jié)構(gòu)。其核心邏輯在于讓模型對(duì)自身輸出進(jìn)行持續(xù)迭代修正——每次預(yù)測(cè)后,系統(tǒng)會(huì)檢查前序步驟的潛在誤差,并通過循環(huán)反饋機(jī)制逐步逼近最優(yōu)解。這種"以遞歸替代規(guī)模"的設(shè)計(jì),使TRM在保持高性能的同時(shí),將計(jì)算資源消耗降低至傳統(tǒng)大模型的百分之一以下。
在針對(duì)性測(cè)試中,TRM的表現(xiàn)令人矚目:在極限數(shù)獨(dú)(Sudoku-Extreme)任務(wù)中取得87.4%的準(zhǔn)確率,困難迷宮(Maze-Hard)測(cè)試達(dá)85%,抽象推理能力評(píng)估(ARC-AGI)中收獲45%的準(zhǔn)確率,其進(jìn)階版本ARC-AGI-2則達(dá)到8%。這些數(shù)據(jù)與DeepSeek R1、Gemini 2.5 Pro及o3-mini等頂尖模型相比,不僅毫不遜色,部分指標(biāo)甚至實(shí)現(xiàn)超越。值得注意的是,TRM的參數(shù)量不足這些大模型的0.01%,卻能在特定領(lǐng)域達(dá)成"四兩撥千斤"的效果。
研究團(tuán)隊(duì)指出,TRM的成功源于對(duì)"極簡主義"的極致追求。實(shí)驗(yàn)表明,當(dāng)模型層數(shù)或參數(shù)規(guī)模超過臨界點(diǎn)時(shí),反而會(huì)因小數(shù)據(jù)集過擬合導(dǎo)致性能衰退。其雙層結(jié)構(gòu)與遞歸深度的巧妙結(jié)合,恰好實(shí)現(xiàn)了復(fù)雜推理需求與計(jì)算效率的最優(yōu)平衡。不過研發(fā)者也強(qiáng)調(diào),該模型專為結(jié)構(gòu)化網(wǎng)格類問題設(shè)計(jì),在數(shù)獨(dú)、迷宮等規(guī)則明確的封閉場(chǎng)景中表現(xiàn)優(yōu)異,但并不適用于開放式語言生成任務(wù)。
目前,TRM的完整技術(shù)資料已向全球開發(fā)者開放。企業(yè)和研究機(jī)構(gòu)可自由獲取代碼進(jìn)行二次開發(fā),甚至將修改后的版本用于商業(yè)用途。這種開放策略或?qū)⑼苿?dòng)AI領(lǐng)域向"小而精"的方向加速演進(jìn),為資源受限場(chǎng)景下的智能應(yīng)用開辟新路徑。























