智快網 - 新科技與新能源行業網絡媒體

蘋果聯合高校推AI框架LaDiR:并行推理+自回歸輸出,復雜任務處理能力升級

   發布時間:2026-04-30 13:12 作者:江紫萱

蘋果公司與加州大學圣迭戈分校的科研團隊聯合發布了一項創新成果——名為LaDiR的新型推理框架,該研究以論文形式呈現于學術領域。這項技術并非構建全新大語言模型,而是為現有模型設計了一套可疊加的通用推理架構,通過改變模型處理問題的思維模式,顯著提升了復雜任務的解決能力。

LaDiR的核心創新在于融合了擴散模型與自回歸模型的優勢。在推理階段,系統會同時啟動多條獨立路徑,每條路徑從隨機噪聲出發,通過擴散過程逐步生成連貫的推理步驟。為避免所有路徑過早趨同,研究團隊設計了多樣性鼓勵機制,確保每條路徑探索不同的解題方向,最終形成包含多種可能性的候選答案池。在輸出階段,系統則采用自回歸模型,從候選答案中篩選并生成最終結果,既保證了生成內容的連貫性,又保留了擴散模型的并行處理效率。

實驗數據顯示,該框架在多個基準測試中表現優異。在數學問題求解中,基于LaDiR的模型在LLaMA 3.1 8B和Qwen3-8B-Base上的準確率顯著高于傳統方法,尤其在處理分布外任務時優勢更為明顯。在代碼生成測試Humaneval中,其生成的代碼可靠性更強,面對復雜難題時超越了標準微調模型。在謎題規劃任務中,該框架能夠探索更廣泛的解空間,找到正確解的概率超過所有通用基準模型,盡管在單次嘗試準確率上仍略遜于針對特定任務優化的專用模型。

研究團隊指出,LaDiR的通用性設計使其能夠適配多種基礎模型,但其在極端專業化領域的表現仍有提升空間。這一成果為提升大語言模型的推理能力提供了新思路,未來或可進一步優化路徑探索機制與答案篩選策略,以平衡廣泛適用性與任務專精性。

 
 
更多>同類內容
全站最新
熱門內容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群