91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡媒體

DeepSeek攜手北大發(fā)布新論文,“條件記憶”亮相并開源記憶模塊Engram

   發(fā)布時間:2026-01-14 07:26 作者:沈瑾瑜

在大型語言模型領域,一項創(chuàng)新研究引發(fā)了廣泛關注。北京大學與DeepSeek團隊攜手合作,共同完成了一項具有突破性的研究,其成果以論文形式呈現(xiàn)。論文題為《基于可擴展查找的條件記憶:大型語言模型稀疏性的新維度》(Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models),并于近日對外發(fā)布。

該研究的核心亮點在于提出了“條件記憶”(conditional memory)這一全新概念。與傳統(tǒng)大型語言模型架構不同,研究團隊引入了可擴展的查找記憶結構。這一創(chuàng)新設計在保持模型參數(shù)和算力不變的情況下,為模型性能帶來了顯著提升。具體而言,模型在知識調用、推理、代碼編寫以及數(shù)學運算等多項任務中的表現(xiàn)均得到了大幅優(yōu)化。

值得一提的是,DeepSeek創(chuàng)始人梁文鋒也出現(xiàn)在了論文的合著作者名單之中,這無疑為這項研究增添了更多關注度。與此同時,DeepSeek團隊還同步開源了與該研究相關的記憶模塊Engram,為行業(yè)內其他研究人員提供了進一步探索和應用的寶貴資源。

 
 
更多>同類內容
全站最新
熱門內容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群