DeepSeek发布新论文 提出条件记忆提升模型表现_热点百科_资讯_56之窗百科网

DeepSeek发布新论文 提出条件记忆提升模型表现

   2026-01-14 01:31:48 财联社56之窗百科网17
核心提示:DeepSeek于12日晚发布了一篇新论文《基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度》。该论文由北京大学与DeepSeek共同完成,合著作者中包括梁文锋

DeepSeek于12日晚发布了一篇新论文《基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度》。该论文由北京大学与DeepSeek共同完成,合著作者中包括梁文锋。论文提出了一种称为条件记忆的技术,通过引入可扩展的查找记忆结构,在相同参数和算力条件下显著提升了模型在知识调用、推理、代码及数学任务上的表现。DeepSeek还开源了相关的记忆模块Engram。

 
 
更多>同类资讯
推荐图文
推荐资讯
点击排行