分享好友 资讯首页 资讯分类 切换频道

北大与DeepSeek联合开源DSpark框架 提升大模型推理效率

2026-06-27 22:5111056之窗百科网搜狐网

今日,DeepSeek 联合北京大学发布了DSpark推理加速框架,旨在解决大语言模型在高并发生产环境中的推理效率问题。该框架已应用于DeepSeek-V4-Flash和DeepSeek-V4-Pro的预览版服务引擎中,在同等吞吐量水平下,单用户生成速度提升了60%至85%。相关论文、训练代码等已在GitHub上开源。

大语言模型生成文本时采用自回归方式,每生成一个新token都需要一次完整的前向传播,这导致推理延迟随输出长度线性增长。推测解码技术通过一个小模型快速生成候选token,再由大模型批量验证,从而提升生成速度。然而,推测解码的实际加速效果受制于候选生成质量和验证阶段对目标模型计算资源的占用。

目前主流方案分为两派:自回归式草稿模型逐token串行生成候选序列,依赖关系建模能力强但生成延迟随候选长度线性增长;并行式草稿模型则在一个前向传播内一次性产出全部候选token,生成延迟几乎与候选长度无关。但并行生成每个位置时无法依赖先前已采样的token,导致接受率迅速衰减,浪费目标模型计算资源。

为解决上述瓶颈,DSpark提出了两项互补机制。在候选生成阶段,DSpark采用半自回归架构,主干网络一次性产出所有候选位置的隐藏状态和基础logits,随后轻量级顺序模块逐token注入前缀依赖信息。实验表明,少量自回归依赖的引入在参数效率上优于单纯堆叠并行层。

收藏 0
打赏 0
夏健哆10秒16夺得男子百米冠军 刷新PB力压对手
6月27日,在全国田径冠军赛男子百米决赛中,夏健哆以10秒16的成绩刷新个人最好成绩,并以0.004秒的微弱优势击败邓信锐夺冠。吴昊霖以10秒18同样刷新个人最佳,获得第三名

0评论2026-06-2811

曾爆火的“拉面哥”再开实体面馆 与“大衣哥”完成五年之约
6月27日,曾在网上爆红的“拉面哥”程运付与家人在山东省临沂市兰陵县新开了一家拉面店。面馆开业当天,“大衣哥”朱之文特意前往店里祝贺,实现了两人五年前的约定。程运付透露,面馆一周前刚刚开业

0评论2026-06-2811

“毒纸尿裤事件”记者回应调查过程 多方声音交织引发关注
6月18日,《经济参考报》发布调查报道,称多名消费者反馈家中婴幼儿使用部分品牌纸尿裤后出现反复红臀、皮肤红肿破溃等问题,停用后症状明显缓解

0评论2026-06-2811