| Contact Us | CHT | Mobile | Wechat | Weibo | Search:
Welcome Visitors | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

Home

温哥华资讯

Realty

Education

Finance

Immigrants

Yellow Page

Travel

大模型推理最高提速85%!deepseek发表重磅论文


请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!
《科创板日报》6月28日讯(记者 王耐)在6月中旬获得500亿融资后仅十几天,6月27日,DeepSeek团队联合北京大学发布论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》。


这不是一次模型版本的迭代,而是在原有DeepSeek-V4-Pro和DeepSeek-V4-Flash基础上增加了一个推测解码模块,重点在于工程落地层面的优化。

随DSpark一同开源的DeepSpec,是一个用于训练和评估推测解码草稿模型的全栈代码库,包含数据准备工具、草稿模型实现、训练代码和评估脚本,支持MIT许可。目前DeepSpec已内置DSpark、DFlash和Eagle3三种实现。


值得注意的是,DeepSeek创始人梁文锋位列论文作者名单。在完成首轮融资的当下,创始人依然亲自参与技术论文撰写,这在AI行业并不多见。



论文标题:《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》

论文链接:https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf

实测数据验证:同等吞吐下,V4-Flash提速60%-85%,V4-Pro 提升 57%-78%


不同于仅停留在实验室的算法优化,DSpark 已完成真实用户流量落地验证。该框架全面部署于 DeepSeek-V4-Flash、V4-Pro 线上服务,替代此前 MTP-1 生产基线。在同等系统总吞吐规模下,V4-Flash 单用户生成速度提升 60%-85%,V4-Pro 提升 57%-78%。

除了DeepSeek自家的大模型,DSpark也已经部署到了阿里旗下的Qwen3-4B、8B、14B,以及Gemma4-12B。三大评测领域分别是:数学推理、代码生成、日常对话。


DSpark兼容 Qwen、Gemma 等国内外主流基座,同时配套 DeepSpec 仓库、模型权重全部开源。这意味着,对于缺乏底层算法团队的中小企业、ToB 服务商,无需投入巨额研发即可复用成熟推理优化方案,大幅降低大模型私有化部署、线上服务的落地门槛,智能体、工业代码、金融舆情等场景规模化落地速度有望加快。



论文数据显示,DSpark 在全部目标模型、全部评测领域下,稳定超越自回归基线 Eagle3 与并行基线 DFlash。以 Qwen3-4B/8B/14B 为例,宏平均接受长度相对 Eagle3 提升 30.9%、26.7%、30.0%;相对 DFlash 提升 16.3%、18.4%、18.3%。这一优势具备跨模型的泛化能力,在Gemma4-12B目标模型上同样取得了一致的性能增益。

除整体提升外,论文实验数据还揭示了显着的领域差异效应::结构化任务(如数学推理、代码生成)的可接受长度天然更高(例如Qwen3-4B在数学任务上平均为5.57,代码任务为5.12),而开放式对话场景则明显偏低(仅3.49)。

论文也指出当前方案存在局限:对于本身可预测性极低、接受率偏低的复杂查询,这部分前置草稿算力无法回收。未来的优化方向可在草稿模型内部引入难度感知的早退出机制,使此类请求能够跳过完整块生成流程。
不错的新闻,我要点赞     还没人说话啊,我想来说几句
Prev Page12Next Page
Note:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • _VIEW_NEWS_FULL
    _RELATED_NEWS:
    _RELATED_NEWS_MORE:
    _POSTMYCOMMENT:
    Comment:
    Security Code:
    Please input the number which is shown on the following picture
    The Captcha image
      _TODAYMOSTREAD
    瞒不住了!38岁刘亦菲高调官宣喜讯
    Costco7月新品曝光!这些爆款热卖
    尹大卫访华提前返程 加国有大动作
    急诊苦等10小时 大温女子出门倒地
    快冲!温村世界杯淘汰赛门票价暴跌
    加国诡异挑战爆红 警方集体发警告
    无处安息 列治文终于拟建纪念花园
    BC这个网红公园关闭 律师指或违宪
    人才流失加剧 温村的底气还剩多少
    吓人!加国女子遛狗被灰熊一路逼近
      _TOPIC_MOSTREAD
    谁拿第一?全球智商排名来了,中美
    并非找不到工作!今年毕业最残酷的
    黄石惊魂!野牛顶伤12岁儿童送医
    哈工大录取通知书,回归"薄薄的一
    职高女生胸口纹蝴蝶引全网围攻,美
    国产AI高考708分,这款模型靠什么
    "我的电影党课"《四渡》专场举办:
    692、668、644,三胞胎兄弟高考分
    马云低调现身哈佛、MIT校园 被赞
    让机器人钻进血管治病 梦想成真
      随时阅读新闻

    加西网微信

    大温优惠小红书

    温哥华地产中心微信

    Android: 加西网
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    Page Generation: 0.0350 Seconds and 5 DB Queries in 0.0024 Seconds