中信证券:看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   中信证券研究 文|徐涛  杨泽原  雷俊成  王子源  夏胤磊  程子盈   DeepSeek...

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  中信证券研究 文|徐涛  杨泽原  雷俊成  王子源  夏胤磊  程子盈

  DeepSeek通过工程化能力创新,实现了大模型训练和推理算力成本的极致优化,也为端侧部署高性能模型提供新的方向。本篇报告我们通过分析DeepSeek V3和R1模型论文,理解其核心逻辑是“按需分配算力,最小化冗余计算”,使得千亿级模型在低成本硬件(甚至边缘设备)上高效运行成为可能,为大规模商业化落地提供了技术基础。我们看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地:建议核心关注晶圆代工、国产算力芯片、定制化存储、终端品牌、SoC五大方向。

  ▍DeepSeek如何实现的训练成本降低?

  1)架构创新: DeepSeek-V3的基础架构中采用了DeepSeekMoE专家架构和MLA多头潜在注意力机制,DeepSeekMoE通过细粒度专家分配、共享专家及无辅助损失负载均衡策略优化传统MoE,提升计算资源效率;MLA通过低秩联合压缩减少注意力键值缓存占用,提升计算效率、减少内存消耗。

  2)FP8混合精度训练:在全球主流大模型中率先采用FP8低精度数据进行大规模训练,大部分核心计算用FP8提升速度、降低内存用量,部分关键操作保留高精度确保动态稳定性。

  3)训练工程优化:DeepSeek在主流大模型中率先采用硬盘充当输入端缓存,设计DualPipe算法实现高效流水线并行,融合前后向通信阶段,减少阻塞;采用定制化高效跨节点all-to-all通信内核降低通信开销;通过重计算、EMA、共享向量和输出头减少内存占用。

  4)数据策略优化:应用多token预测机制MTP,增加训练信号密度,减少20%训练迭代次数,帮助模型捕捉长距离依赖关系。

  ▍DeepSeek如何实现的推理成本降低?

  DeepSeek-V3对推理的预填充和解码两个阶段都优化了专家使用效率:预填充阶段MoE用EP32及冗余专家策略提升效率,解码阶段探索动态路由减少通信开销;还通过支持FP8、INT8量化和提供蒸馏版本,实现低精度量化与模型压缩,减少显存占用。DeepSeek的开源生态可以更好支持硬件厂商适配,例如可以对MLA算子优化提升推理效率,DeepSeek-R1发布后国内外芯片厂商快速响应支持DeepSeek。1月25日,AMD宣布已将新的DeepSeek-V3集成到Instinct MI300X GPU上并经过SGLang对推理过程进行了优化,英伟达、英特尔也随后在1月31日官宣支持。国内厂商都已经官宣完成对DeepSeek的适配,国产算力成为相对稳定可靠的选项,支撑国产大模型从研发走向商业化。

  ▍从DeepSeek算力需求看AI芯片设计方向?

  DeepSeek 在论文的芯片设计意见指导中指出通信和计算同等重要,计算方面降低精度和内存需求是关键。在通信硬件优化上,DeepSeek建议开发独立通信协处理器,实现计算与通信物理分离,同时建议融合网络架构,统一IB和 NVLink的网络协议栈,统一通信接口以简化编程复杂度和降低通信延迟;在计算硬件优化上,建议提升 FP8 计算精度,并支持分块量化与在线量化,减少访存开销,提升推理效率。我们认为DeepSeek建议带来两点启示:

  1)“推理速度”基本90%是由decoding阶段决定的,因此内存容量决定大模型推理速度,我们认为内存升级仍是算力芯片升级的重点方向,看好近存计算发展。

  2)我们认为在模型开源的策略下,DeepSeek-R1蒸馏后的小模型性能有望持续快速提升,帮助端侧硬件加速接入,助力AI应用全面落地。我们看好品牌商和SoC芯片厂商的成长机遇。

  ▍风险因素:

  算力芯片供应链风险;芯片产能供给不足的风险;互联网大厂资本开支不及预期;相关产业政策出台力度不及预期;AI技术及应用发展不及预期;芯片技术迭代不及预期;国产先进制程量产进展不及预期;行业竞争加剧等。

  ▍投资策略:

  我们看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地:

  1)云端:DeepSeek有望开启全新的Scaling Law,模型重心逐步从预训练切换到强化学习、推理阶段,助力算力需求持续增长。

  2)终端:我们看好DeepSeek带来模型轻量化的全面升级,端侧硬件接入有望加速爆发,助力AI应用全面落地,建议关注品牌厂商,SoC芯片厂商。

本文来自作者[admin]投稿,不代表吹吹讯立场,如若转载,请注明出处:https://cc199.top/bm/202502_4892.html

(22)

文章推荐

  • 新年伊始券商调研忙,这些公司成为券商关注重点

      炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  2025年1月以来,券商调研持续活跃,多家公司获得超过10家券商调研。  据券商中国记者粗略统计,水晶光电新年以来获得了59家券商的调研,广信材料已经接待10次券商等机构的调研。从调研的方向上看,科技类公司仍然是关注

    2025年01月20日
    24
  • 《哪吒2》海外未映先火,多国观众期待值拉满,喊话:“等不及了”

      【环球网报道记者刘博洋】2025年春节档,《哪吒2》登顶中国影史票房冠军宝座。这一成绩不仅刷新了前作《哪吒1》的纪录,更以“单一市场超10亿美元”的预测,成为全球动画电影领域的新焦点。  自《哪吒2》宣布海外上映计划以来,全球影迷的期待持续升温。在社交媒体上,不少外国网友在相关视频节目评

    2025年02月06日
    24
  • 超七成财险公司综合成本率超100%,凯本财险涨幅最大,国寿财险“破百”仍大赚!

      来源:观潮财经  2024年Q4,五成非上市财险公司综合成本率“破百”但依旧保持盈利。  截至目前,共75家财险公司披露了2024年第四季度偿付能力报告,其中除劳合社不适用外,其余74家险企均披露了“三率”指标。  据观潮财经统计,74家非上市财险公司2024年Q4综合成本率、费用率、赔

    2025年02月24日
    24
  • 八方股份:全资子公司通过高新技术企业认定

    证券日报网讯3月6日晚间,八方股份发布公告称,公司全资子公司八方新能源(苏州)有限公司于近日取得江苏省科学技术厅、江苏省财政厅、国家税务总局江苏省税务局联合颁发的《高新技术企业证书》。

    2025年03月07日
    12
  • 量子之歌2025财年Q2财报:净利润1.3亿元,战略转型驱动多元生态加速扩张

      炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  北京时间3月11日,量子之歌(NASDAQ:QSG)公布截至2024年12月31日的2025财年第二季度财报。报告期内,量子之歌实现营收约7.3亿元(人民币,下同);净利润约1.3亿元,同比增长17.8%。  公司稳

    2025年03月11日
    10
  • 凝心聚力向高质量发展迈进

      张艺良  团结谋发展,奋发向未来。3月11日,十四届全国人大三次会议圆满完成各项议程,在北京胜利闭幕。与会代表不负重托,履职尽责,为全面贯彻新发展理念,加快构建新发展格局,扎实推动高质量发展建言献策。我们对大会的成功表示热烈祝贺!  过去一年,面对外部压力加大、内部困难增多的复杂严峻形势,我

    2025年03月12日
    13
  • 每天净赚2.36亿!茅台年报“印钞机”背后的终极秘密

    4月2日晚,贵州茅台(600519.SH)交出了一份令行业和投资者都深感振奋的答卷:2024年营业总收入1741.44亿元,同比增长15.66%;归母净利润862.28亿元,同比增长15.38%,双双保持两位数增长。在行业调整期,茅台的高增长难能可贵,以“高增长、高分红、高韧性”的姿态,为市场注入

    2025年04月03日
    4
  • 四川邻水县疫情源头指向沪返乡人员邻水县应对新型冠状病毒感染肺炎疫情应急指挥部公告

    四川邻水5天超200人感染,本轮疫情的源头是什么?四川邻水最近疫情非常严重,本轮疫情的源头是新冠病毒奥秘克戎BA2变异病株,当地已经采取了紧急防疫措施。广安市邻水县发生的疫情还是非常让人揪心的,我希望邻水县的疫情可以得到很好的控制,孩子们能顺利高考和中考。四川邻水5天超过200人感染,还存在隐藏

    2025年04月06日
    3
  • 韶钢松山股票韶钢松山股票分析预测

    宝钢集团旗下有多少上市公司宝钢集团旗下拥有多家上市公司,其中包括:韶钢松山(股票代码:000710)八一钢铁(股票代码:600581)宝钢股份(股票代码:600019),这是宝钢集团在上海证券交易所的上市公司,也是旗下唯一在上一年度实现盈利的公司,净利润达到1亿元。旗下有8大上市公司。其中有

    2025年04月09日
    3
  • 广东新增本土确诊15例、本土无症状6例广东新增13例本土无症状详情

    10月19日广州新增本土确诊6例和本土无症状44例详情公布新增6例本土确诊病例和44例本土无症状感染者情况:本土确诊病例1:女,55岁。居住在白云区金沙街道。本土确诊病例2:男,31岁。居住在白云区松洲街道。本土确诊病例3:女,35岁。居住在白云区鹤龙街道。本土确诊病例4:男,3岁。居住在海珠区沙

    2025年04月15日
    3

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年02月15日

    我是吹吹讯的签约作者“admin”!

  • admin
    admin 2025年02月15日

    希望本篇文章《中信证券:看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地》能对你有所帮助!

  • admin
    admin 2025年02月15日

    本站[吹吹讯]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年02月15日

    本文概览:  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   中信证券研究 文|徐涛  杨泽原  雷俊成  王子源  夏胤磊  程子盈   DeepSeek...

    联系我们

    邮件:吹吹讯@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们