周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?

  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利...

  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利润率等关键数据,引发行业震动。

  数据显示,若按理论定价计算,其单日成本利润率高达545%,这一数字刷新了全球AI大模型领域的盈利天花板。

  业内分析指出,DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断。DeepSeek此次“透明化”披露,不仅展示了其技术实力与商业潜力,更向行业传递明确信号:AI大模型的盈利闭环已从理想照进现实。

  DeepSeek最新发布

  3月1日,DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。

  文章写道:“DeepSeek-V3/ R1推理系统的优化目标是:更大的吞吐,更低的延迟。”

  为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。

  值得注意的是,文章还率先披露了DeepSeek的理论成本和利润率等关键信息。

  根据DeepSeek官方披露,DeepSeek V3和R1的所有服务均使用H800 GPU,使用和训练一致的精度,即矩阵计算和dispatch 传输采用和训练一致的FP8格式,core-attention计算和combine传输采用和训练一致的BF16,最大程度保证了服务效果。

  另外,由于白天的服务负荷高,晚上的服务负荷低,因此DeepSeek实现了一套机制,在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。

  在最近24小时(2025年2月27日12:00至28日12:00)的统计周期内:GPU租赁成本按2美元/小时计算,日均成本为87072美元;若所有输入/输出token按R1定价(输入1元/百万token、输出16元/百万token)计算,单日收入可达562027美元,成本利润率高达545%。

周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?

  不过,DeepSeek官方坦言,实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。

  DeepSeek的高利润率源于其创新的推理系统设计,核心包括大规模跨节点专家并行(EP)、计算通信重叠与负载均衡优化三大技术支柱:专家并行(EP)提升吞吐与响应速度,针对模型稀疏性(每层仅激活8/256个专家),采用EP策略扩展总体批处理规模(batch size),确保每个专家获得足够的计算负载,显著提升GPU利用率;部署单元动态调整(如Prefill阶段4节点、Decode阶段18节点),平衡资源分配与任务需求。

  计算与通信重叠隐藏延迟,Prefill阶段通过“双batch交错”实现计算与通信并行,Decode阶段拆分attention为多级流水线,最大限度掩盖通信开销。

  全局负载均衡避免资源浪费,针对不同并行模式(数据并行DP、专家并行EP)设计动态负载均衡器,确保各GPU的计算量、通信量及KVCache占用均衡,避免节点空转。

  简单来说,EP就像是“多人协作”,把模型中的“专家”分散到多张GPU上进行计算,大幅提升Batch Size,榨干GPU算力,同时专家分散,降低内存压力,更快响应。

  DeepSeek在工程层面进一步压缩成本。昼夜资源调配:白天高峰时段全力支持推理服务,夜间闲置节点转用于研发训练,最大化硬件利用率;缓存命中率达56.3%:通过KVCache硬盘缓存减少重复计算,在输入token中,有3420亿个(56.3%)直接命中缓存,大幅降低算力消耗。

  影响多大?

  有分析称,DeepSeek此次披露的数据,不仅验证了其技术路线的商业可行性,更为行业树立了高效盈利的标杆:其模型训练成本仅为同类产品的1%—5%,此前发布的DeepSeek-V3模型训练成本仅557.6万美元,远低于OpenAI等巨头;推理定价优势方面,DeepSeek-R1的API定价仅为OpenAI o3-mini的1/7至1/2,低成本策略加速市场渗透。

  业内分析指出,DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断。DeepSeek此次“透明化”披露,不仅展示了其技术实力与商业潜力,更向行业传递明确信号:AI大模型的盈利闭环已从理想照进现实,标志着AI技术从实验室迈向产业化的关键转折。

  中信证券认为,Deepseek在模型训练成本降低方面的最佳实践,料将刺激科技巨头采用更为经济的方式加速前沿模型的探索和研究,同时将使得大量AI应用得以解锁和落地。算法训练带来的规模报酬递增效应以及单位算力成本降低对应的杰文斯悖论等,均意味着中短期维度科技巨头继续在AI算力领域进行持续、规模投入仍将是高确定性事件。

  本周以来,DeepSeek开启“开源周”,给人工智能领域扔下数颗“重磅炸弹”。回顾DeepSeek这五天开源的内容,信息量很大,具体来看:

  周一,DeepSeek宣布开源FlashMLA。FlashMLA是DeepSeek用于Hopper GPU的高效MLA解码内核,并针对可变长度序列进行了优化,现已投入生产;

  周二,DeepSeek宣布开源DeepEP,即首个用于MoE模型训练和推理的开源EP通信库,提供高吞吐量和低延迟的all-to-all GPU内核;

  周三,DeepSeek宣布开源DeepGEMM。其同时支持密集布局和两种MoE布局,完全即时编译,可为V3/R1模型的训练和推理提供强大支持等;

  周四,DeepSeek宣布开源Optimized Parallelism Strategies。其主要针对大规模模型训练中的效率问题;

  周五,DeepSeek宣布开源Fire-Flyer文件系统(3FS),以及基于3FS的数据处理框架Smallpond。

  因此,有网友评论称:“《DeepSeek-V3/R1推理系统概览》技术文章是‘开源周彩蛋’,直接亮出了底牌!”

  至此,DeepSeek“开源周”的连载或许要告一段落了,但DeepSeek后续动作依然值得持续关注。

  来源:券商中国

  声明:数据宝所有资讯内容不构成投资建议,股市有风险,投资需谨慎。

  责编:林丽峰

本文来自作者[admin]投稿,不代表吹吹讯立场,如若转载,请注明出处:https://cc199.top/bm/202503_7961.html

(17)

文章推荐

  • 充电互联业务2024年实现大幅增长 能链智电涨逾12%

    周三,能链智电(NAAS.US)涨逾12%,报1.50美元。消息面上,此前,能链智电宣布,其充电互联业务在2024年实现大幅增长,全年新增注册用户约640万。这一增长进一步巩固了能链智电在中国新能源车充电市场的领先地位。截至2024年12月31日,能链智电的战略合作伙伴快电的累计注册用户已接近19

    2025年02月20日
    20
  • 全国政协委员傅川:建议将成熟的直播电商经验全国推广

    专题:中国经济前景广阔、大有可为——2025全国两会财经特别报道  来源:中国青年报  #2025两会观察#【全国政协委员傅川:#建议将成熟的直播电商经验全国推广#】今年全国两会,全国政协委员、中国科学院计算技术研究所高级工程师傅川关注直播电商话题。他认为,直播带货创造了大量的就业岗位,为更好

    2025年03月04日
    12
  • 午评:沪指早盘震荡微涨 大金融板块集体调整

    专题:2025年中国股市“转型牛”基础夯实投资主线在科技  3月7日消息,沪指早盘窄幅震荡接近平盘,创指跌近1%。板块方面,有色板块集体走高,金属锌方向领涨,新威凌30cm涨停,罗平锌电、华锡有色等盘中涨停;军工板块盘中走强,火炬电子触及涨停;钢铁股集体活跃,三钢闽光、柳钢股份涨幅居前;大金融

    2025年03月07日
    10
  • 美财长贝森特:公共支出减少可能导致经济放缓

      美国财政部官员斯科特·贝森特(ScottBessent)周五表示,随着经济从公共支出转向更多私人支出,美国经济可能会放缓,他称这是实现更可持续增长所需的“排毒期”。

    2025年03月08日
    9
  • 凡客v网上商城(凡客V平台倒手 虎都接盘)

    北京商报讯(记者邵蓝洁)男装虎都发布公告,旗下虎都中国与神州集客及李炳棋成立合营公司,收购凡客旗下V+线上平台。合营公司的注册资本为2000万元;其中,虎都中国拟出资1000万元,占合营公司注册资本的50%,神州集客出资600万元,占注册资本30%,李炳棋出资400万元,占注册资本的20%。20

    2025年04月05日
    4
  • 北京朝阳区降为低风险地区朝阳区何时降低风险等级

    北京风险地区清零!北京“摘星”!APP1、月16日,国务院客户端小程序的最新数据显示,北京市的最后一个中风险地区已经降级,这意味着北京市的中高风险地区已全部清零,全市均为低风险地区。这一消息令人振奋,标志着北京在疫情防控方面取得了显著成效。2、截至4月21日24时,朝阳区酒仙桥街道二街坊近14天累

    2025年04月05日
    3
  • 奇瑞新车奇瑞新车上市

    奇瑞六大新车亮相,个个都有杀手锏,能跟比亚迪“掰手腕”?奇瑞TJ-1C-DM杀手锏:C-DM混动系统+使用92号汽油作为奇瑞汽车旗下全新品类的车型,奇瑞TJ-1主打轻越野,定位紧凑型SUV,预计将在今年7-8月上市。外观方面,TJ-1的造型设计摆脱了奇瑞现阶段的设计风格,线条平直硬朗,加上点

    2025年04月07日
    3
  • 北京市疫情最新消息北京市疫情最新公布

    北京最新疫情风险等级是怎样的1、北京最新疫情风险等级情况如下:高风险地区:北京市昌平区北七家镇宏福苑小区目前被划定为高风险地区。中风险地区:北京市昌平区东小口镇森林大第家园社区被划定为中风险地区。注意:疫情风险等级会根据疫情形势的变化而调整,建议关注官方发布的最新信息以获取最准确的疫情风险等级情况

    2025年04月08日
    6
  • icc入口(全程直播赛事 百度成ICC官方新媒体直播平台)

    7月17日,今年的国际冠军杯(ICC)正式打响,作为近年来国际足坛最具影响力的季前赛事,比赛吸引了来自全球球迷的关注。今年,百度与ICC达成全面合作,以ICC官方新媒体直播平台身份深度合作,旗下百度App、好看视频、百度贴吧等产品全程直播18场比赛,并通过国际冠军杯及参赛俱乐部队伍官方百家号,发布赛

    2025年04月10日
    4
  • 故宫5月1日起开放故宫5月1日起开放时间

    2021故宫文华殿开放时间年故宫文华殿自2021年5月1日起开放。关于故宫文华殿的开放,有以下几点需要注意:展览时间:庙堂仪范——故宫博物院藏历代人物画特展在2021年5月1日至2021年6月30日期间于文华殿举办。预约参观:展览实行预约入场,观众需提前10天开始预约,全天分上午场和下午场,额满为

    2025年04月15日
    3

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年03月02日

    我是吹吹讯的签约作者“admin”!

  • admin
    admin 2025年03月02日

    希望本篇文章《周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?》能对你有所帮助!

  • admin
    admin 2025年03月02日

    本站[吹吹讯]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年03月02日

    本文概览:  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利...

    联系我们

    邮件:吹吹讯@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们