公告:为给大家更好的使用体验,同城网今日将系统升级,页面可能会出现不稳定状态,由此给您带来的不便,敬请谅解!
升级时间:2016-7-24 11:00 -- 2016-7-24 15:00

澳洲同城网

查看: 3888|回复: 0
打印 上一主题 下一主题

DeepSeek大事不断,首次披露理论成本利润率545%(图)

[复制链接]

33万

主题

19

金豆

25万

积分

网站编辑

Rank: 8Rank: 8

性别
保密
积分
256690
金豆
19
鲜花
0
主题
334616
帖子
334617
注册时间
2019-12-26
跳转到指定楼层
楼主
发表于 前天 13:00 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式 来自: INNA

马上注册,结交更多同城好友,享用更多功能!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
3月1日,DeepSeek接连传出两则重磅消息: 1、DeepSeek首次披露:其V3/R1推理系统的理论成本利润率高达545%,展现出显著的技术与成本优势。 2、潞晨科技宣布暂停DeepSeek API服务:用户需尽快使用账户余额,未使用部分将全额退款。 消息揭示了DeepSeek在技术创新与商业模式之间的双重挑战。 // DeepSeek首次披露理论利润率 // 3月1日,DeepSeek在知乎平台开设了官方账号,并发布一篇技术文章——《DeepSeek-V3/R1推理系统概览》。文章显示,DeepSeek-V3/R1推理系统的优化目标是实现更大的吞吐量和更低的延迟。为了达成这两个目标,DeepSeek采用了大规模跨节点专家并行(EP)方案。这种方案虽然增加了系统的复杂性,但能有效提升性能。 DeepSeek在文章中详细介绍了如何通过EP技术增长批量大小、隐藏传输耗时以及进行负载均衡,从而优化整个推理系统的性能。通过这些技术手段,DeepSeek能够处理更大规模的数据,同时保持或提高响应速度。以下是预填充阶段的计算-通信重叠示意图:


解码阶段也采用了类似的策略,但更加精细,将Attention层进一步细分为两步,使用了五阶段流水线 (5-stage pipeline),实现更流畅的通信-计算重叠。


在成本控制方面,DeepSeek的表现尤为突出。根据官方披露的数据,V3/R1的训练成本仅为557.6万美元,不到OpenAI GPT-4o模型的1/20。其推理成本也极具竞争力,每百万token的定价仅为16元,相比OpenAI低了近70%。基于这些优化,DeepSeek的理论利润率高达545%,显示出其在成本控制和效率提升方面的巨大潜力。





// 潞晨科技暂停DeepSeek API服务 // 尽管DeepSeek在技术上取得了显著突破,但其基于MaaS的商业模式却面临严峻挑战。3月1日,潞晨科技官微宣布:“尊敬的用户,潞晨云将在一周后停止提供DeepSeek API服务,请尽快用完您的余额。如果没用完,我们全额退款。”


当天下午,潞晨科技CEO尤洋发文回应DeepSeek公布的理论成本利润率。争议焦点主要集中在以下几点: 数据参考性问题:尤洋认为文章中合并计算了DeepSeek网页、APP和MaaS API的token数,无法准确反映MaaS的真实成本和使用情况。MaaS是ToB工具,与ToC的网页和APP在性能要求和成本结构上存在显著差异。 MaaS性能与稳定性:春节期间DeepSeek APP和网页频繁掉线,延迟高达15分钟以上,无法满足ToB客户对低延迟和高稳定性的要求。MaaS作为ToB服务,需保证首字响应≤2秒、单token处理≤100ms,现有技术难以达标。 商业模式可持续性:MaaS需时刻保持超负荷运转,且需准备5倍于实际需求的机器资源以应对突发流量,导致成本高企。高投入与低毛利的矛盾使得MaaS模式难以盈利。 技术创新的实际贡献:DeepSeek在AI基础设施上依赖英伟达GPU和已有技术(如MOE架构、PD分离),并未提出颠覆性算法。中小云厂商吹嘘推理速度提升10倍,但缺乏实际盈利案例,技术优势未能转化为商业成功。
免责声明
澳洲同城网是一个免费的公共信息平台,网站内容由网友自由发布,发布者拥有所发布信息的版权同时承担相应责任; 若所发布信息侵犯了您的权利,请反馈给澳洲同城网,我们核实后将进行相应处理!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则




外汇平台
金牌家政
汽车网



















wuliu
你想了解我们吗?
联系我们
关注我们
官方微博 官方Facebook 官方Twitter
微信关注
官方微信公众号 官方微信服务号
官方公众号 客服微信
快速回复 返回顶部 返回列表