公告:为给大家更好的使用体验,同城网今日将系统升级,页面可能会出现不稳定状态,由此给您带来的不便,敬请谅解!
升级时间:2016-7-24 11:00 -- 2016-7-24 15:00

澳洲同城网

查看: 7986|回复: 0
打印 上一主题 下一主题

DeepSeek冲击全球:日本半导体股下挫,纳指期货大跌(图)

[复制链接]

33万

主题

19

金豆

25万

积分

网站编辑

Rank: 8Rank: 8

性别
保密
积分
256690
金豆
19
鲜花
0
主题
330095
帖子
330096
注册时间
2019-12-26
跳转到指定楼层
楼主
发表于 昨天 13:00 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式 来自: INNA

马上注册,结交更多同城好友,享用更多功能!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
1月27日周一,DeepSeek冲击全球算力,A股寒武纪大跌,日本半导体股下挫,美股纳指期货领跌。 截至发稿,寒武纪持续走低跌近10%,成交额超39亿元。


日经225指数盘中一度转跌,现涨0.033%。软银集团股价一度下跌5.4%,创下11月1日以来的最大跌幅;东京电子和Disco均跌超3%;英伟达的测试设备供应商爱德万测试跌8.2%。


上周,日本半导体股和受益于特朗普“星际之门”项目所带动的市场乐观情绪,表现尤为突出。然而周末,DeepSeek爆火,算力逻辑受到冲击,导致今日日本半导体股下挫。 分析师Holger Zschaepitz表示:“中国的DeepSeek可能代表了对美国股市最大的威胁,因为该公司似乎以极低的价格建立了一个突破性的人工智能模型,而无需依赖最先进的芯片,这引发了对数百亿美元资本支出是否有用的质疑,这些资金正被投入到这个行业中。 ”


受特朗普关税和反移民消息影响,美股三大股指期货齐跌,纳指期货领跌,截至发稿跌近2%。


外媒聚焦国产开源大模型DeepSeek,为何让美国科技巨头坐立难安 一周前,DeepSeek这个名字对多数人来说还很陌生,如今却成为全球科技媒体的头版热点。从MIT技术评论到《连线》,从VentureBeat到CNBC,各大媒体纷纷对这家中国AI初创公司投以高度关注。这家成立于2015年的公司,因其新发布的开源模型R1在性能和成本效率上的突破性表现,引发了整个AI行业的广泛讨论。


总结起来,外媒的关注主要有三点。 首先是核心技术创新方面,DeepSeek采用了独特的“思维链”推理架构。据MIT技术评论报道,R1模型通过重新设计训练流程,在保持高准确性的同时显著降低了内存占用和计算开销。 其次是对美国芯片管制失效的讨论。面对美国收紧的芯片出口管制,DeepSeek采取了双管齐下的应对策略。一方面,公司提前储备了大量英伟达A100芯片;另一方面,通过创新性地结合高性能和低功耗芯片,开发出更高效的训练方案。《连线》杂志评价这种方式"重塑了AI模型的基础架构"。 最后一点,从全球AI格局来看,DeepSeek的成功正在改变行业发展路径。VentureBeat指出,这打破了此前OpenAI、Anthropic和Google主导的专有闭源模型竞争格局。 CNBC认为,这种低成本、高效能的创新模式,正在挑战美国通过大规模资本投入推动AI发展的传统路径。 让我们来具体看看各大媒体是如何评价这一现象的。


MIT技术评论:美国出口限制未能如预期般削弱中国AI能力 DeepSeek的成功尤为令人瞩目,因为中国人工智能公司面临着日益严峻的美国芯片出口管制。然而,早期证据显示,这些制裁措施并未如预期般削弱中国的AI能力,反而迫使像DeepSeek这样的初创公司在效率、资源共享和合作方面进行创新。 为了开发R1,DeepSeek必须重新设计其训练过程,以减轻GPU的负担。该公司使用的是英伟达为中国市场定制的GPU,其性能被限制在顶级产品的半速。因此,DeepSeek不得不通过技术创新来克服这些硬件瓶颈。 微软AI前沿研究实验室的首席研究员迪米特里斯·帕帕利奥普洛斯表示,令他最为惊讶的是R1的工程简洁性。“DeepSeek更注重准确答案,而不是详细列出每一个逻辑步骤,这大大减少了计算时间,同时保持了高效性。” 训练大语言模型需要一支高水平的研究团队和大量的计算资源。著名企业家、前谷歌中国总裁李开复曾在接受媒体采访时表示,只有“前排玩家”才有能力投入到构建基础模型的工作中,因为这一过程资源消耗极大。加之美国的芯片出口管制政策,局势变得更加复杂。 然而,DeepSeek的成功恰恰源于这种困境。早在美国制裁预期到来之前,该公司就提前囤积了大量的英伟达A100芯片,数量可能超过1万颗甚至5万颗。正是基于这一战略性的资源积累,DeepSeek才能够利用这些高性能芯片和低功耗芯片的组合,开发出其创新性的AI模型。 DeepSeek通过创新,找到了一种既能减少内存使用又能加快计算速度的方法,且不会显著影响准确性。卡内基国际和平基金会AI研究员马特·希恩表示:“美国的出口管制实际上将中国公司逼入了一个角落,它们必须在有限的计算资源下更加高效。这将促使更多的AI企业通过更精细的资源分配和协作生存下来。” 《连线》:DeepSeek正向西方AI巨头发起挑战 事实上,在许多关键指标上,如性能、成本和开放性等方面,DeepSeek正在向西方AI巨头发起挑战。 DeepSeek的成功凸显了美中科技冷战中的一个意外结果。美国的出口管制严重限制了中国科技公司在西方方式上与AI竞争的能力——即通过不断购买更多芯片并延长训练时间来无限扩展。因此,大多数中国公司将重点放在下游应用上,而不是打造自己的模型。 但通过最新的发布,DeepSeek证明了赢得竞争的另一种方式:通过重塑AI模型的基础结构,使用有限的资源更加高效。 悉尼科技大学的副教授Marina Zhang解释道:“与许多依赖高端硬件的中国AI公司不同,DeepSeek专注于最大化软件驱动的资源优化。DeepSeek拥抱开源方法,汇聚集体智慧并促进协同创新。这种方式不仅缓解了资源限制,还加速了前沿技术的开发,使DeepSeek与更封闭的竞争者有所不同。” DeepSeek愿意与公众分享这些创新,赢得了全球AI研究社区的广泛好感。对于许多中国AI公司而言,开发开源模型是追赶西方同行的唯一途径,因为开源能够吸引更多的用户和贡献者,进而帮助模型成长。 “他们现在已经证明,尖端模型可以用相对较少的资金甚至更低的资源来打造,而当前的模型构建规范仍然有很大的优化空间,”Marina Zhang表示。“未来,我们肯定会看到更多的类似尝试。” VentureBeat:DeepSeek打乱了AI模型市场格局 DeepSeek R1的问世,已经彻底打乱了AI模型市场的格局。之前几个月,OpenAI、Anthropic和Google之间一直在争夺最强的专有模型,而Meta也常常推出“差不多”的开源竞争者。但这一次的不同之处在于,DeepSeek位于中国,这个与美国关系复杂的“竞争友好”国,其科技行业直到目前为止一直被视为逊色于硅谷。 因此,DeepSeek的迅速崛起引发了美国和西方科技圈的广泛担忧,许多科技从业者开始怀疑OpenAI以及整个“大科技”战略,即通过投入更多资金和算力(GPU)来推动更强大模型的诞生。 然而,一些西方科技领袖对DeepSeek的崛起表达了积极的看法。 Netscape浏览器联合创始人、著名风险投资公司Andreessen Horowitz(a16z)的普通合伙人马克·安德森发帖称:“DeepSeek R1是我见过的最令人惊叹和印象深刻的突破之一——作为开源,它是送给世界的巨大礼物!”


MetaAI研究部门FAIR首席科学家杨立昆也称:“对于那些看到DeepSeek表现后认为:‘中国在AI上超过了美国’的人:你们的解读错了。正确的理解是:‘开源模型超过了专有模型。’DeepSeek受益于开放研究和开源(例如Meta的PyTorch和Llama)。他们提出了新的想法,并在其他人工作的基础上构建。由于他们的工作是公开的,所有人都可以从中受益。这就是开放研究和开源的力量。”


即便是Meta的创始人和CEO马克·扎克伯格似乎也想通过自己的帖子来回应DeepSeek的崛起。他在Facebook上承诺,Meta今年发布的新版本开源AI模型家族Llama将成为“领先的最先进模型”。 扎克伯格写道:“2025年将是AI发展的关键年份。我预期Meta AI将成为领先的助手,为超过10亿人服务,Llama 4将成为领先的最先进模型,我们将打造一个AI工程师,开始为我们的研发工作贡献越来越多的代码。为了支撑这一目标,Meta正在建设一个2GW+的数据中心,它的规模足以覆盖曼哈顿的大部分区域。我们将在2025年上线约1GW的计算能力,年底时将拥有超过130万颗GPU。我们计划今年投资600-650亿美元的资本支出,同时大幅扩展我们的AI团队,并且我们拥有继续投资的资本。这个努力规模巨大,未来几年将推动我们的核心产品和业务,释放历史性的创新,并延续美国的技术领导地位。让我们一起努力打造!” CNBC:中国新兴AI模型威胁美国主导地位 DeepSeek的崛起引发了硅谷的恐慌,因为它发布的AI模型不仅能超越美国顶尖技术,且成本远低于美国同行,使用的芯片也远不如美国的高端产品强大。 这一进展让人担忧美国在人工智能领域的全球领先地位是否正在缩小,同时也质疑了大型科技公司在AI模型和数据中心建设上投入巨额资金的策略。 微软CEO萨提亚·纳德拉在达沃斯世界经济论坛上表示:“看到DeepSeek的新模型,令人印象深刻,尤其是在它们如何有效地构建开源模型,推理时的计算非常高效,计算资源使用得非常优化。我们应该非常认真地对待中国在这一领域的进展。” Benchmark公司的普通合伙人Chetan Puttagunta则表示:“DeepSeek通过一种叫做‘蒸馏’的方法,利用一个大模型来帮助小模型在特定领域变得更智能。这实际上非常具备成本效益。” Perplexity公司CEO阿拉文·斯里尼瓦斯也指出:“需求是发明之母。因为DeepSeek必须找到解决办法,最终它们创造出了更高效的技术。”
免责声明
澳洲同城网是一个免费的公共信息平台,网站内容由网友自由发布,发布者拥有所发布信息的版权同时承担相应责任; 若所发布信息侵犯了您的权利,请反馈给澳洲同城网,我们核实后将进行相应处理!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则




外汇平台
金牌家政
汽车网



















wuliu
你想了解我们吗?
联系我们
关注我们
官方微博 官方Facebook 官方Twitter
微信关注
官方微信公众号 官方微信服务号
官方公众号 客服微信
快速回复 返回顶部 返回列表