“硬核掀桌”之后,DeepSeek留给人工智能4个新问题(图) - 澳洲同城网

不曾想到，这个春节，最火爆的话题，不是旅游与消费，而是DeepSeek与人工智能。上至美国总统特朗普，中至全球所有AI公司，下至全球数十亿关注AI进展的用户，在最近十余天之内都在讨论、研究和热议DeepSeek。从1月20日DeepSeek公司（全称杭州深度求索人工智能基础技术研究有限公司）发布DeepSeek-R1算起，十余天内，在全球范围内快速掀起关注热潮，成为AI发展历史上的现象级事件之一。至1月27日，在苹果App Store中国、美国区免费榜上，DeepSeek均成为第一，超过了来自OpenAI的ChatGPT。

Advertisements

除了铺天盖地的溢美之词之外，最值得关注的两则评论，分别来自美国总统特朗普和OpenAI首席执行官萨姆·奥尔特曼。特朗普认为，中国的DeepSeek公司“提出了一种更快、更便宜的人工智能方法，我认为这是积极的”，“（这）给我们（美国）的行业敲响警钟，我们需要专注于竞争以赢得胜利。” 萨姆·奥尔特曼于1月27日晚在社交媒体上发文，称“DeepSeek-R1是一款令人印象深刻的模型，尤其是考虑到它能够以这个价格提供”，“有这样的新竞争对手确实令人振奋。” 网红效应总会过去，一番喧闹之后，DeepSeek至少给AI领域留下四个需要深度思考和直面的真问题： DeepSeek能够从“网红”到“长红”吗？当DeepSeek已经用低价策略走出一条独特的路后，AI大模型还会继续走昂贵之路吗？ AI大模型到底要走开源还是闭源之路？以及，如何看待DeepSeek之后的中美AI技术水平差距？换言之，中国真的借DeepSeek之机实现“弯道超车”了吗？一鲸落，万物生，新的局面，也孕育着新的挑战。

Advertisements

DeepSeek能否从“网红”到“长红”？近几天的表现反映出，DeepSeek并不是一个网红AI产品这么简单，全球各界已经归纳出其爆火的几个原因。在开发背景方面，DeepSeek出自中国，而不是AI技术能力更为领先的美国；而且，其开发者也不是中国的互联网大厂，或者是AI“六小虎”等知名企业，而是一家中国初创公司，有西方网友甚至称其为“来自东方的神秘力量”。性价比方面，DeepSeek能力强、体验感佳，水平堪比OpenAI相关产品，但价格仅仅是后者的百分之几。在发展路径方面，DeepSeek与OpenAI“反着来”，成本低，所需算力少，一定程度上打破了AI大模型研发的“高价”神话。同时，与全球AI大模型龙头企业主要走闭源路线完全不同，DeepSeek技术路线完全开源，再次挑动了“开闭源之争”话题。 1 月 27 日，现象级国产游戏《黑神话：悟空》的制作人冯骥评价称，DeepSeek“可能是个国运级别的科技成果”。他点评DeepSeek说，“如果有一个 AI 大模型做到了以下（六条）的任何一条，都是超级了不起的突破。但DeepSeek 全部、同时做到了。”他提到的DeepSeek六大亮点，分别为强大、便宜、开源、免费、联网和本土。任何一款“网红”产品的产生都有其独特的内外部原因，同时，“网红”的宿命有两种，即成为“长红”或止于网红。在中国AI业内人士看来，自2023年7月成立起，DeepSeek已有过两次“高光时刻”。这次在全球火出圈，可以称得上是DeepSeek的第三次高光时刻。第一次在DeepSeek筹备成立期间。在2023年5月，正在组建DeepSeek公司的量化基金公司幻方就被媒体曝出可能拥有超过1万枚英伟达GPU，是几家头部大厂之外持有算力资源最多的公司。在当时，中国的AI“六小虎”也还在初创或筹建阶段。

Advertisements

业内一般认为，1万枚英伟达A100芯片是做自训大模型的算力门槛。从之后美国限制中国进口英伟达芯片的举措来看，DeepSeek的创始者极有远见和魄力。第二次是2024年5月，中美市场上“百模大战”最激烈的时刻，DeepSeek突然宣布对大模型大幅降价，掀起“价格战”，其降幅甚至达行业水平9成以上。之后中国AI全行业在两周内迅速跟进，外界直呼“让大模型降成白菜价”。此次DeepSeek走红之时，其在正式发布的资料中自豪地介绍，DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

DeepSeek公布的性能测试比对成果。图|DeepSeek官方微信可以预见，不用很久，DeepSeek将成为中国AI领域正式的“新贵”，估值有望超过“六小虎”水平。但与此同时，DeepSeek面临的国内外竞争也将更加激烈。从技术上看，细观全球业内人士评价可发现，DeepSeek-R1的水平与OpenAI o1“水平相当”，而不是领先。考虑到OpenAI o1发布已有4个月左右，之后OpenAI仍然在继续研究和精进，所以DeepSeek的水平能否与即将发布的新模型“水平相当”，或长期保持在较高技术水平上，还未可知。从国外竞争形势看，DeepSeek对美国AI行业的刺激很大，未来技术起点高于中国企业的美国AI行业必然会更加进取。 1月21日，特朗普在上任美国总统后第二天，就在白宫宣布了一项名为“星际之门”（Stargate）的人工智能项目，将由美国甲骨文公司、OpenAI和日本软银集团联合出资5000亿美元打造。除了特朗普的“星际之门”计划会更快速推进之外，近期包括OpenAI在内的AI巨头已经进行了战略微调。扎克伯格的Meta已宣布，2025年投资高达650亿美元用于与人工智能密切相关的项目，包括新建设一个规模巨大的AI数据中心以及大幅扩充AI领域人才，增加Meta人工智能团队实际规模。

Advertisements

在国内，各互联网大厂与AI“六小虎”、“四小龙”，甚至其他较小型的大模型公司，也必然会如美国企业般调整战略和技术路线，进行新竞争。未来有下一个DeepSeek的出现，也不是没有可能。同时，国内外对AI感兴趣的资本，以及各家互联网大厂，普遍有兴趣对DeepSeek或投资或合作。如此关键和微妙时刻，考验着DeepSeek掌舵人的智慧。全球AI发展形势“一月千里”，未来对于DeepSeek来说，不再是“不进则退”的局面，而是“不快则退”。想要从“网红”到“长红”，并不容易。

AI大模型还会继续走“烧钱”之路吗？贵、烧钱，是AI大模型效用足够激动人心的另一面。 AI大模型最烧钱的部分是算力，需要海量性能最先进的GPU芯片，其运行还需要巨量的电力能源支持；其技术核心是算法，需要大量顶级的人工智能专家和技术人员参与研发。因此可以看到，美国的AI大模型项目动辄投资数十亿美元，大模型计划动辄投资数百亿美元、上千亿美元。但DeepSeek此次对上述模式进行了一次让人震撼的改变——一家小型初创公司，仅100多名研发人员，在算力受限情形下，使用相对“极低”的训练费用，训练出技术水平堪比全球顶极的AI大模型，且实现了“极低”的用户收费。据央视网报道，DeepSeek公司R1模型训练成本仅为560万美元，远远低于OpenAI 、谷歌等美国科技巨头在人工智能技术上投入的“数亿美元乃至数十亿美元”。

Advertisements

伴随着技术的精进，AI大模型研发的成本已经走上快速下行通道，DeepSeek显然大大加速了降本进程，而且从行业反映看，确实存在进一步加速降本的可能性。

DeepSeek页面截图但是，如果据此认为DeepSeek终结了AI大模型研发的昂贵路线，恐怕为时尚早。首先，现阶段的DeepSeek R1其实只是AI大模型的一个具有“深度思考”功能的分支，一个分支的低成本还不能代表全部大模型能走上低成本之路。事实上，低成本之路能否走通，还需要全行业进行较长时间的验证。其次，包括DeepSeek在内的中外AI大模型行业，真正要实现的目标并不是AI大模型本身，而是AGI——通用人工智能。目前业内尚不能确认AI大模型是否是实现AGI的正确解，更不能确认未来的AGI研发之路是否昂贵。再次，从市场近期反应看，“终止昂贵之路”一说还没得到更进一步支持。芯片巨头英伟达股价虽然多日下跌，但跌幅尚有限，美国科技股同样跌幅有限。此外，市场上暂时还没有传出AI大模型项目或计划大幅向下调整预算的消息，而Meta在2025年高达数百亿的AI预算甚至是在DeepSeek爆火之后才传出。

开源，还是闭源？

Advertisements

无论美国还是中国，AI大模型领域的开源、闭源之争，均持续已久。 DeepSeek是坚定的开源路线支持者。任何人均可自行下载与部署，且提供论文详细说明了训练步骤与窍门，甚至DeepSeek APP上提供了用户可见的AI思考、推理过程。 DeepSeek爆火后，UC伯克利、港科大、HuggingFace等机构根据开源信息，纷纷实现低成本复现，对外称仅花30美元就能见证“啊哈时刻”（指可以令用户眼前一亮的时刻）。原本，闭源路线在中美均有隐隐占优之势，但DeepSeek横空出世并爆火，增加了太多变数，势必会在业内再次引发开源、闭源之争。 DeepSeek在官方公众号上称：“以开源精神和长期主义追求普惠AGI，是 DeepSeek 一直以来的坚定信念。我们非常兴奋能与社区分享在模型预训练方面的阶段性进展，也十分欣喜地看到开源模型和闭源模型的能力差距正在进一步缩小。” 同样坚持开源路线的Meta 的首席人工智能科学家Yann LeCun近期发文表示，DeepSeek 的成功“并不是中国的人工智能超越了美国，而是开源模型正在超越专有模型”。其在文中还表示，“DeepSeek受益于开放研究和开源，Meta的Llama也是如此。OpenAI 最初是一家开源人工智能公司，其使命是创造造福全人类的技术，但最近已转向闭源。”该评论对于闭源路线，隐有火药味儿。闭源自有其道理。AI基础性研发投入巨大，闭源可以让企业更有动力投入，并利用技术领先获得市场地位，然后进行市场变现。而开源意味着技术共享，市场收益一般较闭源要小。其中的典型代表便是苹果。苹果智能手机的操作系统和系列软件是闭源生态，当苹果市占率实现全球第一时，其“赢家通吃”效应显著。苹果之所以能长期拿走全球智能手机大部分利润，与其闭源生态密切相关。而安卓系统为开源生态，谷歌利用技术共享的方式开放给大量手机厂商，其赚钱方式为技术授权和知识产权收费模式。其利润远小于苹果。

2024年7月5日，百度CEO李彦宏在一场圆桌访谈中对开源与闭源模型进行了讨论，并谈了坚持闭源路线的理由。他解释说，同样参数规模下，开源模型的能力不如闭源，闭源模型可以根据用户需求提供多种变体，以平衡效果、推理速度和成本；无论是ChatGPT还是百度的文心一言，这些闭源模型的平均水平都比开源模型更强大，推理成本也更低。对于开源模型，李彦宏也承认其价值。他表示，开源模型在一些学术研究、教学等领域有存在价值，可以用于研究大模型的工作机制，形成理论。其实开源、闭源模式之争的背后，是关于如何平衡技术创新、商业利益和市场竞争力的讨论，是难以给出标准答案的选择题，并没有优劣与对错。

DeepSeek拉近了中美AI的技术差距吗？ DeepSeek爆火之后，大量的乐观评论也随之而来，认为意味着中美在AI领域的差距到了“微乎其微”的地步，甚至，还有人说中国已实现“弯道超车”。 DeepSeek还引发了资本市场的剧烈反应，有西方媒体称其为中国大模型“爆击华尔街”。 1月27日，美国股市开盘后，科技板块整体下跌，其中美国芯片巨头英伟达（NVIDIA）暴跌约17%。随后，美国、欧洲电力供应商的股价也遭受重创（AI大模型预训练、运行等对能源需求巨大）。

英伟达近期股价走势甚至，有经济分析认为，DeepSeek可能影响全球经济。例如德银策略师George Saravelos在最新报告中认为，DeepSeek的出现可能对全球经济产生“积极的供应冲击”，甚至可能使美元“面临边际下行压力”。客观、冷静地看，DeepSeek当然是重要的局部突破，但整体上中国AI领域尤其AI大模型领域与美国还是有着一定差距的。首先，DeepSeek-R1代表大模型的“深度思考”能力，是通用大模型的一部分能力，因此其水平接近美国市场的头部同类模型，且是更早（4个月前）发布的模型，是一种局部突破，而非整体突破。其次，尽管DeepSeek通用大模型V3也广受好评，但其受好评的前提是其具有极致的性价比，“性能接近”美国头部产品，且价格更低（是对方的百分之几）。显然，这不代表V3真的与ChatGPT在技术上没有差距。再次，中国AI行业与美国行业在算法、算力和数据上的差距依然没有实质性改变。算法方面，美国是AI大模型的原创研发国，技术路线和发展方向目前均主要由美国引领。算力方面，美国目前具有绝对优势，且随着美国对英伟达GPU芯片的出口限制日益严格，中国受限会愈加严重，而国内自主研发虽有重大进展，但尚需追赶和突破时间。数据方面，中文数据存在数量少且“互联网孤岛”加剧之势。最后，从市场表现看中美差距依然较大。与美国相比，我国AI企业数量较多，但核心产业规模明显偏小。并且，我国AI企业估值与美国AI企业估值有拉大之势，OpenAI市场估值超过1万亿元人民币，马斯克主导的xAI估值已达400亿美元，而我国“六小虎”估值普遍为100亿至数百亿人民币，互联网大厂则普遍没有因为发展AI大模型得到较多的AI赋分。尽管DeepSeek爆火不能完全代表中美AI技术水平接近，但确实进一步缩短了中美AI的技术差距。至于缩短了多少，或许还需要市场后续发展来给出答案。

Advertisements