澳洲同城网

标题: “硬核掀桌”之后,DeepSeek留给人工智能4个新问题(图) [打印本页]

作者: 凤凰周刊    时间: 4 小时前
标题: “硬核掀桌”之后,DeepSeek留给人工智能4个新问题(图)



不曾想到,这个春节,最火爆的话题,不是旅游与消费,而是DeepSeek与人工智能。 上至美国总统特朗普,中至全球所有AI公司,下至全球数十亿关注AI进展的用户,在最近十余天之内都在讨论、研究和热议DeepSeek。 从1月20日DeepSeek公司(全称杭州深度求索人工智能基础技术研究有限公司)发布DeepSeek-R1算起,十余天内,在全球范围内快速掀起关注热潮,成为AI发展历史上的现象级事件之一。 至1月27日,在苹果App Store中国、美国区免费榜上,DeepSeek均成为第一, 超过了来自OpenAI的ChatGPT。


除了铺天盖地的溢美之词之外,最值得关注的两则评论,分别来自美国总统特朗普和OpenAI首席执行官萨姆·奥尔特曼。 特朗普认为,中国的DeepSeek公司“提出了一种更快、更便宜的人工智能方法,我认为这是积极的”,“(这)给我们(美国)的行业敲响警钟,我们需要专注于竞争以赢得胜利。” 萨姆·奥尔特曼于1月27日晚在社交媒体上发文,称“DeepSeek-R1是一款令人印象深刻的模型,尤其是考虑到它能够以这个价格提供”,“有这样的新竞争对手确实令人振奋。” 网红效应总会过去,一番喧闹之后,DeepSeek至少给AI领域留下四个需要深度思考和直面的真问题: DeepSeek能够从“网红”到“长红”吗? 当DeepSeek已经用低价策略走出一条独特的路后,AI大模型还会继续走昂贵之路吗? AI大模型到底要走开源还是闭源之路? 以及,如何看待DeepSeek之后的中美AI技术水平差距?换言之,中国真的借DeepSeek之机实现“弯道超车”了吗? 一鲸落,万物生,新的局面,也孕育着新的挑战。


DeepSeek能否从“网红”到“长红”? 近几天的表现反映出,DeepSeek并不是一个网红AI产品这么简单,全球各界已经归纳出其爆火的几个原因。 在开发背景方面,DeepSeek出自中国,而不是AI技术能力更为领先的美国;而且,其开发者也不是中国的互联网大厂,或者是AI“六小虎”等知名企业,而是一家中国初创公司,有西方网友甚至称其为“来自东方的神秘力量”。 性价比方面,DeepSeek能力强、体验感佳,水平堪比OpenAI相关产品,但价格仅仅是后者的百分之几。 在发展路径方面,DeepSeek与OpenAI“反着来”,成本低,所需算力少,一定程度上打破了AI大模型研发的“高价”神话。同时,与全球AI大模型龙头企业主要走闭源路线完全不同,DeepSeek技术路线完全开源,再次挑动了“开闭源之争”话题。 1 月 27 日,现象级国产游戏《黑神话:悟空》的制作人冯骥评价称,DeepSeek“可能是个国运级别的科技成果”。 他点评DeepSeek说,“如果有一个 AI 大模型做到了以下(六条)的任何一条,都是超级了不起的突破。但DeepSeek 全部、同时做到了。”他提到的DeepSeek六大亮点,分别为强大、便宜、开源、免费、联网和本土。 任何一款“网红”产品的产生都有其独特的内外部原因,同时,“网红”的宿命有两种,即成为“长红”或止于网红。 在中国AI业内人士看来,自2023年7月成立起,DeepSeek已有过两次“高光时刻”。这次在全球火出圈,可以称得上是DeepSeek的第三次高光时刻。 第一次在DeepSeek筹备成立期间。在2023年5月,正在组建DeepSeek公司的量化基金公司幻方就被媒体曝出可能拥有超过1万枚英伟达GPU,是几家头部大厂之外持有算力资源最多的公司。在当时,中国的AI“六小虎”也还在初创或筹建阶段。 业内一般认为,1万枚英伟达A100芯片是做自训大模型的算力门槛。从之后美国限制中国进口英伟达芯片的举措来看,DeepSeek的创始者极有远见和魄力。 第二次是2024年5月,中美市场上“百模大战”最激烈的时刻,DeepSeek突然宣布对大模型大幅降价,掀起“价格战”,其降幅甚至达行业水平9成以上。之后中国AI全行业在两周内迅速跟进,外界直呼“让大模型降成白菜价”。 此次DeepSeek走红之时,其在正式发布的资料中自豪地介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。


DeepSeek公布的性能测试比对成果。 图|DeepSeek官方微信 可以预见,不用很久,DeepSeek将成为中国AI领域正式的“新贵”,估值有望超过“六小虎”水平。但与此同时,DeepSeek面临的国内外竞争也将更加激烈。 从技术上看,细观全球业内人士评价可发现,DeepSeek-R1的水平与OpenAI o1“水平相当”,而不是领先。考虑到OpenAI o1发布已有4个月左右,之后OpenAI仍然在继续研究和精进,所以DeepSeek的水平能否与即将发布的新模型“水平相当”,或长期保持在较高技术水平上,还未可知。 从国外竞争形势看,DeepSeek对美国AI行业的刺激很大,未来技术起点高于中国企业的美国AI行业必然会更加进取。 1月21日,特朗普在上任美国总统后第二天,就在白宫宣布了一项名为“星际之门”(Stargate)的人工智能项目,将由美国甲骨文公司、OpenAI和日本软银集团联合出资5000亿美元打造。 除了特朗普的“星际之门”计划会更快速推进之外,近期包括OpenAI在内的AI巨头已经进行了战略微调。扎克伯格的Meta已宣布,2025年投资高达650亿美元用于与人工智能密切相关的项目,包括新建设一个规模巨大的AI数据中心以及大幅扩充AI领域人才,增加Meta人工智能团队实际规模。 在国内,各互联网大厂与AI“六小虎”、“四小龙”,甚至其他较小型的大模型公司,也必然会如美国企业般调整战略和技术路线,进行新竞争。未来有下一个DeepSeek的出现,也不是没有可能。 同时,国内外对AI感兴趣的资本,以及各家互联网大厂,普遍有兴趣对DeepSeek或投资或合作。如此关键和微妙时刻,考验着DeepSeek掌舵人的智慧。 全球AI发展形势“一月千里”,未来对于DeepSeek来说,不再是“不进则退”的局面,而是“不快则退”。想要从“网红”到“长红”,并不容易。


AI大模型还会继续走“烧钱”之路吗? 贵、烧钱,是AI大模型效用足够激动人心的另一面。 AI大模型最烧钱的部分是算力,需要海量性能最先进的GPU芯片,其运行还需要巨量的电力能源支持;其技术核心是算法,需要大量顶级的人工智能专家和技术人员参与研发。 因此可以看到,美国的AI大模型项目动辄投资数十亿美元,大模型计划动辄投资数百亿美元、上千亿美元。 但DeepSeek此次对上述模式进行了一次让人震撼的改变——一家小型初创公司,仅100多名研发人员,在算力受限情形下,使用相对“极低”的训练费用,训练出技术水平堪比全球顶极的AI大模型,且实现了“极低”的用户收费。 据央视网报道,DeepSeek公司R1模型训练成本仅为560万美元,远远低于OpenAI 、谷歌等美国科技巨头在人工智能技术上投入的“数亿美元乃至数十亿美元”。 伴随着技术的精进,AI大模型研发的成本已经走上快速下行通道,DeepSeek显然大大加速了降本进程,而且从行业反映看,确实存在进一步加速降本的可能性。


DeepSeek页面截图 但是,如果据此认为DeepSeek终结了AI大模型研发的昂贵路线,恐怕为时尚早。 首先,现阶段的DeepSeek R1其实只是AI大模型的一个具有“深度思考”功能的分支,一个分支的低成本还不能代表全部大模型能走上低成本之路。事实上,低成本之路能否走通,还需要全行业进行较长时间的验证。 其次,包括DeepSeek在内的中外AI大模型行业,真正要实现的目标并不是AI大模型本身,而是AGI——通用人工智能。目前业内尚不能确认AI大模型是否是实现AGI的正确解,更不能确认未来的AGI研发之路是否昂贵。 再次,从市场近期反应看,“终止昂贵之路”一说还没得到更进一步支持。 芯片巨头英伟达股价虽然多日下跌,但跌幅尚有限,美国科技股同样跌幅有限。此外,市场上暂时还没有传出AI大模型项目或计划大幅向下调整预算的消息,而Meta在2025年高达数百亿的AI预算甚至是在DeepSeek爆火之后才传出。


开源,还是闭源? 无论美国还是中国,AI大模型领域的开源、闭源之争,均持续已久。 DeepSeek是坚定的开源路线支持者。任何人均可自行下载与部署,且提供论文详细说明了训练步骤与窍门,甚至DeepSeek APP上提供了用户可见的AI思考、推理过程。 DeepSeek爆火后,UC伯克利、港科大、HuggingFace等机构根据开源信息,纷纷实现低成本复现,对外称仅花30美元就能见证“啊哈时刻”(指可以令用户眼前一亮的时刻)。 原本,闭源路线在中美均有隐隐占优之势,但DeepSeek横空出世并爆火,增加了太多变数,势必会在业内再次引发开源、闭源之争。 DeepSeek在官方公众号上称:“以开源精神和长期主义追求普惠AGI,是 DeepSeek 一直以来的坚定信念。我们非常兴奋能与社区分享在模型预训练方面的阶段性进展,也十分欣喜地看到开源模型和闭源模型的能力差距正在进一步缩小。” 同样坚持开源路线的Meta 的首席人工智能科学家Yann LeCun近期发文表示,DeepSeek 的成功“并不是中国的人工智能超越了美国,而是开源模型正在超越专有模型”。 其在文中还表示,“DeepSeek受益于开放研究和开源,Meta的Llama也是如此。OpenAI 最初是一家开源人工智能公司,其使命是创造造福全人类的技术,但最近已转向闭源。”该评论对于闭源路线,隐有火药味儿。 闭源自有其道理。AI基础性研发投入巨大,闭源可以让企业更有动力投入,并利用技术领先获得市场地位,然后进行市场变现。而开源意味着技术共享,市场收益一般较闭源要小。 其中的典型代表便是苹果。苹果智能手机的操作系统和系列软件是闭源生态,当苹果市占率实现全球第一时,其“赢家通吃”效应显著。苹果之所以能长期拿走全球智能手机大部分利润,与其闭源生态密切相关。而安卓系统为开源生态,谷歌利用技术共享的方式开放给大量手机厂商,其赚钱方式为技术授权和知识产权收费模式。其利润远小于苹果。


2024年7月5日,百度CEO李彦宏在一场圆桌访谈中对开源与闭源模型进行了讨论,并谈了坚持闭源路线的理由。他解释说,同样参数规模下,开源模型的能力不如闭源,闭源模型可以根据用户需求提供多种变体,以平衡效果、推理速度和成本;无论是ChatGPT还是百度的文心一言,这些闭源模型的平均水平都比开源模型更强大,推理成本也更低。 对于开源模型,李彦宏也承认其价值。他表示,开源模型在一些学术研究、教学等领域有存在价值,可以用于研究大模型的工作机制,形成理论。 其实开源、闭源模式之争的背后,是关于如何平衡技术创新、商业利益和市场竞争力的讨论,是难以给出标准答案的选择题,并没有优劣与对错。


DeepSeek拉近了中美AI的技术差距吗? DeepSeek爆火之后,大量的乐观评论也随之而来,认为意味着中美在AI领域的差距到了“微乎其微”的地步,甚至,还有人说中国已实现“弯道超车”。 DeepSeek还引发了资本市场的剧烈反应,有西方媒体称其为中国大模型“爆击华尔街”。 1月27日,美国股市开盘后,科技板块整体下跌,其中美国芯片巨头英伟达(NVIDIA)暴跌约17%。随后,美国、欧洲电力供应商的股价也遭受重创(AI大模型预训练、运行等对能源需求巨大)。


英伟达近期股价走势 甚至,有经济分析认为,DeepSeek可能影响全球经济。例如德银策略师George Saravelos在最新报告中认为,DeepSeek的出现可能对全球经济产生“积极的供应冲击”,甚至可能使美元“面临边际下行压力”。 客观、冷静地看,DeepSeek当然是重要的局部突破,但整体上中国AI领域尤其AI大模型领域与美国还是有着一定差距的。 首先,DeepSeek-R1代表大模型的“深度思考”能力,是通用大模型的一部分能力,因此其水平接近美国市场的头部同类模型,且是更早(4个月前)发布的模型,是一种局部突破,而非整体突破。 其次,尽管DeepSeek通用大模型V3也广受好评,但其受好评的前提是其具有极致的性价比,“性能接近”美国头部产品,且价格更低(是对方的百分之几)。显然,这不代表V3真的与ChatGPT在技术上没有差距。 再次,中国AI行业与美国行业在算法、算力和数据上的差距依然没有实质性改变。 算法方面,美国是AI大模型的原创研发国,技术路线和发展方向目前均主要由美国引领。算力方面,美国目前具有绝对优势,且随着美国对英伟达GPU芯片的出口限制日益严格,中国受限会愈加严重,而国内自主研发虽有重大进展,但尚需追赶和突破时间。数据方面,中文数据存在数量少且“互联网孤岛”加剧之势。 最后,从市场表现看中美差距依然较大。与美国相比,我国AI企业数量较多,但核心产业规模明显偏小。并且,我国AI企业估值与美国AI企业估值有拉大之势,OpenAI市场估值超过1万亿元人民币,马斯克主导的xAI估值已达400亿美元,而我国“六小虎”估值普遍为100亿至数百亿人民币,互联网大厂则普遍没有因为发展AI大模型得到较多的AI赋分。 尽管DeepSeek爆火不能完全代表中美AI技术水平接近,但确实进一步缩短了中美AI的技术差距。至于缩短了多少,或许还需要市场后续发展来给出答案。





欢迎光临 澳洲同城网 (https://www.tongchengau.com/) Powered by Discuz! X3.2