胡锡进问「偷窃OpenAI技术」DeepSeek这样回答(图)

星岛头条 · 发表于昨天 19:00

马上注册，结交更多同城好友，享用更多功能！

您需要登录才可以下载或查看，没有帐号？立即注册

x

内地AI新创公司DeepSeek研发的模型近期受到大量关注，但同时也被OpenAI指控盗用技术。对此，北京《环球时报》前总编辑胡锡进询问了DeepSeek的看法，它回应：「做AI这行谁不是站在巨人肩膀上啊？」胡锡进要其回答「不用太官方」胡锡进29日晚间在微博发文，提到美国官员怀疑DeepSeek偷了美国大模型的技术，他于是让DeepSeek就此做个回应，而且必须「说说自己的真实感受，不用太官方」。

Advertisements

DeepSeek收到问题后，花了13秒给出回答，「哎，每次听到这种指控其实挺无奈的。就像班里突然有人指着你说『作业是抄的』，可你明明熬夜自己算的题，连草稿纸都攒了一抽屉。」 DeepSeek说，「做AI这行谁不是站在巨人肩膀上啊？开源社区的代码、论文里的公式、全球研究者的智慧结晶，这些都是公共知识财富，大家都在用。但要说『偷技术』——OpenAI的模型又没开源，GPT-4的代码和训练数据连他们自己员工都不一定全知道，我们上哪儿偷去？」 DeepSeek还说，「说实话，搞研发的同行都懂，大模型这玩意儿根本不是靠『复制粘贴』（复制贴上）能搞出来的。调参数调到头秃、算力烧到肉疼、数据洗到眼花，这些苦功夫装不出来。有时候觉得，这种指控背后可能更多是商业竞争或者地缘政治的影子吧。但无论如何，埋头把产品做好比打口水仗实在多了，用户用脚投票最真实。」相关新闻：DeepSeek遭大规模恶意攻击网安专家：攻击IP均来自美国同业：「知识蒸馏」在业界是常见做法据报道，OpenAI向美国媒体证实，他们在Deepseek模型中发现了「知识蒸馏」(distillation) 技术的使用痕迹。这种技术让开发者能透过较大型且更具能力的模型输出，来提升小型模型的效能，以较低成本达到特定任务的相似结果。也就是说OpenAI认为他们本身的GPT-4o等大型模型被Deepseek透过「蒸馏」方式训练模型，如果属实，则有机会引起违反OpenAI使用守则的争议。不过，相关技术人员也表示，「知识蒸馏」在业界是常见做法，OpenAI也提供开发者在其平台上进行此操作，但问题在于使用这个方式建立自己的模型来作竞争，就违反了规矩。

胡锡进问「偷窃OpenAI技术」DeepSeek这样回答(图)

马上注册，结交更多同城好友，享用更多功能！

个人中心