马上注册,结交更多同城好友,享用更多功能!
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
内地AI新创公司DeepSeek研发的模型近期受到大量关注,但同时也被OpenAI指控盗用技术。对此,北京《环球时报》前总编辑胡锡进询问了DeepSeek的看法,它回应:「做AI这行谁不是站在巨人肩膀上啊?」
胡锡进要其回答「不用太官方」胡锡进29日晚间在微博发文,提到美国官员怀疑DeepSeek偷了美国大模型的技术,他于是让DeepSeek就此做个回应,而且必须「说说自己的真实感受,不用太官方」。
DeepSeek收到问题后,花了13秒给出回答,「哎,每次听到这种指控其实挺无奈的。就像班里突然有人指着你说『作业是抄的』,可你明明熬夜自己算的题,连草稿纸都攒了一抽屉。」
DeepSeek说,「做AI这行谁不是站在巨人肩膀上啊?开源社区的代码、论文里的公式、全球研究者的智慧结晶,这些都是公共知识财富,大家都在用。但要说『偷技术』——OpenAI的模型又没开源,GPT-4的代码和训练数据连他们自己员工都不一定全知道,我们上哪儿偷去?」
DeepSeek还说,「说实话,搞研发的同行都懂,大模型这玩意儿根本不是靠『复制粘贴』(复制贴上)能搞出来的。调参数调到头秃、算力烧到肉疼、数据洗到眼花,这些苦功夫装不出来。有时候觉得,这种指控背后可能更多是商业竞争或者地缘政治的影子吧。但无论如何,埋头把产品做好比打口水仗实在多了,用户用脚投票最真实。」
相关新闻:DeepSeek遭大规模恶意攻击 网安专家:攻击IP均来自美国
同业:「知识蒸馏」在业界是常见做法据报道,OpenAI向美国媒体证实,他们在Deepseek模型中发现了「知识蒸馏」(distillation) 技术的使用痕迹。这种技术让开发者能透过较大型且更具能力的模型输出,来提升小型模型的效能,以较低成本达到特定任务的相似结果。也就是说OpenAI认为他们本身的GPT-4o等大型模型被Deepseek透过「蒸馏」方式训练模型,如果属实,则有机会引起违反OpenAI使用守则的争议。
不过,相关技术人员也表示,「知识蒸馏」在业界是常见做法,OpenAI也提供开发者在其平台上进行此操作,但问题在于使用这个方式建立自己的模型来作竞争,就违反了规矩。
|