首页 > 新闻 > 新闻详文:OpenAI称有证据表明DeepSeek使用其模型训练

OpenAI称有证据表明DeepSeek使用其模型训练

发布时间:2025年01月30日 17时19分40秒   新闻类型:广域新闻    访问次数:935
字体: 初始 添加收藏 分享给好友

今日欧美新闻媒体人工智能热点:“DeepSeek是否使用了OpenAI的API接口训练模型”,在过去两天DeepSeek AI已经引起了欧美各国关注,并且引发了美国人工智领域的科技股剧烈震动,美国和部分欧洲个别国家已经拉起安全隐患封禁,美国目前虽然没有行政限制,但已经高度戒备状态。在今天OpenAI称有证据表明中国的 DeepSeek 使用其模型来训练。OpenAI 和微软正在调查DeepSeek应用,是否使用 OpenAI 的 API接口,将其 AI 模型集成到 DeepSeek模型中。据美媒体消息人士称:微软安全研究人员发现,2024 年底,大量数据通过 OpenAI 开发者账户被泄露,该公司认为这些账户与 DeepSeek 有关联。

根据BBC新闻、金融时报、华尔街日报等媒体报道:OpenAI 表示现证据表明人工智能初创公司 DeepSeek 使用了这家美国公司的专有模型来训练自己的开源竞争对手,对潜在侵犯知识产权的担忧日益加剧。开发人员可以利用该技术,利用更大、功能更强大的模型的输出在较小的模型上获得更好的性能,从而以更低的成本在特定任务上获得类似的结果。

模型数据提炼是业界常见的做法,但令人担忧的是,DeepSeek 这样做可能是为了建立自己的竞争模型,这违反了 OpenAI 的服务条款。一位接近 OpenAI 的人士表示:“问题在于,当你(将其从平台中取出)是为了自己的目的而创建自己的模型时”。OpenAI目前没有公布更多证据细节。其服务条款规定,用户不得“复制”其任何服务或“使用输出来开发与 OpenAI 竞争的模型”。


左为DeepSeek-V3图标,右为GPT-4图标

白宫人工智能沙皇戴维·萨克斯 (David Sacks):“人工智能中有一种技术叫做蒸馏/distillation…一个模型从另一个模型中学习,并吸取母模型中的知识…有大量证据表明,DeepSeek 的做法是从 OpenAI 模型中提炼知识…”尚没有更多证据证实公布。

DeepSeek 表示:仅使用了 2,048 块 Nvidia H800 显卡,花费 560 万美元来训练其拥有 6710 亿个参数的 V3 模型,这只是 OpenAI 和谷歌训练同等规模型所花费的一小部分。

根据美媒业内人士表示:中国和美国的人工智能实验室通常使用 OpenAI 等公司的输出,这些公司投资聘请人员来教他们的模型如何做出听起来更像人类的反应。这项工作成本高昂,劳动力密集,规模较小的公司通常会搭便车。一些专家表示,该模型产生的响应表明它是在 OpenAI 的 GPT-4 的输出上进行训练的,这违反了其服务条款。 

加州大学伯克利分校人工智能博士生 Ritwik Gupta 表示:“初创企业和学术界使用与人类相关的商业法学硕士(如 ChatGPT)的成果来训练另一个模型是一种非常常见的做法,这意味着你可以免费获得人工反馈”。DeepSeek 可能会做同样的事情,这并不令我惊讶。如果他们这样做,那么阻止这种做法可能非常困难,”他补充道。这一做法凸显了那些热衷于保护技术优势的公司所面临的困难。

OpenAI 在其最新声明中表示:“我们知道,中国公司和其他公司一直在试图借鉴美国领先人工智能公司的模型”。该公司还补充道:“我们采取了反制措施来保护我们的知识产权,包括对将哪些前沿能力纳入已发布模型进行谨慎的筛选,并且相信……至关重要的是,我们正在与美国政府密切合作,以最好地保护最强大的模型,防止对手和竞争对手窃取技术”。

然而,目前OpenAI 正在应对报社新闻集团和内容创作者对其版权侵犯的指控,其中包括来自《纽约时报》和知名作家的诉讼,他们指控该公司未经许可使用他们的文章和书籍来训练其模型。相关媒体更为讽刺的称:“OpenAI 在未经同意的情况下吞噬了整个书面网络,使其 GPT 模型取得了巨大的飞跃”。

另外,路透社北京 1 月 29 日报道:中国科技公司阿里巴巴(9988.HK),周三发布了其Qwen 2.5 人工智能模型的新版本,据称该模型超越了备受赞誉的 DeepSeek-V3。 Qwen 2.5-Max 的发布时间比较特殊,正值农历新年的第一天,大多数中国人都下班回家与家人团聚。这意味着中国人工智能初创公司DeepSeek 在过去三周的迅速崛起不仅给海外竞争对手带来了压力,也给国内竞争对手带来了压力。阿里巴巴云部门在其官方微信公众号上发布的声明中表示:“Qwen 2.5-Max 的表现几乎全面优于 GPT-4o、DeepSeek-V3 和 Llama-3.1-405B。”他指的是 OpenAI 和 Meta 最先进的开源 AI 模型。


关联新闻参考:

财富 (Fortune)杂志发布:“白宫 AI 主管称 DeepSeek 使用 OpenAI 的模型通过“蒸馏”来训练其竞争对手”
DeepSeek used OpenAI’s model to train its competitor using ‘distillation’ White House AI czar says (财富 Fortune杂志)

华尔街日报:OpenAI 正在调查 DeepSeek 是否使用其模型来训练新的聊天机器人
OpenAI Is Probing Whether DeepSeek Used Its Models to Train New Chatbot (华尔街日报)

BBC新闻:OpenAI 称中国竞争对手利用其成果开发 AI 应用
OpenAI says Chinese rivals using its work for their AI apps (BBC新闻)

路透社新闻:阿里巴巴发布 AI 模型,称其超越 DeepSeek
Alibaba releases AI model it says surpasses DeepSeek(路透社新闻)

OpenAI has evidence that its models helped train China's DeepSeek  (theverge.com)

Microsoft Probing If DeepSeek-Linked Group Improperly Obtained OpenAI Data (彭博新闻)