DeepSeek被美国质疑“偷窃”,遭OpenAI微软调查,论文曝突破英伟达护城河
创始人
2025-01-29 20:01:30
0

《DeepSeek遭遇的风波与突破》

DeepSeek突然被美国质疑存在“偷窃”行为,这一指控无疑给它带来巨大的舆论压力。随后OpenAI和微软对其展开调查,使DeepSeek陷入风口浪尖。然而,在这样的复杂局势下,有论文曝出DeepSeek取得了惊人突破。它在某种程度上突破了英伟达的“护城河”,这一成果如果属实将具有重大意义。它可能会改变当前人工智能领域的竞争格局,无论是对技术的自主创新发展,还是对打破某些技术垄断局面,都有着不可忽视的潜在影响力。


本文来自微信公众号:APPSO (ID:appsolution),作者:发现明日产品的,原文标题:《突发!DeepSeek被美国质疑「偷窃」,遭OpenAI微软调查,论文曝突破英伟达护城河》


春节期间,一场关于DeepSeek的风波正在AI圈掀起波澜。


据彭博社最新报道,微软安全研究人员在去年秋天发现,一些可能与DeepSeek相关的个人通过OpenAI的API大规模提取数据。


知情人士透露,作为OpenAI的技术合作伙伴和最大金主,微软在发现这一情况后立即通知了OpenAI。


报道称,这种行为可能违反OpenAI的服务条款。因为OpenAI的服务条款明确规定,用户不得未经授权使用自动化或程序化方法从其服务中提取数据。


即使DeepSeek获得了某种形式的API访问权限,但如果其使用方式超出了OpenAI授权的范围,比如用于非法或未经授权的商业目的,也可能被视为违反服务条款。


对于相关置评请求,OpenAI未作回应,微软拒绝评论,而DeepSeek方也暂未回应。


值得一提的是,此前许多外界人士认为通过模型蒸馏技术,DeepSeek可能在训练过程中使用了ChatGPT等模型的输出数据作为训练材料,而这些数据中的「知识」被迁移到DeepSeek自己的模型中。


事实上,这种做法在AI领域并不罕见。


但质疑者关注的是DeepSeek是否在未充分披露的情况下使用了OpenAI模型的输出数据。这似乎在DeepSeek-V3的自我认知上也有所体现。


早前就有用户发现,当询问模型的身份时,它会将自己误认为是GPT-4。


DeepSeek团队在最新模型R1的技术报告中明确表示未使用OpenAI模型的输出数据,并表示通过强化学习和独特的训练策略实现了高性能。


例如,采用了多阶段训练方式,包括基础模型训练、强化学习(RL)训练、微调等,这种多阶段循环训练方式有助于模型在不同阶段吸收不同的知识和能力。


彭博社报道还指出,美国AI事务主管David Sacks近期在接受Fox News采访时表示,有「确凿证据」表明,DeepSeek利用OpenAI模型的输出数据来开发自身技术。


不过,Sacks并未提供具体的证据。近期,美国多名官员也表示DeepSeek有「偷窃」嫌疑,正对其影响开展国家安全调查。


针对David Sacks的言论,OpenAI的回应则比较保守。其发言人表示「我们知道,来自中国的公司以及其他一些企业,始终在尝试『蒸馏』美国领先AI公司的模型。」


该发言人强调,作为AI领域的领先者,OpenAI已采取相应对策来保护其知识产权,其中包括对前沿能力的严格筛选,决定哪些功能可以公开发布。他们认为与美国政府密切合作对于保护最先进的AI模型至关重要。


就在这场争议风波持续发酵之际,外媒的目光也开始转向DeepSeek更早发布的开源V3模型,后者则通过技术报告详细披露了相关的深度底层优化细节。


据外媒扒出,V3模型的开发甚至绕过了CUDA,通过对英伟达GPU低级汇编语言PTX进行优化,从而实现了最大性能。


PTX是英伟达GPU的中间指令集架构,能够实现寄存器分配、线程/线程束级别调整等细粒度优化。如果说CUDA是与英伟达GPU对话的「高级语言」,那么PTX就像是一种「机器底层语言」。


想象你在玩一个游戏机。通常情况下,我们只需要用手柄(就像CUDA)就能玩游戏,这很方便,但可能无法发挥游戏机的全部实力。


而PTX就像是打开了游戏机的后盖,直接调整里面的各种配件和线路。虽然这样做很复杂,需要懂得很多专业知识,但是可以让游戏机跑得更快、性能更好。


更通俗的解释是,PTX就是一种能够让开发者「掀开GPU的盖子」,直接调教其内部运作方式的工具。这就像是改装汽车,不是简单地踩油门,而是直接调教发动机的每个零件,以榨取最大性能。


DeepSeek在训练V3模型时,对H800 GPU进行了重新配置,包括划分出20个SM用于服务器间通信,以及实现了流水线算法,优化能力远超常规CUDA开发水平。而倘若这一技术属实,或将撼动英伟达构筑已久的护城河。


不过,PTX虽然能极大地优化性能,但也对开发团队提出了更高的要求。相比之下,英伟达的护城河CUDA凭借其开发便捷性和快速迭代的优势,仍然是大多数开发者的首选。


更重要的是,PTX优化往往需要针对特定型号的硬件进行定制。


这种「量体裁衣」式的优化策略虽然效果显著,但也大大增加了开发难度和维护成本。这也解释了为什么在可预见的未来,CUDA仍将在主流开发中占据主导地位。


但在既有规则之外寻求突破,往往就是颠覆的开始,DeepSeek这次在海内外掀起的技术浪潮或将有望撬动整个AI产业链的既有秩序。

相关内容

热门资讯

长征五号B遥一运载火箭顺利通过... 2020年1月19日,长征五号B遥一运载火箭顺利通过了航天科技集团有限公司在北京组织的出厂评审。目前...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
湖北省黄冈市人大常委会原党组成... 据湖北省纪委监委消息:经湖北省纪委监委审查调查,黄冈市人大常委会原党组成员、副主任吴美景丧失理想信念...
《大江大河2》剧组暂停拍摄工作... 搜狐娱乐讯 今天下午,《大江大河2》剧组发布公告,称当前防控疫情是重中之重的任务,为了避免剧组工作人...