DeepSeek缝合Claude,比单用R1/o1效果都好!GitHub揽星3k
创始人
2025-11-18 06:00:15
0

DeepSeek结合Claude的优势确实显著超越了单独使用R1或O1的效果。DeepSeek作为一个先进的AI模型融合平台,它能够智能地整合多个AI系统的优点,使得最终输出的内容更加丰富、准确和多样化。Claude作为另一个强大的语言处理工具,在与DeepSeek的配合下,可以更好地理解复杂语境,生成更为自然流畅的文本。这种组合不仅提高了工作效率,还大大提升了内容创作的质量。

这样的技术进步在GitHub上得到了广泛的认可和支持,项目“揽星”因其卓越的表现而吸引了超过3000名开发者关注和参与。这表明,通过技术创新来提升AI应用的能力,是当前科技领域的一大趋势,也预示着未来会有更多令人期待的技术突破。对于开发者和研究者而言,这类项目的成功也为他们提供了宝贵的参考和灵感。

声明:本文来自于微信公众号 量子位 | 公众号 QbitAI,作者:梦晨 西风,授权站长之家转载发布。

DeepSeek代替Claude思考,缝合怪玩法火了。

原因无它:比单独使用DeepSeek R1、Claude Sonnet3.5、OpenAI o1模型的效果更好

再来看一个测评结果:

码编辑基准Polyglot Benchmark上,缝合模型效果小超o1-high和R1一头。

在这个测试中,R1扮演架构师,描述如何解决代码问题。

Claude扮演程序员,按要求生成特定的代码编辑指令,以便把改动应用到源文件中。

除此之外,实验过程中还得出还有几个有意思的结论:

  • o1与Claude Sonnet搭配效果并不如单独使用o1。

  • 使用R1或o1当架构师,Claude之外的其他模型当程序员,效果都不如单独使用R1或o1。

  • o1-preview和o1-mini当架构师,使用很多不同的模型当程序员都能提高组合的成绩。

  • 使用R1的推理过程token效果不如使用R1的最终输出token。

这样看来,R1和Claude Sonnet还真是一对绝配啊~

DeepClaude应用本身100%免费且开源,在GitHub上已揽获3k星星(当然API要用自己的)。

网友测试后总结到:Claude擅长撰写清晰、结构良好的文本和代码,因此它能将DeepSeek-R1的想法转化为精炼的回复。

DeepClaude作者之一对此有感而发:

AI智能体和智能体应用正在展示出一种“数字世界优先”的范式转变,智能系统正在成为主动的合作者,而不仅仅是被动的工具。

DeepSeek和Claude的混血儿

具体来说,DeepClaude是一个LLM推理API,通过Rust编写。

它提供了一个统一的接口,将DeepSeek R1的CoT逻辑推理能力和Claude的回复在单一流中无缝衔接

开发者可以通过这个API同时调用两种模型的功能,还能完全掌控自己的API密钥和数据。

打造它的团队名为Asterisk,团队成员具有安全研究&CTF(Capture The Flag)背景,致力于利用AI让检查代码安全这事儿变得更加高效。

团队认为,DeepSeek R1的CoT深度推理甚至达到了LLM具有反省认知(metacognition)的程度,它能够自我纠正、思考不常见/极端/特殊的情况,并在自然语言中进行类似蒙特卡洛树搜索(MCTS)的推理。

不过R1在代码生成、创造力和对话技巧方面有所欠缺,Claude3.5Sonnet在这些方面表现出色,刚好可以作补充。

何不将两者结合起来?取两者之长,打造出DeepClaude~

对话中,Claude回应之前,系统会显示“”这样的预填充文本。

DeepClaude结合了这两种模型,具有以下特性:

托管API完全免费,允许用户使用自己的密钥,并将DeepSeek和Claude的流式API整合在一起,提供计算组合使用量和价格等便利功能。

代码是开源的,用户可以自由托管、修改和重新分发。团队表示它已经在Asterisk的生产环境中大规模使用,每天处理数百万token,至今尚未出现故障,只要不滥用就行。

One More Thing

你以为两个模型缝合就是极限了吗?

No no no

还有网友开发出了三缝合玩法,将DeepSeek-R1和Gemini2.0Flash的思考结果组合起来,在让Claude Sonnet去回答问题。

在GPQA测试(谷歌搜不到的理化生博士级选择题)中也取得了好成绩。

Github地址:https://github.com/getasterisk/deepclaude

参考链接:

[1]https://aider.chat/2025/01/24/r1-sonnet.html

[2]https://x.com/deepclaude_/status/1886911416478642279

[3]https://x.com/omercelik/status/1883510797193937278

[4]https://x.com/mufeedvh/status/1883620781583901011




相关内容

热门资讯

长征五号B遥一运载火箭顺利通过... 2020年1月19日,长征五号B遥一运载火箭顺利通过了航天科技集团有限公司在北京组织的出厂评审。目前...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
湖北省黄冈市人大常委会原党组成... 据湖北省纪委监委消息:经湖北省纪委监委审查调查,黄冈市人大常委会原党组成员、副主任吴美景丧失理想信念...
《大江大河2》剧组暂停拍摄工作... 搜狐娱乐讯 今天下午,《大江大河2》剧组发布公告,称当前防控疫情是重中之重的任务,为了避免剧组工作人...