Kimi“憋”出的深度研究，成色几何？_资讯

Kimi“憋”出的深度研究，成色几何？

创始人

2025-07-01 15:02:41

0次

请你提供具体的“Kimi‘憋’出的深度研究”的相关内容呀，没有具体内容我没法准确判断其成色呢。比如研究的主题、研究的方法、得出的结论等方面的信息都没有，无法确切知晓其深度和质量到底如何呢。

沉寂了小半年的 Kimi，最近悄悄开始内测“深度研究”功能。我上周申请了内测后，两三天就拿到了内测资格，然后开始正式使用。

说句主观感受的话，我觉得 Kimi 这次推出的深度研究功能，应该能排进行业内的 Top 3。

我一直属于 Deep Research 的重度用户，目前 ChatGPT Plus 每月提供的 20 次额度，根本不够用。平时写文章，我都会先通过 DeepResearch 来快速补充相关的背景信息。

虽然 Deep Research 提供的信息并不可能 100% 准确和可靠，但总归能省去我不少查资料的时间。

就这几天的使用情况来看，Kimi 的深度研究功能，在很多问题上，最后生成报告的深度，超过了 ChatGPT。一份好的深度研究报告，倒也不一定非得是万字长文，我觉得核心它需要搞定几件事：

1. 能够充分理解问题，并给出一份结构合理的框架。

2. 能找到真正有价值的信源，而不是无关紧要的信息。

3. 最终生成的内容，能够围绕核心问题展开。

这三个方面，Kimi 都做得很不错，给我一种代差感。当然，它也还有不少需要完善的地方，比如，目前不能导出为 PDF，而且生成的速度比较慢，我的几个用例中，基本都需要 15 分钟。

敢为天下后，让Agent进入模型

很多人不理解，为什么 Kimi 沉寂了这么久，最后却憋出了一个深度研究功能。我一开始也没想到，甚至还在期待它发布新一代的模型……但回过头看，深度研究本来就是一个有 Agent 能力的模型。

前半年 Agent 的概念很火，而真正走通 PMF 的场景，掰着指头数，我觉得也就两个：Coding Agent 和 Deep Research Agent。

如果你注意的话，会发现 OpenAI、Anthropic、Google、Grok 这几家头部大模型公司，都在同时做 Coding Agent 和 Deep Research Agent。只不过，Deep Research 通常都集成在 ChatBot 中，所以，大家没意识到它本身就是一个 Agent 的实例。

Deep Research 的 Agent 想做好，仍然有不少的技术难度。我在知乎看到了 Kimi 团队毛绍光的一个帖子，他说，做 Agent 最大的难点，其实是要让模型真的能在真实环境下独立搞定复杂任务。这和以前大家做的“推理模型”完全不是一个级别的挑战。

比如，Agent 面对的是随时变化的真实环境。工具的调用不是一成不变，哪怕是同一个操作，在不同的上下文下结果可能完全不同。环境还会有各种抖动和干扰，这些都是实验室里根本见不到的难题。

再比如，Agent 要解决的，往往是那种长链、跨度特别大的任务。不是三两步、问一句答一句就能结束，而是要贯穿很多步骤、持续很久。

这对模型的记忆力、上下文管理、推理的连贯性要求非常高。模型要一直记得前面的内容，还要能有效地做推演和决策，否则很容易中途断链。

所以，Kimi 团队本身还是做了很多技术难点，而不是简单的雕花。我觉得这也是他们敢为天下后的底气。

拿 Kimi 的 Deep Research 来看，我们只需要输入自己的问题，后续的所有流程它都会自主进行规划，比如主动分析并规划关键词、调用搜索关键词和浏览器在全网搜集资料、自动筛选、过滤低质或冗余信息，这些全程都无需我们干预，最终就能够得到一份质量很高的分析报告。

深度研究，让AI主动构建Context

做过资料搜集和整理工作的人都知道，其实 AI 就是把人工做的事情全部自动化了。过去，我们检索资料，说白了也都是这些流程——换一些关键词去谷歌搜索，然后点开自己认为靠谱的网页阅读、提取其中的关键信息……最后再做整合。

深度研究是一个典型的垂直 Agent 场景，不属于通用 Agent 的范畴。

那为什么 Kimi 会做这个场景？因为深度研究功能，最终为用户交付的是一份高质量、有信息密度，而且结构规整的研究报告。

我认为高质量的信息，是 Agent 做所有事情的起点。如果一个 Agent，连问题的来龙去脉都搞不清楚，那它怎么可能规划出来靠谱的执行路径？

最近圈子里又在谈提示词，有种观点认为提示词工程应该叫 Context 工程。概念不重要，重要的是大家意识到 Context 是 Agent 能够高效准确执行任务的关键。而我觉得，深度研究就是在为 AI 准备一个高质量的 Context。

而且，Kimi 的深度研究功能最终还为用户生成了一个可视化的网页，并且在检索资料的过程中，能明显看出来，它会不断地调用工具。这中间必定用到了 Coding 的能力，也就是说，Kimi 想把深度研究 Agent 做好，也就同时需要做好 Coding Agent。一石二鸟。

上手实测：信息可溯源，双报告交付

下面我分享下自己的一个真实案例。

香港四大才子之一的蔡澜先生上周去世，朋友圈很多人转发文章缅怀，也有人说他不值得我们纪念。这让我产生了很多兴趣，想去了解一下蔡先生的一生。过去，我对他的了解几乎是一片空白。

打开 Kimi，选择深度研究功能，最终拿到了一份深度的研究报告，和一个可视化的网页。整个过程中，有几个细节毕竟打动我：

1. 它主动使用中英文关键词，而不是只搜中文，极大提高了信息覆盖率；

2. 它至少规划了 80 组关键词，来自各类长尾渠道，包括南方周末、中国日报香港版、雅虎等权威信息源；

3. 当发现关键词策略不精准，它会主动纠偏、重写检索逻辑；

4. 双报告交付：同步生成信息可溯源的万字深度报告 + 可交互可分享的可视化网页，满足深读与传播两类场景。

我具体说下自己的操作流程。首先输入问题：帮我介绍一下蔡澜。

很简单，我的问题没有多余的表达，也没有所谓的提示词技巧，就是想了解一下蔡澜。当我给出这样一个泛泛的指令后，Kimi 会先试着理解我的意图，主动细化问题，再与我确认边界。

Kimi Researcher 的这个交互和 ChatGPT 一致。但也有小惊喜，你看下面截图，它居然问我，是要写成人物传记还是简介。也就是说，它可以基于我的问题，生成不同风格的内容，而不仅仅是传统的分析报告。

我把同样的提示词给到 GPT，它的回答显然没有 Kimi Research 这么精细。

和 Kimi 确认了需求后，接下来，它会提示我研究正在进行中，在生成期间，我可以离开当前对话，做其他的事情。

特别有趣。Kimi 告诉我，它准备用中英文关键词一起去搜索。这一点超出我预期，毕竟按照我惯常的经验，国内的信息，一般只用中文关键词。这点小细节还是挺加分的。

接着，Kimi 会一轮一轮地搜索关键词，然后使用浏览器浏览网页。我没有细算，整体下来，它至少规划了 80 组关键词来找蔡澜先生的信息。下面是其中一个截图，信源的广度和深度太强了。

nfnews 这个域名，估计大多数人都没听过。其实它背后是南方报业传媒集团，信息相当权威。还有，下面截图的网址，是《中国日报》的香港版网站，同样是一个很权威和专业的信息源。

看到这里，我突然想到 4 月底时， Kimi 母公司月之暗面与财新传媒达成合作的消息。我推测那时候，Kimi 应该就是在为深度研究功能做铺垫，他们想找到行业里最权威和专业的信息源。毕竟，没有好的信源，深度研究最后输出的结果，也不可能专业。

下面是 Kimi Researcher 在研究过程中的一次主动纠偏，它自己发现之前的关键词不够精准，所以导致部分内容有混淆，于是决定修正关键词。这真的真的和人类的逻辑很像。

我们都知道，AI 很容易出现幻觉，甚至一本正经地胡说八道，但让它自己主动认错几乎不可能。Kimi 能通过信息对比，发现自己的问题，还会主动纠偏，这一点不错。其实这也是 Agent 和之前基于 Workflow 的假 Agent 的最主要区别。

而且只要发现原先的方式拿不到足够信息，Kimi 还会像真人一样，马上调整策略。比如像下面这样，发现关于蔡澜的美食哲学和人生理念还不清晰，它就会主动调整搜索策略，把重心转到这些核心内容上，直到把细节补齐。

当所有资源全部收集完成之后，Kimi 开始进行最后的成文工作。

卡了下时间，这次生成一共用时 16 分钟。最终，它给我交付了两个成果：

一个是信息详实的深度研究报告，9345 个字，引用了将近 30 个可溯源信源。所有引用都内嵌在正文中，点击引用就能跳转查看对应的信源。并且关键信息还加了高亮，特别贴心。

不过这份文档也有点小瑕疵，有部分 Markdown 语法高亮没有正常显示，应该是前端的 Bug？不重要，瑕不掩瑜。

另一个是一份可视化的网页，可以交互，也能分享。我理解这是对前面那份详实、将近万字研究报告的精简版本，而且贴心地制作了专门的图片和表格，读起来压力会小很多。

我放一张 Gif 大家看下，左侧是目录，想看哪部分，直接点目录就会跳到对应内容部分。同样这份报告中，也带有具体的信源。

注意，这不是一个 PPT，而是一个网页。也就是说，Kimi 基于对信息的理解能力，做出来一份包含关键信息的可视化网页，该配图的地方配图，该加表格的地方加表格。

这也证明了我的猜想。Kimi 在深度研究的 Agent 中，同样用到了 Coding 的能力。说个我的暴论：深度研究和 Coding 能力，接下来会成为所有通用型 Agent 的基础。

难而正确的事

很多人在 DeepSeek 发布之后唱衰 Kimi，觉得它沉默太久、掉队了。但如果你长期关注这个行业，就会明白，模型能力和产品节奏从来不是线性的比拼，也不是三个月一轮的排名赛。

之前看到有一个从业者说，爱迪生晚两天掏出灯泡，没什么大不了的。真正重要的，不是你是不是第一个做，而是你是不是在正确的方向上，做着正确的事。

在 36Kr 看了一篇采访，大意是说，今年的市场环境，反而利于 Kimi、MiniMax 这种更专注模型和产品的初创公司。去年整个行业还在拼投流、拼资本，谁更会讲故事、买渠道，谁就能跑得快。

那套打法，大公司更擅长，Kimi 当时也在激进投流，被迫卷入了大厂最擅长、最内卷的那条赛道。那段时间看似热闹，但也许那段时间才是 Kimi 的至暗时刻，是它的“绝望之谷”。

今年，至少我觉得，创业公司的思路已经非常清晰，只要做出来好的产品，市场就会买单。所有人，在当前的时间节点，都应该拼技术创新，拼团队对于未来行业发展的预判。

模型即 Agent。接下来，Kimi 要在 Agent 方向正式出招了。王慧文在很早之前创业时说他们公司模型和应用两手都要抓，目前看，倒是不需要两手抓，因为这两件事，越来越收敛为同一件事。

Kimi 有相对充足的资源，团队人才密度也很高。这个阶段，他们没有被短期数据牵着走，而是选择了一条更慢的路，试图去做通用智能。这件事不容易，我很敬佩，这是在做难而正确的事情。

本文来自微信公众号：AI产品阿颖，作者：阿颖

上一篇：超400笔投资，VC跨越山海关

下一篇：河南西峡极端强降雨致2人遇难6人失联

Kimi“憋”出的深度研究，成色几何？

相关内容

热门资讯