Kimi“憋”出的深度研究,成色几何?
创始人
2025-07-01 15:02:41
0

请你提供具体的“Kimi‘憋’出的深度研究”的相关内容呀,没有具体内容我没法准确判断其成色呢。比如研究的主题、研究的方法、得出的结论等方面的信息都没有,无法确切知晓其深度和质量到底如何呢。


沉寂了小半年的 Kimi,最近悄悄开始内测“深度研究”功能。我上周申请了内测后,两三天就拿到了内测资格,然后开始正式使用。


说句主观感受的话,我觉得 Kimi 这次推出的深度研究功能,应该能排进行业内的 Top 3。



我一直属于 Deep Research 的重度用户,目前 ChatGPT Plus 每月提供的 20 次额度,根本不够用。平时写文章,我都会先通过 DeepResearch 来快速补充相关的背景信息。


虽然 Deep Research 提供的信息并不可能 100% 准确和可靠,但总归能省去我不少查资料的时间。


就这几天的使用情况来看,Kimi 的深度研究功能,在很多问题上,最后生成报告的深度,超过了 ChatGPT。一份好的深度研究报告,倒也不一定非得是万字长文,我觉得核心它需要搞定几件事:


1. 能够充分理解问题,并给出一份结构合理的框架。


2. 能找到真正有价值的信源,而不是无关紧要的信息。


3. 最终生成的内容,能够围绕核心问题展开。


这三个方面,Kimi 都做得很不错,给我一种代差感。当然,它也还有不少需要完善的地方,比如,目前不能导出为 PDF,而且生成的速度比较慢,我的几个用例中,基本都需要 15 分钟。


敢为天下后,让Agent进入模型


很多人不理解,为什么 Kimi 沉寂了这么久,最后却憋出了一个深度研究功能。我一开始也没想到,甚至还在期待它发布新一代的模型……但回过头看,深度研究本来就是一个有 Agent 能力的模型。


前半年 Agent 的概念很火,而真正走通 PMF 的场景,掰着指头数,我觉得也就两个:Coding Agent 和 Deep Research Agent。


如果你注意的话,会发现 OpenAI、Anthropic、Google、Grok 这几家头部大模型公司,都在同时做 Coding Agent 和 Deep Research Agent。只不过,Deep Research 通常都集成在 ChatBot 中,所以,大家没意识到它本身就是一个 Agent 的实例。


Deep Research 的 Agent 想做好,仍然有不少的技术难度。我在知乎看到了 Kimi 团队毛绍光的一个帖子,他说,做 Agent 最大的难点,其实是要让模型真的能在真实环境下独立搞定复杂任务。这和以前大家做的“推理模型”完全不是一个级别的挑战。


比如,Agent 面对的是随时变化的真实环境。工具的调用不是一成不变,哪怕是同一个操作,在不同的上下文下结果可能完全不同。环境还会有各种抖动和干扰,这些都是实验室里根本见不到的难题。


再比如,Agent 要解决的,往往是那种长链、跨度特别大的任务。不是三两步、问一句答一句就能结束,而是要贯穿很多步骤、持续很久。


这对模型的记忆力、上下文管理、推理的连贯性要求非常高。模型要一直记得前面的内容,还要能有效地做推演和决策,否则很容易中途断链。


所以,Kimi 团队本身还是做了很多技术难点,而不是简单的雕花。我觉得这也是他们敢为天下后的底气。


拿 Kimi 的 Deep Research 来看,我们只需要输入自己的问题,后续的所有流程它都会自主进行规划,比如主动分析并规划关键词、调用搜索关键词和浏览器在全网搜集资料、自动筛选、过滤低质或冗余信息,这些全程都无需我们干预,最终就能够得到一份质量很高的分析报告。



深度研究,让AI主动构建Context


做过资料搜集和整理工作的人都知道,其实 AI 就是把人工做的事情全部自动化了。过去,我们检索资料,说白了也都是这些流程——换一些关键词去谷歌搜索,然后点开自己认为靠谱的网页阅读、提取其中的关键信息……最后再做整合。


深度研究是一个典型的垂直 Agent 场景,不属于通用 Agent 的范畴。


那为什么 Kimi 会做这个场景?因为深度研究功能,最终为用户交付的是一份高质量、有信息密度,而且结构规整的研究报告。


我认为高质量的信息,是 Agent 做所有事情的起点。如果一个 Agent,连问题的来龙去脉都搞不清楚,那它怎么可能规划出来靠谱的执行路径?


最近圈子里又在谈提示词,有种观点认为提示词工程应该叫 Context 工程。概念不重要,重要的是大家意识到 Context 是 Agent 能够高效准确执行任务的关键。而我觉得,深度研究就是在为 AI 准备一个高质量的 Context。


而且,Kimi 的深度研究功能最终还为用户生成了一个可视化的网页,并且在检索资料的过程中,能明显看出来,它会不断地调用工具。这中间必定用到了 Coding 的能力,也就是说,Kimi 想把深度研究 Agent 做好,也就同时需要做好 Coding Agent。一石二鸟。


上手实测:信息可溯源,双报告交付


下面我分享下自己的一个真实案例。


香港四大才子之一的蔡澜先生上周去世,朋友圈很多人转发文章缅怀,也有人说他不值得我们纪念。这让我产生了很多兴趣,想去了解一下蔡先生的一生。过去,我对他的了解几乎是一片空白。


打开 Kimi,选择深度研究功能,最终拿到了一份深度的研究报告,和一个可视化的网页。整个过程中,有几个细节毕竟打动我:


1. 它主动使用中英文关键词,而不是只搜中文,极大提高了信息覆盖率;


2. 它至少规划了 80 组关键词,来自各类长尾渠道,包括南方周末、中国日报香港版、雅虎等权威信息源;


3. 当发现关键词策略不精准,它会主动纠偏、重写检索逻辑


4. 双报告交付:同步生成信息可溯源的万字深度报告 + 可交互可分享的可视化网页,满足深读与传播两类场景。


我具体说下自己的操作流程。首先输入问题:帮我介绍一下蔡澜。


很简单,我的问题没有多余的表达,也没有所谓的提示词技巧,就是想了解一下蔡澜。当我给出这样一个泛泛的指令后,Kimi 会先试着理解我的意图,主动细化问题,再与我确认边界。


Kimi Researcher 的这个交互和 ChatGPT 一致。但也有小惊喜,你看下面截图,它居然问我,是要写成人物传记还是简介。也就是说,它可以基于我的问题,生成不同风格的内容,而不仅仅是传统的分析报告。



我把同样的提示词给到 GPT,它的回答显然没有 Kimi Research 这么精细。



和 Kimi 确认了需求后,接下来,它会提示我研究正在进行中,在生成期间,我可以离开当前对话,做其他的事情。


特别有趣。Kimi 告诉我,它准备用中英文关键词一起去搜索。这一点超出我预期,毕竟按照我惯常的经验,国内的信息,一般只用中文关键词。这点小细节还是挺加分的。



接着,Kimi 会一轮一轮地搜索关键词,然后使用浏览器浏览网页。我没有细算,整体下来,它至少规划了 80 组关键词来找蔡澜先生的信息。下面是其中一个截图,信源的广度和深度太强了。



nfnews 这个域名,估计大多数人都没听过。其实它背后是南方报业传媒集团,信息相当权威。还有,下面截图的网址,是《中国日报》的香港版网站,同样是一个很权威和专业的信息源。



看到这里,我突然想到 4 月底时, Kimi 母公司月之暗面与财新传媒达成合作的消息。我推测那时候,Kimi 应该就是在为深度研究功能做铺垫,他们想找到行业里最权威和专业的信息源。毕竟,没有好的信源,深度研究最后输出的结果,也不可能专业。



下面是 Kimi Researcher 在研究过程中的一次主动纠偏,它自己发现之前的关键词不够精准,所以导致部分内容有混淆,于是决定修正关键词。这真的真的和人类的逻辑很像。



我们都知道,AI 很容易出现幻觉,甚至一本正经地胡说八道,但让它自己主动认错几乎不可能。Kimi 能通过信息对比,发现自己的问题,还会主动纠偏,这一点不错。其实这也是 Agent 和之前基于 Workflow 的假 Agent 的最主要区别。


而且只要发现原先的方式拿不到足够信息,Kimi 还会像真人一样,马上调整策略。比如像下面这样,发现关于蔡澜的美食哲学和人生理念还不清晰,它就会主动调整搜索策略,把重心转到这些核心内容上,直到把细节补齐。



当所有资源全部收集完成之后,Kimi 开始进行最后的成文工作。



卡了下时间,这次生成一共用时 16 分钟。最终,它给我交付了两个成果:


一个是信息详实的深度研究报告,9345 个字,引用了将近 30 个可溯源信源。所有引用都内嵌在正文中,点击引用就能跳转查看对应的信源。并且关键信息还加了高亮,特别贴心。



不过这份文档也有点小瑕疵,有部分 Markdown 语法高亮没有正常显示,应该是前端的 Bug?不重要,瑕不掩瑜。



另一个是一份可视化的网页,可以交互,也能分享。我理解这是对前面那份详实、将近万字研究报告的精简版本,而且贴心地制作了专门的图片和表格,读起来压力会小很多。


我放一张 Gif 大家看下,左侧是目录,想看哪部分,直接点目录就会跳到对应内容部分。同样这份报告中,也带有具体的信源。


注意,这不是一个 PPT,而是一个网页。也就是说,Kimi  基于对信息的理解能力,做出来一份包含关键信息的可视化网页,该配图的地方配图,该加表格的地方加表格。



这也证明了我的猜想。Kimi 在深度研究的 Agent 中,同样用到了 Coding 的能力。说个我的暴论:深度研究和 Coding 能力,接下来会成为所有通用型 Agent 的基础。


难而正确的事


很多人在 DeepSeek 发布之后唱衰 Kimi,觉得它沉默太久、掉队了。但如果你长期关注这个行业,就会明白,模型能力和产品节奏从来不是线性的比拼,也不是三个月一轮的排名赛。


之前看到有一个从业者说,爱迪生晚两天掏出灯泡,没什么大不了的。真正重要的,不是你是不是第一个做,而是你是不是在正确的方向上,做着正确的事。


在 36Kr 看了一篇采访,大意是说,今年的市场环境,反而利于 Kimi、MiniMax 这种更专注模型和产品的初创公司。去年整个行业还在拼投流、拼资本,谁更会讲故事、买渠道,谁就能跑得快。


那套打法,大公司更擅长,Kimi 当时也在激进投流,被迫卷入了大厂最擅长、最内卷的那条赛道。那段时间看似热闹,但也许那段时间才是 Kimi 的至暗时刻,是它的“绝望之谷”。


今年,至少我觉得,创业公司的思路已经非常清晰,只要做出来好的产品,市场就会买单。所有人,在当前的时间节点,都应该拼技术创新,拼团队对于未来行业发展的预判。


模型即 Agent。接下来,Kimi 要在 Agent 方向正式出招了。王慧文在很早之前创业时说他们公司模型和应用两手都要抓,目前看,倒是不需要两手抓,因为这两件事,越来越收敛为同一件事。


Kimi 有相对充足的资源,团队人才密度也很高。这个阶段,他们没有被短期数据牵着走,而是选择了一条更慢的路,试图去做通用智能。这件事不容易,我很敬佩,这是在做难而正确的事情。


本文来自微信公众号:AI产品阿颖,作者:阿颖

相关内容

热门资讯

卖掉度假房 以下是 200 字描述卖掉度假房:如今,我们决定卖掉那处承载着无数美好回忆的度假房。它坐落在宁静的海...
原创 以... 在资本与技术角力愈演愈烈的2025年,张一鸣再次站上了聚光灯下——这一次不是因为抖音的爆款产品,也不...
原创 “... 大东南近日的股价有“妖”气。 行情显示,6月24日至6月30日,大东南股价迎来连板,累计涨幅达61....
日本航空回应上海至东京航班备降... 【JL8696/IJ004航班 (上海浦东-东京成田) 备降关西国际机场的情况说明】2025年6月3...
“粤车南下”推进中,深圳人还会... “粤车南下”这一举措正在推进,它给两地的交流带来了新的契机。对于深圳人是否还会涌入香港这一问题,存在...
众口悠悠倒蔡澜 “众口悠悠倒蔡澜”,曾几何时,蔡澜这位美食家、文化人在众人心中有着极高的地位。然而,不知何时起,舆论...
“当前访问人数过多,请稍后再试... 今早,众多用户前往查询账户时,却惊喜地发现账户中多了一笔钱。然而,由于当前访问人数过多,系统出现了短...
难!2025过半,楼市还在回稳... 一转眼,2025年即将过半。 上半年,西安楼市经历了前所未有的变化,可以总结为“政策力度空前、土地热...
金浦钛业陷连年亏损困局,实控人... 图片来源:图虫创意 6月30日盘后,金浦钛业(000545.SZ)公告正筹划重大资产置换、发行股份及...
韦韬任广西壮族自治区党委副书记 广西日报7月1日消息,中共中央批准:韦韬同志任广西壮族自治区党委委员、常委、副书记。广西壮族自治区党...
10年老将杨帆辞任信美人寿董事... 6月30日,信美人寿相互保险社(下称“信美人寿”)发布公告称,杨帆因个人原因辞去该社董事长、董事会战...
腾讯发布2024年度可持续社会... 深圳商报•读创客户端记者 陈姝 在深圳的一家医院里,43岁的叶敏(化名)因休克情况危急。被送进ICU...
医生把输卵管错当阑尾切除,院方... 近日,一则令人震惊的医疗事件引发广泛关注。某医院的一位医生在进行手术时,不慎将患者的输卵管错当成阑尾...
证券投顾公司虚假宣传诱导缴费,...   在抖音直播炒股,朋友圈推送炒股信息的这些公司,基本上都是有牌照的一些证券投顾公司(其中也有没有资...
充电宝上高铁要符合哪些条件?国... 民航局禁止携带“没有3C标识、被召回范围的充电宝上机”的规定,持续引发舆论关注,公众关心高铁站是否也...
新增一季茶,多条致富路!麒麟山... “新增一季茶,多条致富路!”麒麟山茶业迎夏采的盛景令人惊叹。夏日的阳光洒在茶园间,翠绿的茶叶在微风中...
深莞交界处,每天摸过1500个... 在深莞交界处,有这样一群特殊的家庭女工。她们每天的工作,就是小心翼翼地摸过 1500 个 Labub...
深圳综改有望试点红筹股二次上市... 深圳资本市场近日迎来重大政策突破。据权威渠道披露,中共中央办公厅、国务院办公厅印发的《关于深入推进深...
华尔街大多头:标普500指数五... 财联社7月1日讯(编辑 黄君芝)今年上半年,在“特朗普关税”、地缘政治紧张局势等一系列冲击下,美股仿...