“中国 AI 投资人:练习时长两年半”,这看似一句独特的表达,却蕴含着深厚的内涵。这位投资人在 AI 领域潜心钻研已有两年半之久,如同不断磨砺技艺的武者,积累了丰富的经验与知识。两年半的时光里,他穿梭于各个 AI 项目之间,敏锐地捕捉着潜在的投资机会,凭借着扎实的专业素养和独到的眼光,在竞争激烈的投资圈中崭露头角。他就像那默默耕耘的农夫,期待着 AI 领域的丰硕成果,用自己的行动诠释着对 AI 投资的热爱与执着。
大模型的序章结束了。
模型的故事发生了一些微妙的变化,比如,没人敢说中国模型不行了。
所有投资人都告诉我们:“这个真的要感谢 DeepSeek”。
也要感谢 Manus,他们最先搭出了一个产品,证明了产品的技术栈正在变复杂。复杂会带来多元,多元意味着更多可能性。
Manus 也证明了一句大家前两年还有点心虚的话:应用是中国公司的主场。
变化有目共睹,或许“下半场”的判断还为时尚早,但这一定是新的篇章,Chapter 2。越来越多的应用创业者下场,老牌的美元 VC 重新活跃起来,消费、硬科技、纯人民币基金开始频繁找 AI 项目,大洋对岸的美元也开始悄悄关注中国创业团队。
过去几周, Founder Park 访谈了十多家投资机构,美元、人民币、大厂战投、新成立的基金。这些活跃在一线的投资人们,不论年龄、资历、title,他们积极甚至激进。感谢他们的信任,我们在交流中收获了极高密度的信息和洞察。经过我们的梳理,将部分可公开的对话整理成文,希望能为当下的 AI 创业者提供一些有参考价值的思考。
在投资和创业的 context gap 中,希望这样的弥合工作有它的意义。
一些访谈碎片:
模型不是 VC 的 game,DeepSeek 已经教大家怎么做模型了。
今天要求创始人在 Day One 就想清楚是不对的。技术还没收敛,更重要的是不停 build 不停交付的能力。
把 AI 玩具做得 fluffy,是一条危险的捷径。
ComfyUI 是一个非常社区化的产品,它的生命力来源于社区。所以,答案可能还是要去社区里寻找。
Plaud 年收入超过 7000 万美金。Plaud Note 这种形态的产品,已经出来快两年了,在今天的市场上,我好像找不到第二个竞争对手。为什么?
创业者早期拿太多钱可能会让动作变形。早期张一鸣拿了多少钱?现在很多背景不错的创始人,一出来就是几轮,有点重现当年最疯狂的时候,华贸一天闭环,三轮结束了啊。
1 万付费用户,你就是顶级 AI 产品。
ARR 概念诞生的时候,是为了“挤水分”的。游戏公司要不要也算个 ARR?
Prosumer 的产品,审美、风格和细节是专业用户的无止境追求,也是创业公司的机会所在。
垂直领域的 AI Agent 绝不能按过去投中国 SaaS 的逻辑去看。中国 SaaS 市场这么些年,中国投资人交了这么多学费,它很清晰的特点是为结果付费,而不是为效率工具付费。
很多时候我们拒绝,是觉得创始人自己并没有真正进入“创业状态”。可能信心和勇气到了,但整体动作、思考深度还没到。事可以变,但创业状态不对,在这个时代会非常困难。上了战场就下不来了。
我觉得最值得做的,还是找到创始人自己真正为之兴奋的事,而不是到某个“范式”而去里面做填空题,我们还是更喜欢看到创业者能做一个 “供给创造需求” 的事,这应该会很开心。
Manus 办公室有张海报,是推特截图,大意是:一个硅谷 VC 朋友说,Manus 让他想起了硅谷黄金时代的 “old silicon valley”—— No secrets, just sheer execution speed。 (没有秘密,只有纯粹的执行速度)。
一、如何定义 Manus 的成功?
Founder Park:Manus 作为一家 AI 应用创业公司,引起了全球范围内的关注,公司也顺利拿到硅谷 VC 的投资。它对中国其他创业公司有怎样的参考意义?
创新工场任博冰:Manus 有两点很有意思:
全球化营销:作为一家中国公司,通过产品和营销策略迅速获得了全球范围的认可,这是一件很难的事情。很多中国公司尝试过,但影响力往往难以持久。
海外融资: 它探索并走通了“中国公司美国融资”这条路,这对我们很有参考价值。
Monica 这个团队本身也值得研究。肖弘、Peak、张涛,这家公司从最初的连续创业,到 2024 年其实有一段时间没有找到第二曲线,后来 Peak 和张涛加入,做出来新东西,这个路径也非常有研究价值,对我们在看新的公司时很有参考意义。
锦秋基金臧天宇:他们能在北美拿到融资,我觉得是多方面因素促成的:
Manus 团队的努力是最重要的。他们通过 PLG 的方式实现了有效的增长,有非常陡峭的增长斜率,对于国内团队引起硅谷机构的认知是非常重要的。
海外也有一些机构会比较反共识地看好中国新一代创业者的能力和出海潜力,他们会做很深度的 coach,也会带来一些资源。AI 放大了优秀 Founder 的能力边界,这会是一个英雄辈出的时代。 Manus 团队就是典型的 AI 时代的创业者画像。锦秋要做的,就是做他们最坚实的后盾和战友。
线性资本郑灿:Manus 首次将多种现有(包括刚出现的)AI 能力,特别是模型推理能力整合在一起,提供了一个处理复杂、长程任务的惊艳体验。之前的 Devin 体验较差,Deep Research 虽然体验好,但任务形态相对单一。Manus 则展示了处理多样化长程任务的可能性,这个体验非常漂亮。
Manus 之前他们花了些时间探索,我个人理解,是内部在不断调整以寻找 PMF 的过程。
Manus 本身可能不需要特别大量的人手花超过半年的时间开发,但关键在于团队把握产品方向和及时调整的能力,尤其是在技术快速迭代的环境下,这非常重要。面对一个“all moving pieces”的局面,他们没有死磕最初的想法,而是在任何时间点都选择一个当下最有可能爆发的产品方向和攻击角度,持续调整,直到找到 Manus 这个突破口。这种在技术变化进程中的 pivot 能力很强。
Founder Park:真格投资 Manus 的逻辑是什么?你们很早就知道他们要做 Agent 吗?
真格基金刘元:如果按“投 Agent”的逻辑去找项目,永远不可能投到 Manus。
我们历史上投了肖弘四次,从他上一个项目开始。
第一次创业: 上一个项目,大家都知道了。(壹伴助手和微伴助手,公众号运营工具,后卖给独角兽公司)
第二次创业(蝴蝶效应)天使轮: 方向是做中国的 Benchling(生物科学领域 SaaS,估值 60 亿美金),我们投了天使轮,那时还没产品。
第二轮融资: 主要产品是 Monica 插件,买了 ChatGPT for Google(Chrome 插件)。当时 Monica 刚开始做。那时有人说这是“套壳”,没技术含量。
第三轮融资: 主产品是 Monica.im(多端跨平台 AI 助手),收入已经不错了。当时团队跟投资人讲的故事是想做“AI 浏览器”,很多投资人并不看好这个故事。
这个过程充满了演进和转型。它不是一个典型的“Agent 公司”做出来的产品。
就像小红书,我们 9 年投了 4 次。如果你当年是想投“最好的内容电商”或“最好的内容社区”,你也不会找到小红书。它最早做的产品是 PDF 攻略,跟内容、电商、社区都没太大关系。
Founder Park:蝴蝶效应 Pivot 了三次,真格都参与了。在不断转型中,你们具体看到了什么特质?
真格基金刘元:他不是三次山穷水尽被迫转型,而是三次主动取舍。
做类 Benchling 时: 我们看到他用很少资源,在自己不算最熟悉的领域,做出了可用性和审美都很好的产品。
转向 ChatGPT for Google / Monica 时: 我们看到他不仅有能力做出高质量产品(类 Benchling 产品做出来但没发),还能“壮士断腕”,砍掉它去追逐更大的机会。这种战略取舍和执行力很牛。同时并行开发 Monica 并取得增长,证明了他的多线程能力。
Monica 壮大,构思浏览器时: 我们看到他抓住机会,在短时间内把 Monica 在海外做到了相当大的用户和收入规模。他一个很少出国的人,做出纯海外用户的大体量产品,这非常厉害。虽然浏览器没发,但再次证明了他对产品的极致要求和战略定力。
所以,这三次转型,我们看到的都是他的进步,信心是越来越足的。Manus 的出现,感觉是水到渠成。
历史上,真格很多成功案例都经历了激烈转型。从 PC 时代的聚美优品(从游戏转型电商),到 Anna(方爱之,真格基金创始合伙人)投的小红书,再到最近上市的地平线(真格也是天使投资人)。
Founder Park:Pivot 是创业中的重要命题。从你们的观察来看,成功的 Pivot 有没有一些共性或方法论?
真格基金刘元:首先我自己没领导过转型,可能没有资格谈。但从观察的视角,成功的转型往往不是因为原来的事做不下去了,而是在原有业务还不错、甚至很顺利的情况下,敏锐地发现了一个更大的机会,然后主动选择。
比如肖弘的转型,Jasper(AI 写作工具)的转型,都是在实践中真切地看到了一个更大的浪潮,然后决定去追。小红书也是这样。这种观察往往是独特的,因为你身处实践之中,别人看不到。
而不是说 A 做不了了,放弃,然后从零开始想 B。很多时候,转型是在已有基础上,看到了实践中涌现的、别人未必看得到的独特机会。
Founder Park:所以思考 Pivot,不是只在 0-1 或 1-10 不太顺利的时候,反而是在居安思危的阶段?
真格基金刘元:理论上是,但越往后,转型的沉没成本越高。如果当时第一个产品已经上线,有了很多用户和收入,他要砍掉去做完全不同的事,心理负担肯定会重很多。
Founder Park:团队在 Monica 的哪个阶段开始孵化 Manus?
真格基金刘元:浏览器产品当时其实已经做完了,我们甚至在一些内部活动展示过。但团队不满意,觉得它“长得太像浏览器了”,AI 时代的浏览器,不应该“长得像浏览器”。Manus 从某种意义上说也是个浏览器,但形态完全不同。
Founder Park:做完发出来,好像也没什么损失?
真格基金刘元:对,类 Benchling 那个产品做好了,我也跟肖弘说过,挂出去试试呗,有人用就用,没人用就算了。他不发,就是不发。浏览器也是,我们都测试过,提了意见,他还是觉得不对,硬是没发。这就是 CEO 的决策和取舍,他们对自己要求非常高,觉得没达到想要的那种“different”的效果,就不出手。
Founder Park:Monica 是颠覆大家对“套壳”理解的非常重要的一款产品。
真格基金刘元:对,这点肖弘非常牛 x。我记得他在 Manus 发布前一个月还发过一条即刻,“相信我,壳有壳的用处。”
Founder Park:蝴蝶效应这家公司的成长路径对其他创业者有什么参考意义?
真格基金刘元:肖弘他们没有什么惊艳的背景,就是大学生创业,参加创业协会、黑客松,拿点天使投资。他的每一步,其他创业者并非遥不可及。不像有些天才创业者,你会觉得“哇,那是天才”。
肖弘就是一步一个脚印,像蜗牛一样往上爬。他一个国内团队,没什么海外背景,做出了全球产品;非技术大牛出身,做出了 Jack Dorsey、Andrej Kaparthy、Thomas Wolf 都在转的产品;吸引了非常厉害的人才。
他经常说“平凡人做不凡事”,招人也不迷信光环。这说明了实践、在环境中学习、迭代的重要性。
二、DeepSeek 改变了什么?
Founder Park:DeepSeek 爆火是今年最重要的黑天鹅事件,它改变了什么?
创新工场任博冰:DeepSeek 改变了中国研究型公司的标准,不仅是商业化,还有影响力。
我们最近有跟很多科研机构交流,也包括一些企业,比如阿里的 Qwen 3,影响力是重要的标准。国内很多人工智能研究院,把 Paper 的标准也改了,甚至不发 Paper 也能毕业,教授不需要太多引用量也可以获得大量的经费支持。Tech report、开源项目,这些好的成果都没法用量化的方式判断,有些开源项目的 star 数可能水分很大。真正好的东西,大家自然会知道,不用刻意制定标准。如果你纠结如何评价,可能只是因为东西还不够好。
这是一个多年来大家心知肚明的问题,只是过去不愿意承认。(DeepSeek 事件)让大家意识到,其实学术圈的问题不止是算力的问题,还是机制的问题,甚至是目标管理方式的问题。很多研究不需要那么多算力,而且最近,很多学员也拿到了非常多的算力。大家都在自我反思,追求第一性地做科研,做企业。DeepSeek 对整个国内的 AI 生态,不论是科研还是企业的目标,都带来了非常良性的变化。
线性资本郑灿:DeepSeek 带来了几个关键变化:
降低门槛与成本:它本身能力很强,处于第一梯队。开源让大家有机会自行托管(host)或找到第三方托管,从而显著降低使用大模型的成本。一个有趣的现象是,在 2024 年一整年,H200 GPU 的租金都在下降,但 DeepSeek 发布后,美国 H200 GPU 的租金上涨了 10%。
促进小模型发展:开源模型让开发者可以更低成本、更放手地去蒸馏(distill)出性能更好的小模型,这对开发者生态是极大的利好。
普及推理能力:DeepSeek 出来之前,除了 OpenAI,还没有公司做出来推理模型。它的出现直接刺激了各大厂纷纷推出自己的推理模型。更重要的是,DeepSeek 完全开放了思维链,这为训练推理能力更强的模型提供了宝贵的、广泛的训练数据。已经有团队在利用 DeepSeek 的思维链数据训练自己的模型了。这本身就是对行业的贡献。
加速 AI 商业化:DeepSeek 的影响力,尤其是其强大的能力和开源特性,大大降低了 AI 的客户教育成本。去年很多企业,包括大型企业,还在犹豫是否要用 AI,业务部门需要费力说服老板。DeepSeek 之后,这种讨论和说服变得容易多了,很多企业开始主动询问“我们该怎么用?”,甚至“先不管那么多,搞一个来试试”。这直接推动了 AI 的商业化进程。
Deepseek 证明了 L2 对 L1 产品的降维打击
明势创投夏令:DeepSeek,尤其是 R1 带来的生态影响对我们影响很大。如果参考 OpenAI 提出的 AI 能力 L1-L5 分级,其实已经明确来到了 L2 阶段:
L1:Chatbot(对话);
L2:Reasoner(推理解决问题);
L3:Agent(调用工具完成复杂任务)。
DeepSeek R1 和 OpenAI 的 o 系列可以看作是 L2 级别的模型和产品。L2 的出现,对 L1 级别的产品是降维打击。之前积累的 DAU、工程优化等在 L2 面前可能不堪一击。这对我们的启示是:
L1 层面的竞争已无意义,必须升级。
L3(Agent)何时到来变得至关重要。 我们已经看到 L2 对 L1 的冲击,L3 来了,对 L2 又是降维打击。
春节后我们跟国内和海外大模型公司交流,他们给出的 L3 时间点是超出我们预期的,他们普遍认为是一年之内,甚至更激进地认为可能就在 2025 年内就可以发展到 L3 阶段。
对投资组合的意义:
模型公司:持续加大投入,像 MiniMax,24 年下半年就已经调整策略,模型要追求更高上限,瞄准 L3。
产品型公司:如果还停留在 L1,现在面临的最大问题是你的 L2、L3 是什么?必须前瞻性思考和布局,否则当前的投入很可能无效。
Manus 是一个 L3 产品的雏形。虽然在测评中比分高的部分并不是严格意义的 Agent,他们对于需要多步推理和使用多种工具的任务完成度仍较弱,效果肯定满足不了大家的需求,但它验证了 L3 Agent 产品形态的趋势,它的出现肯定会对 L2 产品形成冲击。
对产品型公司来说,最迫切的是:
尽快思考 L2/L3 形态是什么: 做规划,明确时间表,哪怕是直觉驱动的,调整产品规划和资源分配,向 Agent 方向演进。
厘清与模型公司的关系: 大多数产品型公司不具备自研模型能力。今天的模型公司正在持续提升自己的模型能力和模型边界,提供模型、推理、Memory、工具等,提供一个完整的 System 而不是一个简单的 Model,目标是 Agent 能完成人 80% 的工作。这种情况下,产品公司应思考如何利用模型公司的能力成长,而不是跟他们直接竞争。
聚焦专业领域: 尤其是“Save Time”类产品,应尽可能面向专业人群、专业领域,避开模型公司能力边界扩张带来的直接冲击,要考虑到模型公司能力和边界的扩张对你的业务的影响。
三、大模型六小虎,接下来如何?
Founder Park:对于现有的“六小虎”等模型公司,怎么看后续发展?MiniMax 的前景如何?
明势创投夏令:我们 2022 年初投资 MiniMax 的时候,大模型还是非共识。一年之后当共识形成,对我们而言就过了早期投资阶段,2023 年起所有新成立的大模型创业公司我们均没有投资。
时至今日,对于仍坚持做模型的公司,要跑出来,前提是模型能力持续保持在第一梯队。这需要:
充足的资源:钱、卡。
强大的工程化能力和高人才密度团队。
战略清晰:认识到模型需持续追求技术上限,产品的归产品,不要以短期 DAU 等为导向,要有战略的判断和调整。
我们依然坚定看好 MiniMax,因为它:
调整早:去年下半年已完成模型优先的战略调整,而不是在 DeepSeek 之后。
资源足:是国内创业公司中人才团队、现金储备、算力集群规模领先的公司之一。
产品能力强:多个产品在细分领域保持全球领先。
MiniMax 同样也将模型技术开源,并做了前沿探索,比如 在 Transformer 底层有自己的创新,非共识的在国内走 Linear Attention 路线从而支持 long context 的“大海捞针”命中率极高,这在 Agent 阶段会越发重要。
Founder Park:真格投了 Kimi,怎么看?
真格基金刘元:Kimi 到今天,还是初创公司里最执着于去拼 SOTA 模型、抢夺“皇冠上的明珠”的那一个。
所以到今天,虽然竞争日益激烈和收敛,回头来看投资月之暗面仍然是作为一个 VC 最好的选择。
Founder Park:过去两年,资金主要集中在模型层。现在模型公司融资似乎遇到挑战,那接下来,市场上的资金会流向哪里?
Alphaist 陈哲:反正我觉得不应该投模型,(我在之前的基金)一个模型都没投。我觉得模型不是一个 VC 生意,从 VC 的角度去做这个事情没什么意义。
移动互联网时代,真正浪潮起来的时候,也没有很多人真的跑去做操作系统。你看上个时代,真正有底层平台型机会(算力、OS)的创业公司里面只有小米一家。华为 OV 都是老公司,而且当年都是直接 follow Android 生态。为什么今天大家觉得一个创业公司可以去把技术模型的生态给做起来呢?我当时没有想明白。移动互联网真正出现机会的时候,其实是各种各样新鲜的小东西会出现。我觉得今天跟当年的情况有点像。
VC 这个行业,就像我基金的名字(Alphaist),VC 永远是在寻找 Alpha。VC 肯定不是一个寻找 Beta 的游戏。
因为你要获得 venture 回报,你一定就需要 下注一个大家没有那么看好,或者大家不太敢 bet 的事情。那核心就是你必须找到这里面的非共识,必须找到这边的 Outlier。我觉得这是 VC 这个游戏的本质,所有好的 VC Deal 都是这么出来的。所有 Party Round 的就没有好 deal。这是本质,但是大家会觉得不舒适,因为这个东西太反人性了。
Founder Park:集中的大额投资,比如过去两年的六小虎,现在也阶段性结束了。
Atypical 邵帅:这其实涉及到在不同创新阶段的投资逻辑。
在理论创新阶段,(如 OpenAI 早期探索语言模型的 Scaling Law,或固态电池研发等)风险极高,不确定性也大,因此更适合产业资本或非盈利组织,比如马斯克和 DeepSeek 的模式,这不是 VC 的菜。
在技术创新阶段(如近两年大模型技术路线逐渐清晰,大家开始卷算法、工程、训练方法),VC 们可以开始进入投资,但主要还是少数技术精英的游戏,技术壁垒仍然较高。
在产品创新阶段(技术门槛相对降低,重点转向如何将技术组合成应用,创造用户价值),这也是市场最大的红利期,也是 VC 的主战场。此时,投资的重点回归到产品、用户需求和商业模式这些基本面上。
我们现在正处在从技术创新向产品创新过渡的关键拐点。这个阶段将涌现大量机会,是早期 VC 的最佳时机。但也正因为如此,优秀项目将变得更加抢手,估值水涨船高。这对早期基金提出了更高的要求,要看得更早,决策更快,更果断。
靖亚资本何沛:在投大模型的时期,市场关注的是中国能否诞生 OpenAI 这样的世界级 AI 公司,所以顶级的 AI 学者或科学家会大受青睐。但有这种背景和能力的创业者数量是少的。
现在大家的关注点已经从大模型转到了应用层。应用层创业的逻辑是完全不同的,顶级学者或大厂背景出身并不必然等同于能做出优秀产品。如今,大家似乎又回到了同一起跑线,比拼的是对场景的深刻理解、对用户的精准洞察以及产品创新能力。理论上大家都有机会,我觉得创业项目会很多的。
Founder Park:过去两年投大模型是在寻找中国的“OpenAI”,现在结论趋于清晰,VC 又回到了更擅长的领域,识别人、找到合适的应用场景?
靖亚资本何沛:是的,之前投大模型公司是为梦想(AGI)投资,现在头部公司已经拿了非常多的钱,再投新的公司意义不是很大。但应用层投资才刚刚开始,目前看到的跑得快的 AI 公司收入起量快得惊人,也会刺激 VC 的情绪。
应用层的投资逻辑,不是大模型领域投人才的稀缺性,而是要找到好的场景、找到真正懂用户、能做出用户愿意花钱买单的产品的创业者。我们更想投“有理想但不理想化”的创始人。
四、“模型即产品”是一种错觉
Founder Park:怎么看 GPT-4o 和 Gemini 2.5 Pro 带来的“模型即产品”的讨论?
Alphaist 陈哲:GPT-4o 和 Gemini 2.5 Pro 做出这个结果也不奇怪。我去年年底去湾区的时候,跟几个 Google 的前同事(陈哲此前在 Google X,负责 Google Glass 的工作)聊过。我的感受就是 Google 做出这个东西完全符合预期,而且 Google 还有更多的东西没放出来。他们在多模态模型的训练、数据和清洗这方面的能力已经远超市场上的公司了。
这些可能还是反映了一个事情:基础模型,尤其包括未来的多模态,以后的具身,在模型框架开始收敛的情况下,那肯定是谁有算力、谁有数据就会更有优势。目前真正有算力、有数据的就这几个大厂,所以他们得出这个结果我觉得完全不奇怪。创业公司应该更早地想明白,如果这个是个必然的结果,自己应该找一个什么样的位置?
高瓴创投王蓓:之所以现在大家讨论“模型即产品”,是因为我们正处在模型快速迭代,而产品尚未明确交付显著成果(deliver result)的阶段。也就是说,我们处于基础设施(infrastructure)快速演进的过程中。
这个阶段看到更多的是模型自身的变化,就是基座模型,包括语言模型、多模态模型,甚至具身智能模型,这些都属于底层基座能力的迭代。但这是否意味着产品层面的变化?产品层面的变革才刚刚开始。
高瓴创投(GL Ventures)很早就支持了模型公司。我们是 MiniMax 的最早的投资人,那还是 2021 年下半年,当时 ChatGPT 3.5 还没出来、大模型根本还不是融资主题。在投了几家重要的模型公司之后,我们也一直在看产品。很多优秀的产品经理也希望能做出有特色、有亮点的 AI 产品。
为什么之前很难跑出好的产品,还是因为模型能力还不够强。纯语言交互的产品形态相对单薄,用户更期待多模态体验。而多模态技术(如 Diffusion Model)在过去的迭代中还不够成熟,产品经理想利用底层模型能力做出好产品,难度很大。这就给大家造成了一个错觉,似乎模型本身就是产品。但我们认为,未来仍然是产品的天下。
Founder Park:模型吃掉上层的框架甚至产品,比如 GPT-4o 对于 ComfyUI 等工作流带来比较大的冲击,做 workflow 的创业公司应该怎么办?(ComfyUI 是一款用于 AI 视频生成的开源可视化流程工具,作为 Stable Diffusion 的插件发布,用户可以通过节点连接精细控制视频生成过程,并支持工作流模板的复用分享。深受专业设计人士和开发者喜爱。ComfyUI 最早由开发者 Comfyanonymous 个人开发,现团队位于美国旧金山)
创新工场任博冰:技术发展是螺旋上升的。大家之前可能过于追求统一标准,但很多标准本身就是阶段性的,甚至可能是错的。就像 Agent,Deep Research 是个模型,但也可以用 Agent 实现类似功能。未来是追求单一强大模型还是复杂 Agent 系统?这没有定论,会不断演进。
ComfyUI 当然可以实现类似 4o 的效果,但 4o 用一个模型就解决了部分问题(图像)。视频生成也是如此,我们投的一家公司(本月中会发布成果)就采用了完全不同的技术路径,不是 DiT 的路径。
技术突破会不断改变对工具链的认知。目前工具链的问题在于:做多模态的人太依赖现有工具链,并且会假设模型不会有颠覆性提升。
这两点都是错的。多模态模型(图像、视频)其实变化非常快,甚至比语言模型更快(从 GAN 到 Diffusion 到 AR,每次大变化也就两年左右)。大家之前太关注语言模型而忽视了这一点。
因此,创业者需要:
工具链的冗余度: 工具链设计必须有巨大的冗余度,能容纳未来的技术突破。
定义新产品: 要追求实现之前无法实现的新产品形态,而不是简单地用现有模型和工具复刻旧产品。比如,现在做 AI 短视频,很多 Agent 方案可能都有问题,因为未来直接生成可能就不需要那么复杂的 Agent 了。工具的目的是服务于新形态的视频,甚至定义新的视频类型。我们即将发布的新视频生成技术,其产出物就和之前的视频不是一回事,工具链自然也要随之改变。
关键在于团队对创业方向的定义:我到底在解决什么问题?这对工具类公司尤其难。很多人基于现有内容平台和形态去做工具,短期能吃到红利,但这如同在沙滩上盖城堡,一旦内容平台或形态变化,工具价值就可能消失。
需要在短期红利和长期风险间找到平衡。既要吃短期红利,也要在架构和内容形态上留有足够冗余。不能让现有的工具定义你的技术路径 。
锦秋基金臧天宇:ComfyUI 的用户主要是专业设计师或 AI 创意工作者。对他们来讲,GPT-4o 提升了图像生成质量和语义理解,但 ComfyUI 提供的节点式工作流、对生成过程的精细控制、本地化部署、隐私友好等特性,可能仍然是无法完全替代的。GPT-4o 可以作为 ComfyUI 工作流中的一个强大节点,而不是完全取代它。而且 ComfyUI 支持的不只是图像生成,还有视频生成等,我们投的一些视频工具团队也在使用它。
所以,我不认为 GPT-4o 的能力会简单地颠覆 ComfyUI 或基于它的应用生态。
Coding 领域的 Devin 本身也是一个 Agent 应用,它不是底层模型。它是在好的底模基础上,构建了一个面向专业编程场景的 Coding Agent 应用。模型能力的提升(比如 Claude 3.7)反而直接提升了 Devin 这类应用的性能。这恰恰说明了在强大底模基础上构建优秀工作流应用的价值。(Devin 是 Cognition AI 的核心产品,头部 AI 编码工具。2024 年 12 月,Devin 开启商业化,针对 Team 客户收费 500 美元/月。Cognition AI 于 2024 年在美国旧金山成立,创始人兼 CEO Scott Wu,华人创业者,曾担任 Lunchclub 联合创始人兼首席技术官及在 Addepar 软件工程师。2024 年 4 月,拿到来自 Founders Fund、Khosla Ventures 1.75 亿美元投资,估值达到 20 亿美元)
线性资本郑灿:ComfyUI 是一个非常社区化的产品,它的生命力来源于社区。所以,答案可能还是要去社区里寻找。
虽然长得像 ComfyUI 的工具很多,但它是大家最喜欢的产品之一。GPT-4o 的确提升了图像生成的基线水平,但它肯定也有解决不了的问题。这些问题,最终可能还是需要社区的力量去解决。正是因为 ComfyUI 建立了强大的社区,当它受到新技术冲击时,其内部反而会因为社区的活力而产生新的生命力。它的生命力就在于社区。
五、元宝登陆微信,对创业者来说意味着什么?
Founder Park:您之前从业,领投了拼多多 B 轮,非常早期。现在很多人把拼多多的成功归因于微信入口。最近也看到腾讯的元宝在微信里推广,您怎么看微信这类超级入口对创业者的影响?尤其是一些想在微信生态里做事的创业者?
高瓴创投王蓓:提到拼多多,大家都觉得是因为微信。但实际上,我 2015 年认识黄峥和他的公司,应该是第一个认可“拼多多”这个概念的投资人(之前是“拼好货”)。其实翻看当时的投资报告,里面完全没有“微信生态”这四个字。
我们当时投的逻辑,更多是一个词:信噪比,信息和噪音的比率。一个好的产品,如果在任何环境下都能体现出更高的信噪比——用户看到不反感,觉得有用——那它就能成功。不管今天载体是微信、微博,甚至是短信、飞信,只要是在人与人可以沟通的环境里,它能提高信息传递效率和决策效率,它就能成。
我们当时花很多时间去还原拼多多到底是什么?我们还原的是菜市场和早市。你看到一群人在抢菜,你路过时总会多看一眼。那这个菜市场,是不是就是大家的“微信”呢?(笑)
还是那句话,太阳底下无新事。很多模式和场景几百几千年前就有了,我们只是在当下找到一个合适的载体。能快速发展的唯一原因,就是你的信噪比高。
Founder Park:所以迁移到现在的 AI 领域,如果腾讯利用微信能力做对了,无可厚非;如果没做对,那就是创业者的机会?
高瓴创投王蓓:对。谁能在这个技术变量上更好地抓住机会,利用好当前所有的信息传递渠道(比如社交媒体),解决信息不对称问题,谁就能成功。信息从不对称到对称的过程,也是用户和数据量级变化的过程。任何人抓住了这一点,无论大厂小厂还是创业者,都有机会。拼多多在海外没有用微信同样也做得很好。
只要在人类信息传递的载体里,你能找到对用户有用的点,让他觉得这个东西有用,就能成。
Founder Park:很精彩的视角。
高瓴创投王蓓:没有,其实也说不出什么高大上的词,就是很朴素的道理,能说明白就行。
六、为什么 Plaud 没有竞争对手?
Founder Park:AI 原生硬件,过去两年成绩最好的应该是 Plaud Note,2024 年年收入 7000 万美金。(Plaud Note 是 PLAUD.AI 的首款产品,AI 智能会议纪要录音笔。Plaud Note 是全球首款搭载 GPT-4 的 AI 录音笔,交付超 30 万台,采用了“硬件+订阅”并行的收费模式,年化收入达到一亿美金。PLAUD.AI 于 2021 年在美国成立,由许高创立,许高是一名连续创业者和投资人,曾投资早期 FA 机构小饭桌)
Alphaist 陈哲:Plaud 应该有接近百万的销量。我觉得它与其说是硬件产品,可能软件的部分占比还更大一些,因为它的硬件相对简单,ID 设计和工业复杂度来说,作为硬件产品来说还是比较简单的。
虽然它可能只有大几十万的量级,但对一家小公司来说,两年时间取得接近一亿美金的成绩,硬件+软件,作为一个小公司,而且不是特别擅长做智能硬件的团队,其实是一个很不错的成绩。
可能很多投资人刚看到 Plaud 这个产品的时候,都很难想象他能做到大几千万美金的收入,还有千万美金级的 recurring 的收入,还有六七成的毛利。
这就有一个我最近在思考的问题:Plaud Note 的竞品,在市场上很少。一个超薄的、iPhone 录音的配件,结合 GPT 的能力,这种形态的产品,它已经出来快两年了,在今天的市场上,我好像找不到第二个竞争对手。为什么?
当然它吃了硬件的红利,智能录音笔不是一个新的产品,科大讯飞和搜狗都做过,科大讯飞的录音笔有几十亿的收入规模,这不是一个新品类,而且没有 AI 总结,录音笔是一个“难用”的产品,只有文字转写,很难做出有用的价值。GPT 能力的普及让录音笔这个产品更有用了,Plaud 作为一个小团队取得了非常成功的结果,也验证了这个需求的存在。
Plaud 的切入,用了一个超薄的电池,超薄的 ID,是为了和 iPhone 配合,作为手机配件。
但今天很多人用它,跟手机已经没有太大关系了。大家没有把它贴在 iPhone 上用,反而当成一个正常的录音笔,好看、设计巧妙、很容易收纳,你可以放在钱包里,很容易携带使用。在这个逻辑下,今天的市场上我真的找不到第二个好产品,我也想找个替代品试试,但找不到。
可能有人会 argue,小米会做,安克会做。我相信有很多品类,比如智能眼镜,小米华为肯定会做,有几十个公司冲进去做,但也没有哪家实现几千万美元的收入,而且毛利还低,因为供应链把成本控制得很厉害。
我的一个逻辑是,Plaud 是华米 OV 肯定不会做的事情。 为什么呢?因为它不是一个亿级的 toC 产品。录音笔本来就是个百万到千万级的商务级产品。这种产品在大厂里面立项是非常困难的。想象一下小米做一个 Plaud 的山寨,就算做出来卖个一两百万台,会很难受,在内部一点不解决问题,那个负责人会被骂死的。这种方向丢给小米生态链公司,他们都不一定会正儿八经去做。
所以,有些方向是一定大厂会做的(比如智能眼镜、手环),但有些方向就是大厂真的是爱莫能助,因为内部的衡量机制和激励不鼓励他们做这样的事情。这就给创业公司留下了空间。
Founder Park:Plaud 后来做了一个 pendant 挂坠,这个领域很多人在做。
Alphaist 陈哲:Pendant is all bullshit,没有一个公司做得稍微成功一点。我当时在 Google Glass 的时候,各种可穿戴形态,我们都尝试过。Pendant 真的是个很糟糕的形态,它放在胸前,你的心跳都会对它有干扰,那个收音的位置,各方面都差很多,但架不住大家会前赴后继地尝试。
Founder Park:确实很多人在做,可能对比 Plaud 这种偏极客、商务,挂坠会有所谓女性向的市场。
Alphaist 陈哲:这是假设。这个产品并不难,12 个月的周期肯定能做出来,那就等 12 个月以后,看看能卖多少。能不能真的卖出去,能不能真的打动用户?如果不能,这个假设就是错的。
Founder Park:你会建议创业者做 Plaud 这种形态吗?
Alphaist 陈哲:倒没有建议大家做,更多是好奇大家如何思考这个问题,如何选择路线。我发现,很多创业者,尤其技术型创业者,他们喜欢做 fancy 的产品。
回到两年前,做个 Monica,可能很多人都难以启齿,觉得没有技术含量。实际上呢?他们做成了一个高黏性,有盈利,有持续增长的产品。
我觉得,对于 Plaud,包括我自己,作为投资人,直觉就觉得这件事太简单了。但实际上,这样一个简单的东西,如果你真的切入得很好,用户是会用的。但现在大家想各种各样的创新,做一个漂亮的挂坠,或者一个 fancy 的 AI 眼镜,有时候是事半功倍的。这件事我觉得很有意思,怎样的思考决策最终导向了事半功倍的情况?
现在的创业者、投资人,应该仔细思考,有哪些 Plaud Note 这样的机会?
Atypical 邵帅:这是一个很好的问题,有一个我想强调的观点:不要高估巨头,也不要低估创业公司执行速度的重要性。
很多时候,模仿者(山寨)和巨头的行动速度远比我们预期的要慢。举个例子,去年其实就有一些公司想做 AI 浏览器,我下意识地觉得,如果这个方向真的有机会,谷歌不是应该立马就能做吗?但现在看,虽然优秀的 AI 浏览器已经出现,谷歌似乎并没有立即做出反应。
所以,我们真的不能高估巨头的行动力。可能这个方向不在他们的核心战略中,比如巨头可能更注重大模型的开发、通用 Agent 等方向,也可能是因为公司组织架构的老化,导致执行的速度跟不上市场变化。创业公司在这一点上反而具有竞争优势。
回到 Plaud Note,为什么没有人模仿它呢?
一是非共识的市场判断,很多人至今没有意识到“声音记录”本身就是一个值得重视的市场。就像音频模型,过去大家都关注语言和视觉模型,音频一直被忽视,直到 ElevenLabs 的出现才开始引起注意。
二是对壁垒的误判,很多人会觉得,像会议纪要这种功能,其实飞书的妙记、手机 App 就能够做,为什么还需要专门的硬件呢?如果它的核心依赖于转写能力,那么它的壁垒在哪里?但其实我觉得 Plaud 在硬件本身已经做到足够简单和极致了,很难在同样的形态上再有超越,另外会议纪要的撰写质量也依然有很多工程细节可做,包括场景的继续加深,自动排 calendar,通知与会人等等。
三是对于小众市场的刻板印象,语音记录在很多行业中都有特定的解决方案,例如汽车销售的电子工牌、蓝领市场的录音设备、传统的录音笔 等,Plaud Note 采用的是“硬件+软件订阅”的定价模式,可能会让一些人觉得属于一个较为小众的市场。
即便是看到了 Plaud Note 的成功,这些疑虑也可能导致会让潜在的模仿者或巨头犹豫不决,最终导致它们的反应较慢。
锦秋基金臧天宇:(Plaud 没有很多竞品)首先可能跟硬件开发本身的门槛有关,从产品定义到 EVT、DVT、PVT 一系列流程,到最终导入量产,需要时间和资源,一个产品成熟至少得六个月到一年。Plaud 的产品又薄又轻,有漂亮的 ID 设计,是需要花时间打磨的,竞品跟进也需要付出相似的时间成本,因此存在一个领先的窗口期。
其次,这种垂类场景也限制了模仿的空间。Plaud 在领先的这段窗口期内增长迅速,很快建立了品牌认知。你要在一个已有品牌认知、规模中等的垂类市场里,推出一个完全一样的产品,并不是一个 ROI 很高的市场选择。如果没有明显的功能差异或升级,很难撼动原有玩家的地位。而市场空间又没有大到让新进者砸大量市场资源去做的程度。所以它现在这个局面也不意外。
硬件的另一个问题是它不像软件能小步快跑地迭代,一个生命周期走完了,就要准备下一个版本,中间的风险不小。
七、ARR 只是一个指标
Founder Park:最近 ARR (年度经常性收入) 这个指标很火,行业里有争议。怎么看这个指标?
高瓴创投王蓓:ARR 最早其实是个“挤水分”的概念,但现在反而可能包含了挺多噪音。我们开玩笑说,游戏公司哭晕了,要是用 ARR 算流水,那游戏公司是不是全世界 ARR 最高的?
最重要的还是还原用户的使用场景和行为习惯。看用户的转化漏斗是怎么形成的、用户在哪一层愿意付费、付费意味着什么?可能意味着某种程度的信任,但这只是此时此刻。
我们还要关注,用户付费之后,留存、使用频次、场景、时长是怎样的?用户用产品创造的东西,有没有下载下来?下载之后有没有分享?这些行为数据,可能比 ARR、比收入本身更重要。
收入往往是一个滞后的结果,前置的是高质量的用户行为。哪怕一个产品不产生收入,但用户行为质量很高,我们也认为它是高质量的产品。反之,如果只是通过各种手段(比如利用情绪 FOMO)促成了一个付费转化行为,但用户后续的使用频次、场景并不理想,那这个转化本身意义也不大。因此除了数据,我们也非常看重用户调研。
Founder Park:GenSpark Agent 发布 10 天就给出 ARR 数据,其实在业内有些争议。
高瓴创投王蓓:每家公司每一个当下的动作,背后可能有各种原因。对于创业公司来说,我们还是强调,要有足够的同理心,要站在这个创始人和团队的角度去想,比如它是希望让更多人知道我、关注我的产品?还是要用时间换更多的空间机会?
Founder Park:现在整体环境比较严苛,很多声音都在说创业者要从 Day One 就想商业模式,学会赚钱。
高瓴创投王蓓:很多年轻创业者(90 后、95 后甚至 00 后),他们首先希望完成一个自我认同的小闭环。比如做个东西放到 App Store,零推广下居然有人下载、有人转化,这对他们是巨大的快乐。这证明了 AI 或科技是一种平权运动,降低了创业门槛。我们非常乐见这样的事情发生。
他们早期可能不需要太多钱,我们也愿意见证他们“美”的过程。很多人的野心也是迭代的,先做小而美,再想怎么变大,以及如何在变大的同时保持美。
锦秋基金臧天宇:短期内很难有大的变化,市场上的资金属性决定了对商业化的关注度。甚至可能因为宏观因素变得更严苛,比如贸易摩擦。
我们认为,创业者不一定非要在 Day 1 就实现商业化,但路径思考是必须的。 Day 1 不赚钱可以,但 Day 1 就得想明白靠什么赚钱。你是想做大 DAU 靠广告,还是做订阅,或是其他模式?这个思考应该从一开始就有。当然,我们(作为美元基金)可能相对市场上一些机构(尤其是人民币基金)的要求会稍微灵活一些,但商业化本质的重要性是毋庸置疑的,毕竟创业最终是商业行为。
八、通用 Agent 在大厂射程范围内
Founder Park:通用 vs 垂直是现在的热点话题,有很多通用 Agent 陆续发布,但这个赛道似乎像通用模型一样,是个赢家通吃的终局?你怎么判断通用 Agent 和垂直 Agent 的创业机会?
Atypical 邵帅:通用 Agent 这一方向竞争异常激烈,而且它的未来充满不确定性,毕竟它在大模型厂商的射程之内。
我个人反而更关注那些独特且深入垂直行业的 AI Agent 应用。尽管通用 AI Agent 在许多场景下表现出色,但它也难以完美满足某些特定行业的专业需求。比如在金融投研、法律、医疗、销售线索挖掘等领域,这些行业对 AI Agent 的要求更加精细,需要更多专业知识、行业数据和工作流的整合。
对于创业者来说,瞄准一个 Niche Market,并深入其中,结合 AI 能力和行业的专业知识,形成独特的工作流壁垒,可能是更为稳妥的策略,且长期来看也具有更大的价值。
Creek Stone 李一豪: 从投资逻辑来看,尤其在看到 OpenAI 的 o 系列模型后,我们的重点在垂直领域。我们认为现在还没到通用人工智能的时代,当前的追求可能受上个时代“连接”带来巨大价值的惯性思维影响,现在更应该追求垂直智能,探索各个细分领域的“超智能”(Super Intelligence / ASI)。
顶层语言模型规划 + Computer Use 调用工具 + MCP 生态能力,但这套框架应该首先应用于垂直领域,RL 卷出超智能。The Bitter Lesson 告诉我们,深度智能来自算力的有效利用和 scaling,垂直 ASI 再到 orchestra 层面的搜索学习,才可能催生下一代更强的通用智能。
总的来说,这些事件让我们对投资、对中国创业者更有信心,指导我们更关注各类垂直领域的机会,当然 ToC 我们也会持续高度关注。
Founder Park:你们认为 AI 落地进程中,Agent 的发展会先经历垂直智能阶段,然后才可能走向通用?
Creek Stone 李一豪:是的。要解决社会重要问题或推动智能向上发展,首先要在各个领域树立起“超智能”,就像 AlphaGo/AlphaZero 在围棋、星际争霸中做到的那样。理论上,像 Excel 操作、商业分析、商务拓展等领域,都应该先通过这种 Search to Learn 的方式形成超智能。有了超越人类规划能力的绝对智能基础,上层组合的 Workflow 才有价值。否则,简单的流程组合很容易被模型性能的提升或深度垂直智能所碾压。这是一个分周期的事情。
另外,我们需要更多像 MCP 这样的关键组件。虽然目前看起来好像没有太多经济价值,但很关键。MCP 的成功部分源于 Anthropic 的号召力,生态中还有很多关键组件可以通过社区力量探索。在当前两极化的环境下,开源生态有独特价值,可能高通体系的、中国主导的完备方案需要各自完备一套,有可能未来会分离的,这类组件的价值未来会凸显。
锦秋基金臧天宇:行业还没有明确的共识。从我们的视角看:
通用 Agent:最终是跟着通用模型智能水平走的,可能是模型即产品的终极形态。当然这肯定也需要行业基建(比如 MCP)来配合。目前我们看到的这些所谓的通用产品的形态,应该离终极形态还是有差距的。然后像 Manus,可能他们现在先做成一个偏通用的形态推出来,但后边肯定也会看到平台上的用例更多集中在一些场景或者垂直方向上面,我觉得如果真的要迭代的话,可能后边它也会有一些侧重点。
垂直 Agent:在现阶段,能够在产品和工程层面去做的,肯定还是会垂直到某些方向上去的。比如大家讨论的通过强化学习(RLHF)让 Agent 越用越好,这需要在特定场景下才有清晰的奖励信号和有效的数据飞轮。这在通用的平台上现阶段很难实现。
所以,我们认为 Agentic AI 还没有收敛到某个确定的共识阶段,通用和垂直路径都有探索的空间,但现阶段垂直应用的可落地性更强。
明势创投夏令:先看事实:
模型层面: 视频生成,MiniMax 的海螺 AI 在全球流量远超快手的可灵。文本大模型,DeepSeek 从投入量级、人员规模、卡的资源数量上看,都无法与字节、阿里等传统大厂相比。在技术高速迭代期,并非总是传统大厂领先。
技术有非常高斜率的增长曲线,未来 1-2 年类似于 o 系列或者 R1 这样的突破不会只发生一次,而且不仅会发生在推理能力。一个事实上的结果是,视频模型、文本模型的突破都不是传统意义上大厂做出来的,大厂往往做的还是共识的事情。
产品层面: 元宝、夸克等确实承接了用户流量,数据增长很不错,验证了我们在泛 C 通用应用上大厂有优势的判断。
对创业公司来说,要区分产品类型,大家喜欢把产品分成 save time 和 kill time 两类,还可以分成 ToC 还是做 ToB 。
如果做 To C 通用型 Save Time Agent,在中国,这对创业公司挑战巨大,对技术和资源的要求很高。它与自研模型能力紧密绑定,且现有巨头的身位很好,比如阿里夸克、腾讯元宝。除非(创业团队)能像 DeepSeek 一样引领下一代模型技术迭代并且能拿到流量,否则机会渺茫。
我们更关注 To C 的专业领域和垂直场景的 Save Time Agent,以及 Kill Time Agent,后者也会成为 Agent 形态,但往往核心壁垒是在平台效应、社交活动等等上面。
我们的观点不变:
规避国内泛 C 用户通用的 Save Time Agent 市场。
聚焦专业人群、专业领域,增长可以非常快。比如我们投的某个垂直领域 AI Agent,一年时间在国内做到了 1000 万美元 ARR。垂直领域竞争对手不是互联网大厂,而是细分领域的传统玩家,而且在中国有相当多细分领域的玩家都是小散。AI 在这里有机会重塑业务流程,实现业务标准化、结构化从而实现规模化。
Kill Time 领域: 也有机会,比如 MiniMax 的星野,数据依然好于字节的猫箱。核心在于,内容平台重要的是双边,要抓创作者。星野抓住了关键 OC 人群,从之前的 Glow 开始,他们既是消费者也是创作者,形成了平台效应。
大厂合作: 事实上,互联网大厂在 Q1 密集地通过投资+业务扶持来支持一些 AI 应用公司。它们并非纯粹的竞争关系。
Founder Park:Agent 公司都需要有自己的模型才能构建壁垒吗?
真格基金刘元:两年前投资人们都觉得模型可以吃掉一切,但到现在看并没有。你看 Perplexity, Cursor 这些,用户量都不小了,他们都没有自己的模型。
从自下而上的用户需求出发解决问题,和自上而下分析“护城河”,视角是很不一样的。 大家总爱问技术壁垒,但历史上哪个成功产品一开始就有牢不可破的技术壁垒?Uber? Facebook? 壁垒(用户、网络效应、运营)都是后验的。做学校社交网络的不止 Facebook,凭什么说 Facebook 才有网络效应?这些都是后验的,不能通过后验的信息寻找前置的判断。
Scaling Law 也是一样,三五年前有多少人信仰 Scaling Law?从 Pre-training 到 test-time compute,每年的发现和判断都跟前一年完全不一样,假设本身就在不断颠覆,当下的假设从来都不是亘古不变、从来如此的,无法被挑战的。
我的意思是,技术壁垒的权重经常被严重高估,许多壁垒是靠日积月累的工程铸就的,不是靠天才灵光一现参透的秘密。不仅仅是技术迭代快,更重要的是你对用户和产品的理解、洞察是不是够细腻、够快、够准。中国最大的那些互联网公司,哪个的技术是当时别人完全无法复现的?我觉得没有。
Manus 办公室有张海报,是推特截图,大意是:一个硅谷 VC 朋友说,Manus 让他想起了硅谷黄金时代的 “old silicon valley”—— No secrets, just sheer execution speed。 (没有秘密,只有纯粹的执行速度)。这话我不知道算不算纯粹的褒义,但团队以此为荣,打印出来挂在公司。
九、Agent 会彻底重塑传统 SaaS
Founder Park:在日本、欧美等出海市场,按劳动力付费(Role-based)或按 Token/结果付费(Usage-based),对于中国创业者是可行的方向吗?
靖亚资本何沛:在 SaaS 时代,就有按人头(By Seat)和按用量(By Usage)两种收费模式。By Seat 适用于边际成本极低的服务,用户越多,成本被摊薄得越低,从而实现更高的毛利。但由于 AI 对 token 的调用成本相对过去 SaaS 对云的成本要高挺多,因此纯 by seat 的模式在 AI 时代并不是最合适,一般可以采用混合模式的收费,基础订阅费包含一定额度的使用量,超出部分按用量付费。这可能是更为合理且灵活的选择。在 SaaS 时代也有这样的例子, 例如 Docusign(电子签名服务平台),其订阅费用包含一定数量的固定签约次数,超出部分则需额外购买。
Founder Park:图片编辑产品,向上有 Canva 这样前几年的新锐巨头,月活快 2 亿,年收入 20 多亿美元。随着 AI 让 SaaS 产品用户人群无限逼近 C 端用户,这里的机会,会不会更偏向入口级公司、大流量平台?
明势创投夏令:国内模型公司和互联网大厂主要想切的还是泛 C 用户,追求用户基数,这符合互联网大厂的胃口。他们也有底层模型研发能力,他们想做没有任何问题。
但至少目前,单纯靠模型很难满足专业人士和专业领域的需求。跟模型能力限制有关,也与模型公司的发展方向有错位。比如 GPT-4o 追求一步到位,但专对于专业人士来说,细节至关重要。比如广告投放,细节可能对 A/B 测试的转化率产生细微但关键的影响;或者在产品设计中,特定的视觉元素与要传达的核心信息紧密相关。这与普通 C 端用户追求“看起来不错”或“一蹴而就”的接受标准不同。
LiblibAI 未来也一定会拓展 Agent 形态产品,核心壁垒在于服务专业人士的高质量图片生成需求,这需要结合现有的 LoRA 参考图生态,以及超越简单 prompt 的多模态交互和精细控制。
审美、风格和细节是专业用户的无止境追求,也是创业公司的机会所在。审美本质上是人类特有的能力和评价标准,模型提升的是平均审美水平,也会帮助专业人士创造更高水平的作品,而不是取代他们。LiblibAI 社区生态解决的就是专业人士对审美和风格的需求。
Atypical 邵帅:我们认为,AI Agent 正在从根本上重塑传统 SaaS 的形态。
以往的 SaaS,本质上是将某些业务流程的“最佳实践”进行在线化和标准化,虽然提升了效率,但降本增效的空间有限。而现在的 Agent,不再是工具型的功能模块,而是直接切入了实际的“劳动力市场”,能够像销售、设计师一样,完成具体的工作。
以我曾投资的“探迹科技”(Tungee)为例,原本是做销售线索推荐的。如果用生成式 AI 技术对其进行重构,它完全可以变成一个真正意义上的“销售 Agent”,用户输入产品信息,它就能识别潜在客户,自动发起联系(电话、邮件、WhatsApp)、识别客户意图、安排后续会谈等。除了不能陪客户喝茅台,它几乎能完成所有销售流程。
Coding,AGI 的主线
Founder Park: 关于AI Coding,它似乎是通用的,中国创业者在其中的机会具体在哪里?
Creek Stone 李一豪: 有几个方面:
ToC: 反而是中国最有机会的。但这点不是只有创业者在看,比如字节跳动也很关注,目标决定一切,它的目标可能是超越 Cursor,但这反而留出了服务非专业开发者的空间。当普通人掌握了 coding 能力,像 Andrej Karpathy 展示的那样,在社区、轻社交场景下潜力非常大。我们对此非常乐观。
ToB: 企业级服务是分层的。服务超大组织、中型行业企业、小型 SMB 甚至 Freelancer 所需的 coding 产品不同,涉及安全、代码仓、权限、交互、部署成本、Infra 等差异化需求。通用 Coding Agent 无法完全解决这些与现实资源匹配、调度的问题。这里存在很多分层机会。如果相信数字世界主要由代码构成,这个市场足够大,也才刚起步,又是确定性强的、有望率先实现 ASI 的方向。
Creek Stone 钟陆欢:我们之前看到一个非官方的数据, Cursor 的中国用户比例已超海外。不仅 ToC,ToB 也有很大机会。我们也相信我们的一些 coding 项目,凭借中国产品经理的能力,可能做出比海外产品更好用的工具,提供适合中国码农或 B 端用户的核心插件/组件。
Founder Park: 这是否印证了微软 CEO Satya Nadella 提出的“10 亿开发者”愿景?你们说的 ToC Coding 就是开发者人群的泛化?
Creek Stone 李一豪:我认为分阶段。
第一步可能是将全球 3000-5000 万 Coder 扩展到 1 亿,这会是巨大飞跃。最终的 10 亿人,可能不是传统意义的“开发者”,而是“需求表达者”,再到未来可能就成为这个世界的观察者。
未来,当垂直 ASI 普及,甚至 AGI 出现后,大部分人可能不再直接参与生产力构建,但世界仍需有人将物理世界映射到数字世界,提出有代表性的个性化需求,更强烈地影响我们的偏好。这些人通过更高维度的方式改造世界,问出高价值的问题驱动价值生产。这些需求将通过他们自己的 AGI,调度大量 ASI,甚至走向生产制造,最终形成解决方案和产品。这是我们眼中看到的世界。
Founder Park: 你们怎么看 Cursor?(Cursor 是一款非常热门的 AI 编程工具,付费用户数达 66 万,其背后的研发商 Anysphere 在一年内实现了年经常性收入 2 亿美元,是增长最快的 SaaS 公司之一。Anysphere 于 2022 年在美国成立,由 4 名 MIT 校友成立,创始人兼 CEO 是 Michael Truell。2024 年 12 月,Cursor 完成由 Thrive Capital、A16Z、Benchmark 等领投的 1 亿美元 B 轮融资)
Creek Stone 李一豪: Cursor 本质上是一个垂直 Auto-completion 的 ASI,价值巨大,活得很好,未来可能被收购或上市。它面临的挑战反而可能促成高价收购,比如 GitHub/VSCode 生态整合。
即使 Anthropic Claude 等平台加入了 Coding 功能,Cursor 作为专注的 ASI 仍然有价值。企业级服务方面,现有通用模型和 Cursor 都无法完全满足不同行业的特定需求,比如不同产业热数据的进出,需要新公司做这样的事,机会还是比想象中更多。关键是别跟巨头做完全一样的事。字节这样的公司有资源和意愿做 Trae 这样普惠性产品,这本身也创造了社会价值。
十一、可爱是毛绒玩具的特点,不是智能玩具的稀缺价值
Founder Park:如何看待 AI 玩具/陪伴机器人这个方向?
Alphaist 陈哲:我有投这个方向。这个方向我感觉还是特别靠产品力跟天赋的。创始人对于到底解决哪种细分的需求,解决哪一种用户的情绪,要有很深的思考。
日本那家公司(Lovot)做得比较好的是,买了产品的人真的会持续用,有留存。这种陪伴型的产品,一定要区分是多人产品还是单人产品。我觉得 Lovot 是个典型的单人产品,需要单人环境去养成互动。那里面有非常多的一些巧思和设计想法,我觉得这个特别考验创业者的灵性跟感觉(Lovot 是一款来自日本的高端 AI 陪伴玩具,售价 近 3 万人民币,面向 40 岁到 60 岁的高收入女性群体。2025 年 1 月底,LOVOT 的出货量超 1.5 万台。Lovot 背后的公司 GROOVE X 株式会社于 2015 年在日本成立,创始人林要曾在丰田汽车、软银工作,在软银工作期间,林要参与了机器人“Pepper”项目)
要说这个品类的标杆,我觉得还是回到迪士尼做的那些东西,像 Wall-E,像 GTC 展示的那个两足小机器人。他们在表情、情绪、运动、机械设计、ID 设计、动画设计方面都非常好。不是一群工程师设计出来的,是美术师、插画师跟工程师联合做出来的。有没有 IP,有没有做形象、做故事的能力,对于这种产品是非常关键的。 而这个能力我认为绝大部分投资人是比较忽视去如何 assess 的。
我尤其觉得,切忌把产品做得非常 fluffy(毛绒的)。大家对 fluffy 的东西 initially 都有亲近感,这是本能。但这跟两性荷尔蒙反应一样,没有持续互动的 drive,看久了就没感觉了。
Fluffy 是一个非常危险的捷径,不能因为毛绒的正反馈就疏漏了更难的部分。你看迪士尼做的产品,不需要 fluffy,甚至不用说话(Wall-E),靠表情、动作就能构筑角色人设和情感连接。这种产品最难的是怎么做到持续留存,怎么让用户觉得你是有 personality 的。强调“萌”“可爱”是所有毛绒玩具都有的,不是智能玩具的稀缺价值。
十二、让玩具开口说话,破坏了“沉默”带来的想象空间
Atypical 邵帅:从消费品,尤其是玩具本身的角度来看,让玩具开口说话功能可能违背了直觉。比如,大家购买泡泡玛特的 LABUBU 或 Molly 这些玩偶,恰恰是因为它们的“沉默”创造了巨大的想象空间。如果强行让这些玩具开始说话,反而可能破坏这种想象力。
再比如,欧洲的 Tonies 玩具系统,它的设计非常简单:一个底座,放上不同的玩偶,就能播放对应的音频故事或音乐。没有复杂的 AI 对话功能,但它每年依然能取得数十亿人民币的收入。(Toniebox 是一款为 3-8 岁儿童设计的音频播放器,核心亮点是“无屏幕”和“实物互动”。Toniebox 是全球儿童音频播放器的销量冠军,截至 2024 年 9 月,Toniebox 总销量 780 万台。Toniebox 的母公司 Tonies 于 2013 年在德国创立,创始人 Marcus Stahl 曾任诺基亚运营总经理)
有时候,越简单的产品反而越好。“做减法”或许更为明智。如果 AI 玩具仅仅是追求对话功能,那未免太过单一。毕竟,小朋友在没有明确“上下文”的情况下,往往不知道如何与玩具进行有效互动,且这样的互动和天猫精灵没有太大差别。如果玩具本身没有 IP 价值,为何要购买?
我们都期待像《玩具总动员》那样的场景成真,玩具能像电影中的角色一样,具有丰富的情感和智能。但这种理想中的产品形式,到底应当是什么样子,仍然值得进一步观察。
Founder Park:目前大多数 AI 玩具的“核心”依然是让玩具说话,但这种方式可能并非创业公司的真正竞争优势?
Atypical 邵帅:对,尤其是针对智能玩具,核心应该回归到用户的真实需求。如果只是简单的问答,智能音箱已经足够满足需求了。
如果用户是为了获得情感价值或“娱乐性”,那么创业公司更应专注于创造独特且有趣的玩法(Play Pattern)。
回顾以往成功的玩具或产品 IP 之所以能成功,很大一部分原因就在于创造了独特的玩法和品类。例如,盲盒的玩法基于“开箱惊喜”,积木的玩法体现在拼搭过程的乐趣。对于智能玩具来说,关键需要考虑的几个问题在于,你能为用户提供什么独特的玩法?这个玩法是否能够构成核心价值?它是否与玩具的品类定位、IP 价值等紧密相关?这些考量比单纯的让玩具能够开口说话要重要得多。
Founder Park:但 IP 对初创公司来说确实是一大挑战。
Atypical 邵帅:是的,IP 在玩具领域确实是一个极其重要的战略控制点。可以说,“得 IP 者得天下”。如果初创公司仅仅依靠引入成熟的 IP,实际上是在为像迪士尼、万代这样的巨头打工。
我的建议是,尽量创造自己独特的 IP 和玩法。比如 CES 上 Robopoet 公司推出的 AI 萌宠机器人“Fuzzoo”,它将五行(金木水火土)做成了五个毛绒形象,具备轻度的智能互动(例如摸摸它,眼睛会动)。它的“开口说话”能力,必须通过用户完成一些任务(比如喂食、抚摸)来逐步解锁。Robopoet 很像过去的电子宠物(Fuzzoo 是一款 AI 毛绒宠物,搭载了多模态情感模型,主打陪伴、倾听等情感陪伴功能。Fuzzoo 在 MWC 2025 和 CES2025 上的展示引起了诸多关注,目前尚未对外开售。Fuzzoo 背后的研发商 Robopoet成立于 2024 年。Robopoet 创始人孙兆治曾在小鹏机器人工作。Robopoet 于 2024 年年中完成了千万元的天使轮融资)。
Robopoet 在尝试打造自己的 IP 和品类,虽然是否能成功尚未可知,因为创造成功的 IP 并不容易,但这个路径是值得我们探索的。如果它成功验证了这一模式,再去做那些“锦上添花”的事情,比如利用成熟的 IP(如宝可梦)将其智能化,可能会更加可行。
十三、被高估的和被低估的,都是具身智能
Founder Park:具身智能最近讨论很热,甚至有些过热。怎么看这个领域?
创新工场任博冰:(关于某些外部评论)我觉得有些判断过于从基金而非赛道或项目角度出发,没亲自聊过项目,对人的判断就无从谈起。
从赛道角度看,我们认为具身智能还非常非常早期,大概相当于 NLP 的 GPT-1.5 到 2.0 阶段。我们最近在看很多相关的 Paper 和项目。上一代具身智能我们投得不多,也在复盘,觉得有些过于谨慎了。第一代公司做了很多有价值的探索,但第二代、第三代仍然有大量新机会。我们既然错过了第一波的部分机会,就会更关注第二波、第三波。
锦秋基金臧天宇:我们觉得这个领域很矛盾:一方面,确实存在短期过热;另一方面,它带来的长期变革可能也是被低估的。
我们认为具身智能的发展速度可能会比预期快,一年半左右就能看到模型上显著的进展,陆续可以看到在一些 2B2C 商用场景的落地。
但短期的噪音确实很大,很多资金涌入,大厂纷纷入局,但不一定都投向了真正能推动事情发展的方向。这种过热甚至可能打乱一些优秀团队的节奏,比如一些本来可以打磨产品的团队,可能因为融资竞争压力而不得不提前启动融资,反而拖慢了研发进度。
尽管如此,我们对具身智能的中长期潜力非常乐观,会持续投入,关键是要屏蔽掉噪音。
十四、MaaS 面临云厂商的竞争,创业公司怎么办?
Founder Park:前段时间潞城和硅基流动的争论引人关注,工场同时投资了两家的机构。当时你们怎么想?后来做了什么?现在对 AI Infra 领域是否有新的思考?
创新工场任博冰:(笑)是的,除了我们还有华为。我是两家公司的董事,我们至今仍是第一大股东。个人觉得,争吵没有必要,对双方业务都没带来实际价值,反而消耗了精力。我们后来找了专家出了方案,帮助他们化解了矛盾。
两家公司现在业务增长都非常快,都在各自赛道上有很多事情要做,而且今年都面临很好的窗口期。我们建议创始人把精力聚焦在主营业务上。
关于 Infra,现在的定义比以前(如云计算时代)复杂得多。
工具链复杂: 模型算一层,但模型与 Agent 工具是耦合还是解耦?MaaS 公司是否要做 Agent 相关的事?微调工具是不是简单调个 API 就行?这些都不确定。ToB、ToC、to Agent 的应用形态都不确定,这对推理、微调、训练生态都有很大影响。
云的潜在变化: 未来的应用可能不都挂在云上。也许操作系统定义会变,所有窗口都是浏览器,不再需要装那么多本地应用,应用变成中间件。这会对应用、云、Infra 公司都产生巨大影响。
只要有变化就有机会。没有变化才尴尬。变化中最快响应的通常是创业公司。
Founder Park:我们的调研发现,硅基流动最初的确有大量的企业和开发者在接入 DeepSeek,但云厂商也在跟,火山等云厂商动作很快,有很多人最初选择硅基流动,最终还是用火山接了。对 MaaS 创业公司来说,壁垒存在问题吗?
创新工场任博冰:我个人觉得,不要太高估云厂商的研发能力和内部协同效率。比如华为的卡适配 DeepSeek,很长一段时间内,甚至未来半年,可能都只有硅基流动能做得比较好。为什么会这样?理论上创业公司不该领先这么久,但事实就是如此。
云厂商内部本身就存在算力部门、云业务部门等的竞合关系。算力团队可能想和硅基合作,云业务团队又视其为对手。这种混乱的生态反而对灵活的 Infra 创业公司有利。
创业公司可以在这种竞合中获得资源和流量。像 DeepSeek 带来的流量,早期硅基流动可能接不过来,但每次多接一点,公司就成长一点。毕竟公司才成立一年多。类似的流量会持续有。
Founder Park:不说都没意识到,袁老师的公司其实才做了一年多。
创新工场任博冰:公司没几个人,上来接那么大流量肯定接不住。
十五、视频生成还在非常非常早期
Founder Park:靖亚投资的 Viggle 有过 pivot,像 Viggle 这样的现象级成功,是否具有可复制性?(WarpEngine 公司的核心产品,AI 生成 meme 短视频,深受从好莱坞专业人士到 TikTok 内容创作者喜爱,用户超过 400 万,拥有全球第二大 Discord 社区。WarpEngine 于 2022 年在加拿大成立,创始人楚航 Hang Chu,曾就职于 Meta、谷歌、英伟达、3D 软件公司 Autodesk 以及大众汽车等企业。2024 年 8 月,WarpEngine 拿到了 a16z 领投的千万美金融资)
靖亚资本何沛:在投资这个公司时,我们知道创始团队在视频和 3D 领域有深厚的技术积累,创始人的学术背景和工作背景跟想做的事情方向是高度匹配的,Founder-Market Fit 很好。但最开始并不清楚做什么产品可以成功,所以从数字人切入积累技术产品化、产品商业化的经验。在发现这个方向不能充分发挥创始人的优势后,创始团队能积极寻找新方向并开发出用户喜欢的产品,这个开放的心态、开阔的视野、超强的执行能力才是创业者最核心的价值。
从投资人的角度,我们始终相信,创始团队的技术积累和从业背景非常适合多模态 AIGC 方向,创始人在谷歌、英伟达、Autodesk、苹果、Uber 等大厂的工作经历,让他们对视频、3D 技术有着深厚的见解,有独特性和稀缺性。
创业公司要取得产品突破的关键:
一是技术水平过硬,能在极有限的资源下开发出稳定、高性能的产品;
二是能够精准地切入大厂暂时没关注到的市场空白。我记得 OpenAI 的视频生成产品 Sora 发布后,许多人认为市场已无机会。但 WarpEngine 创始团队清晰地指出了 Sora 技术路线的局限性,并给出了他们自己的解决方案。创业的核心在于提供独特价值并充分利用时间窗口;
三是能找准细分场景以及转型时机,最开始我们建议公司在国内做 toB 数字人,但这个市场竞争激烈,且高度依赖营销和销售能力,这并非 WarpEngine 团队的强项。公司敏锐地转向了“面向海外用户的梗视频生成”这一细分娱乐场景,我们作为董事全力支持。
Founder Park:靖亚还投资了爱诗科技,大约在去年底或今年初。但当时国内像快手可灵、字节即梦 AI 等大厂在视频生成领域动作频频,市场竞争十分激烈。为什么选择在这个时间点投资爱诗科技?(PixVerse 是由爱诗科技推出的一款海外版 AI 视频生成产品,全球累计用户量达 4000 万。爱诗科技成立于 2023 年 4 月,创始人王长虎曾任字节跳动视觉技术负责人及微软亚洲研究院主管研究员。2025 年 3 月,爱诗科技完成由靖亚资本投资的 A5 轮融资,A 轮融资整体规模超 4 亿元)
靖亚资本何沛:视频生成市场的潜力巨大,它能够释放每个人的创造力。目前市场仍处于非常早期的阶段,即使是大厂的产品,也尚未真正“出圈”,仍处于“early adopter”(早期采用者)阶段。这对创业者而言依然是有巨大机会的赛道。
同时,大厂也有其自身的局限性,例如模型与产品绑定,仅使用自家模型等。而创业公司可以选择最适合的外部模型或自己训练适合自己场景的模型,并有机会在特定细分领域构建护城河,比如技术、数据、用户、体验、品牌等。
另外,我觉得大厂入局并不是坏事。大厂的产品在帮助教育市场,让更多用户了解和尝试视频生成技术;另外用户多了,不同的用户在不同的场景下使用,会发现各家模型的优缺点,甚至用户会提供创业者没想到的应用场景,总会发现还未被满足的需求,为创业者留下空间。创业者能否在激烈的竞争中找到自己的立足之地是关键。虽然看似困难,但并非不可能。创业者的优点在于行动迅速、转型灵活,能够不断尝试并寻找突破点。
投资爱诗,首先是因为我们看好 AI 视频生成赛道,市场空间巨大,且尚处于早期阶段。其次,我们相信爱诗科技是国内少数几个能够把握这一机会的优秀团队之一。
十六、手机厂商做 AI 对创业团队是好事
Founder Park:入口级公司(如手机厂商 OS、Super App、浏览器)的动作也值得关注。创业者应该如何思考?如何避开?
Creek Stone 李一豪: 这个问题我们自己思考,这也是我们要求创始人必须深度思考的问题,是我们判断创始人的关键点之一。创始人需要有能力了解大厂动态,如果是一个年轻的创始人,至少要对这些问题好奇,拉着我们去问。
要创造新的“1”,而不是在巨头的后面加更多的“0”。原生应用不怕巨头碾压,甚至能与之共生。比如 Cursor 跟 Anthropic 的关系是超乎寻常的,也许在未来的半年多可能会改变。早期他们能拿到内部的版本,能看到模型演进的方向,去做很多预见性的迭代。这就是做基建的公司和做应用公司的本质区别。
创新工场任博冰:避开是一定要的。怎么避?
首先,创业者在早期,想都不要想“入口”这个事,一定要做新东西。入口是大厂的主战场。离得越近越危险。
要做大厂看不上、觉得没价值、内部立项门槛高的事情。这些事情未来可能长成新的入口。
小范围验证: 在小规模用户中验证产品的喜爱度和粘性,这才是成为新入口的基础。
定义新战场: 就像王兴说的,主流战场是“争”的关系,创业者要想的是“竞”的关系,只要跑得快,全是蓝海市场。对小公司来说,竞的难度比争要低得多。
共享单车的时候,摩拜和 ofo 在争北京上海,哈罗去二三线城市。拼多多也是一样,包括美团,从百团大战里杀出来,后来送外卖也是一样。现在大家总是盯着字节,看红海市场,这个就,不知道该说啥。
高瓴创投王蓓:最终的应用还是要和人的生活息息相关,生活是方方面面的,不是一个“通用”能概括的。不同人群在不同环境下的诉求千差万别。模型既不能、也没必要穷举所有场景,它做好基础能力就行。
无论是闭源还是开源模型公司、大厂,都在思考自己的产品形态,但他们的产品审美和优先级,往往会偏向相对通用的方向,比如搜索类。我们内部常说一句话:“卡车即将压过的路上不要种花”。你要看清楚“卡车”要往哪里走。像搜索这类相对通用的领域,可能更像是属于卡车的产品机会。但这个世界是百花争艳的,还有其他各种应用的机会,既需要高速公路,也需要更多的花花草草。
线性资本郑灿:相比互联网大厂,手机厂商推进 AI 对创业生态反而是巨大的帮助。
原因有二:
端侧 AI 的基建:未来很多 AI 能力需要在端侧实现。没有手机厂商的推动,这件事很难做,或者说坑特别多。APP 自己集成大模型太重,而且往往与底层系统是对抗的关系。手机厂商是在为端侧 AI 铺路,创业者需要依赖他们。
竞争边界相对清晰:大家对手机厂商会重点做什么应用,其实是有历史经验和预期的——通常是那些更系统级、更通用的功能,比如相机、系统优化等。历史上,虽然有很多相机 APP 挣到了钱,但能做到美图秀秀这样体量的很少。这本来就是 OS 该干好的事。如果你能像美图一样,在手机厂商自己做之前,打出足够长的提前量并建立品牌,可能会有例外。但总体而言,不要去做那些明显该 OS 做好的通用功能。今天去做一个修图 APP 也许还能挣钱,但能做多大是个问题。
Founder Park:大厂和模型公司也有调整,将原来的“产模一体”分开,比如阿里的通义和 Qwen、腾讯混元和元宝,模型团队和产品团队分开,甚至内部赛马。同时,模型也在向上延伸能力。怎么看应用层的价值和机会?
线性资本郑灿:(除了夸克)大厂的产品很多还是模型驱动的,这也印证了在国内做通用大模型可能不是创业公司的最佳选择。
核心原则是:不要在大厂的主航道上竞争。 如果一个方向对大厂至关重要(比如在微信里做基于微信数据的智能聊天),那大概率不应该是创业公司去做。
在国内,通用的、大赛道上的应用,大厂拥有绝对的流量优势、成本优势和资金弹药优势。这个问题其实创业者们已经面对和讨论过很多次了。Fundamentally,不要在他们的主航道上,也不要去做那些过于通用、实现方式比较直接(straight forward)的应用。在这些领域,用户获取成本高,你和巨头的差距太大。
更根本的是,今天想通过广告模式做大平台的模式,在全世界都很难走通了。To C 平台的结构性机会往往来自于人口结构变化(新人群)、用户时间分配变化(新时间)或新设备普及。
那么创业公司的机会在哪里?
把某个具体的、垂直的场景做好。对大厂来说,这些细分场景的诱惑力可能不够大(创新者的窘境),但对初创企业来说,是很好的起点。例如,虽然字节有 CapCut (剪映海外版) 这样功能包罗万象的视频编辑工具,但市场上依然有很多专注于特定视频编辑/操作功能的成功产品,年收入达到 500 万甚至 1000 万美金以上。这些产品能在 CapCut 也能实现的功能点上,把局部体验做得更好。大厂做通用工具时,很多细分体验是无法极致优化的。大厂有其固有的做事方式和倾向性,有些事情他们天生不倾向于去做。
说回来,中国的创业者其实长期在应对大厂竞争,应该已经积累了很多成熟的思考。
十七、为什么拒绝呢?
Founder Park:拒绝项目的主要原因是什么?“差点意思”的项目,差了什么?
创新工场任博冰:大部分还是关于“人”。人和事是相关的,一个人思考问题的方式会暴露他过往的成长、学习、对 AI 和社会的理解、以及潜在的弱点。
很多时候我们拒绝,是觉得创始人自己并没有真正进入“创业状态”。可能信心和勇气到了,但整体动作、思考深度还没到。事可以变,但创业状态不对,在这个时代会非常困难。上了战场就下不来了。
Creek Stone 李一豪: 首先是驱动力和开放度。长期自我驱动的人,从人生的每个决策上都能看出来,是我们非常喜欢也高度敏感的,同时他们也敢于对时代做判断,心态开放快速变化。相反有 ego 的人很难开放地听取意见。这与年龄不绝对相关,年轻创始人也可能存在。
Creek Stone 钟陆欢: 比如有些创始人一上来就说自己的产品是最好的,但“好”的标准如何定义是个问题。
锦秋基金臧天宇:原因多种多样,没有标准模板。比如:
创业决心不够: 还在大厂没离职,说“拿到钱再出来”。
执行力不足: 现在 AI 工具和基建很成熟,验证小目标相对容易,但有些团队停留在讲理念,迟迟没有行动。 当然还有很多其他情况。
明势创投夏令:如果一个垂直领域 Agent 项目,Ta 选的这个事情本身不是一个好生意,商业模式不好,即使技术产品层面可行,我们也不会投。创业者需要懂这个生意本身。
线性资本郑灿:场景没有想清楚。这个场景是否真实存在?创业者通过什么方式理解这个场景?自己闷头想肯定不行。基于特定场景的假设,ta 是怎么验证的?当然可以还没有验证,但最怕的是“不知道我要验证”。
高瓴创投王蓓:VC 投资没有绝对的适合不适合。我们最看重的还是人的质量:思考深度、原动力。这是我们选择合作伙伴的基本画像。
我们并不要求创业者把所有事情都想得一清二楚。我们作为投资人,何德何能预知未来?如果我比 ta 还明白,那可能得反思一下,是不是很多人都想到一块去了?我们追求的是大概正确、模糊正确。
我们相信优秀的创业者是有自省和迭代能力的。即使他当前做的事我们觉得不大行,但只要我们认定他是有潜力的人,相信他自己会在过程中发现问题并调整,而不是需要我们苦口婆心地去说服他。
Founder Park:“模糊正确”。
高瓴创投王蓓:对,模糊正确就可以。投资人眼睛有点度数挺好的(笑)。
十八、未来半年,创业者最应该做什么?
Founder Park:未来 3-6 个月内的早期 AI 应用创业者,他们最该做什么?
高瓴创投王蓓:我觉得最值得做的,还是找到 ta 自己真正为之兴奋的事,而不是到某个“范式”而去里面做填空题,我们还是更喜欢看到创业者能做一个 “供给创造需求” 的事,这应该会很开心。
Founder Park:我们也见过很多创业者朋友,其实有些可能是因为 AI 创业热潮被裹挟进来的,但还没找到自己真正的原动力。
高瓴创投王蓓:对,一个是要有原动力,再一个就是要务实地回归用户场景。如果创业者自己就是产品的典型用户,那太好了。如果不是,那就要在前期花更多时间跟用户待在一起。
明势创投夏令:两件事比较重要:
立足未来思考业务:必须假设一年内模型公司会推出强大的 Agent 体系,比如假设它们能干 80% 岗位的工作了;甚至要考虑 AGI 实现的可能性,基于这个终局去反思和设计当前的业务模式。不能只基于今天的 L1/L2 能力。
快速验证 PMF: 尤其是产品型公司,要尽快找到产品与市场的契合点。3-6 个月足够做初步验证。
融资节奏上,可能还是持续融资、小步快跑。
真格基金刘元:赶快把产品上线,开始获取用户反馈,哪怕不急着商业化。 从用户那里获得真实的反馈,然后快速迭代。
现在创业成本很低,小团队也能做出高收入的产品(Midjourney, Cursor 都是例子)。没什么借口了,就几个人也能干大事。所以,赶快上线,快速迭代。
十九、PMF 的有效期变短了
Founder Park:过去两年,许多中国软件开发者和公司积极投身出海,您认为这一生态接下来会如何发展?
靖亚资本何沛:出海主要有三种模式:
第一种是传统出海模式,即在国内已有成熟业务的基础上,将现有产品进行改进后扩展到海外市场。这种模式适合那些在国内已是头部的公司,利用现有资源和成功经验开拓国际市场。例如我们投资的“e 签宝”,作为国内电子签名领域的领先企业,现在推出了全球品牌,为中国企业的出海提供可信签约服务。
第二种是“Day One Global”模式,即从创立之初就面向全球市场,这是如今许多年轻创业者更倾向于选择的模式。他们具备全球视野,选择北美、日韩、东南亚等地作为起点市场,直接在国际市场上展开竞争。
第三种是纯海外公司模式,即考虑到地缘政治等因素,直接注册为美国或海外公司,团队也可能实现国际化,其中包含非华人成员。例如,我们投资了一家以色列公司,其联合创始人中有华人,但 CEO 是白人。这种多元化的团队结构和全球化视野,是出海创业成功的关键因素之一。
这三种出海模式都蕴含着巨大的机会,我们愿意投资其中的每一种。
Founder Park:现在的 PMF 中的“M”(市场)变得比以前更复杂了。
靖亚资本何沛:确实如此。市场本身就不稳定,受到多种因素的影响。今天的 PMF 并不能保证半年后或三年后依旧成立,因此也对投资人和创业者提出了更高的要求。
二十、下一代内容平台长什么样?
Founder Park:如何理解内容平台正在发生的变化?下一个内容平台长什么样?
锦秋基金臧天宇:有很多团队在探索很有意思的事情。比如我们关注新的内容模态和社区形态的创新。比如我们投的“造梦次元”,从对话 AI 加入剧情、游戏化体验,还在尝试融入声音等多模态,快速试错。还有一个做游戏的团队,在对话 AI 基础上加入社交 PK 属性和卡牌机制,变成一款游戏。大家从相似的内核出发,衍生出各种创意十足的内容形态和玩法,这种探索非常有价值。(造梦次元是一款 AI 互动内容平台,基于生成式 AI 技术,提供交互式、剧情化的虚拟角色互动体验,日均活跃互动时间超 100 分钟。造梦次元背后的公司“想法流”成立于 2023 年,创始人沈洽金是一名连续创业者,曾创立一登科技和闪聚互动。2024 年 12 月,“想法流”完成由锦秋基金领投的数千万元的 A 轮融资)
Founder Park:这种探索会像移动互联网时代短视频的模式一样,在某个阶段走向成熟和收敛吗?
锦秋基金臧天宇:我觉得肯定会有产品形态跑出来。最终还是用户和数据说了算。那些受到用户欢迎、留存率高、用户时长长的产品形态会留存下来,其他的可能会逐渐消失。
移动互联网时代是典型的“注意力经济”,平台和应用的核心目标是尽可能地抢夺用户的停留时长。但在信息爆炸、注意力稀缺的当下,仅仅抓住眼球已不足够。AI,特别是具备情感理解和生成能力的 AI,将推动商业模式向“情绪浓度”转变。情绪经济是我们觉得社会会增强的需求。
情绪需求与工业化/数字化程度的正相关性。
我们观察到,随着社会生产力的发展和数字化程度的提高,人们的基础物质需求得到满足后,对精神层面、情感层面的需求会日益增长。AI 恰好能以一种低成本、高效率、个性化的方式来满足这些需求。这预示着“情绪经济”在全球范围内,尤其是在发达和快速发展的经济体中,将拥有巨大的市场潜力。
情绪共鸣驱动商业化。未来的产品和服务,其商业价值将越来越取决于能否与用户建立深层次的情绪共鸣。用户不再仅仅为功能付费,更愿意为“被理解”、“被治愈”、“被陪伴”、“被激励”等情绪价值买单。
移动互联网抢夺眼球,AI 时代则要触达心灵。未来的商业竞争,将从“注意力时长”的争夺,转向“情绪浓度”的比拼。
Founder Park:对于创业者选择创业方向和思考要做的事,有什么建议?
锦秋基金臧天宇:从创业方向选择上,可以参考互联网和移动互联网的发展历程:
互联网使得信息分发的边际成本降为零,诞生了门户、搜索、电商平台这些产品和商业形态;
移动互联网进一步叠加了地理位置属性,诞生了外卖、打车这样基于 LBS 分发信息和撮合服务的平台;手机竖屏的特征又导向了 feeds 这样的信息分发形态。
那么这波 AI,特别是生成式 AI,它改变了什么?
内容生产: AI 降低了内容创作门槛,带来了新的内容形态(图文、视频、交互式内容等)。这里有机会,比如我们投的视频工具、AI 内容社区等。
信息分发: AI 能在 Token 层面更精细地理解用户需求,可能带来超越传统推荐引擎的、基于深度理解的个性化分发。这里要看谁能真正占据用户的 context 窗口,是潜在机会点。
服务交付: 过去难以标准化的、依赖专家知识的服务,现在可能通过 Agent 以极低边际成本被分发和执行。比如我们投的网红营销 Agent,以及一些尝试通用专家知识 Agent 平台的团队。
建议创业者思考:你的产品/服务,在现有商业链条的哪个环节,利用 AI 带来了什么核心变量?解决了什么问题?创造了什么独特的价值? 重新审视商业链条中的变化与不变,找到切入点。
二十一、为什么要出来做新基金?
Alphaist
Founder Park:你判断行业进入了新的周期,决定自己做基金,新周期的核心逻辑是什么?
Alphaist 陈哲:更大的周期看,2023、2024 年很多 VC 投资大模型公司,我认为那是上一个周期投资惯性的延续。新的周期、新的范式,在早期就应该是各种小型、甚至有点“奇奇怪怪”的东西的出现。 对一个新基金来说,不需要有太多过往的假设(assumption),这是一个比较好的阶段。
Founder Park:作为 Solo GP 出来做基金,你的思考方式和角色有什么变化?
Alphaist 陈哲:自己做基金比较好的是,你会把自己真的放在一个创业者的视角上。因为我今天也是一个创业基金,0 到 1 的状态。所以你跟创业者的共鸣、对等感是更强烈的。小基金、独立基金的一个优势就是你真的跟这些早期的 founder 能够站得更近,更能理解他们在 0 到 1 时面临的问题,并且你真的有能力和办法去直接参与。
Founder Park:除了钱,你能给创业者提供哪些独特的价值?
Alphaist 陈哲:我告诉我的很多被投企业或者说想要投资的人,我最大的优势是,如果你觉得我对你有价值,我的时间对你非常 open。
我认为,跟你真的契合、在理念上非常认同、也能够识别你的价值的投资人,创业者是可以理解这一点的。因为我投的项目少,我不需要投那么多项目。我之前百分之八九十的项目都是领投和有董事会席位,未来我也会保持一个很高的比例,尽量有机会领投或独投,也会要求董事会席位和比较高的股比。
核心就是,如果大家愿意一起合作,尤其在早期没有人认可你、没有人能够识别你的价值的时候,我们一起合作。那对我来说这是我发挥最大价值的机会,这也是他获得最大收益的机会。
Founder Park:现阶段你作为投资人最重要的工作是什么?
Alphaist 陈哲:Build 团队。我希望我能招一些有产业经验、有行业经验的投资同事进来。因为我自己做投资之前做了七八年工程师,所有投资经验都是在基金学的。所以我希望能招到跟我当年类似的,比如在科技公司(软/硬/AI)里面真正做过产品、做过技术的人。而且我希望能够找到认同我们基金的理念、价值观的人。因为我们基金很多想法就是跟大家不一样,而且就是因为我们不一样,并且坚持一些可能行业里更底层、更长期的原则,这是我们有可能成功的非常重要的原因。
Creek Stone
Founder Park: 在这个时间点选择自己出来做基金,驱动你们这次创业的核心原因是什么?
Creek Stone 钟陆欢:首先,我们是在弘毅体系内成长起来的基金,弘毅给了我们很多支持和帮助,对此我们非常感恩。这一波 AI 带来的机会巨大且明确,在当前 AI 发展的关键时刻,时间至关重要,真诚至关重要。我们的新基金成立后,决策自由,速度极快。
比如,现在看到好的创始人,可能当场就能给 Term Sheet 甚至过桥贷款(Bridge/SAFE),这种效率在当下市场非常重要。GP 在一线与创始人沟通,共情,提供认知与帮助,甚至情绪价值,同为创业者,做他们最坚定的伙伴。
Creek Stone 李一豪:此外,市场也在变化。我们对中国 AI 应用的全球潜力非常有信心,DeepSeek 和元宝的快速大规模增长,都证明了中国在 ToC AI 应用上可能达到全球领先的级别。我们希望在这个浪潮中,利用我们的经验和资源,帮助年轻的创业者抓住机会,做好服务工作。
同时,我们也感受到资金侧的变化。过去由传统美元主导的康波周期已经到末端了,导致大家其实没有当年移动互联网爆炸性的回报,但我们觉得新一代的康波周期正在重启,反全球化背景的文化变迁正在酝酿。传统的主权类美元在两极化的社会背景下离开中国了,我们有更好的机会在一线与创始人深度地沟通,甚至与他们共创,去做资源的对接和整合,帮助他们一起去探索方向、人才的链接。我们希望成为这一代技术浪潮中,离创业者、离炮火最近的新基金。这个是可能在我们自己身处的市场里面的一些变化。
康波周期:全称康德拉季耶夫周期理论,是前苏联经济学家尼古拉・康德拉季耶夫在 1925 年提出的,康波周期认为资本主义经济的发展过程中存在着长时段的周期性波动,一个完整的周期大约持续 50 - 60 年,1991 年开始为第五次周期。
Founder Park: 作为新基金,你们能提供给创业者的服务和支持,跟之前在大机构时会有什么不同?
Creek Stone 李一豪:我们的打法之一是带着一些顶层思考(Top-down thinking)和思想实验,与有热情的创始人碰撞。我们比较完整地经历过移动互联网周期,对用户和大规模群体有观察和总结,希望能给创始人带来启发,这是一个共同思考的过程,而不是规定他们该做什么。比如,半年前我们认为 Coding 很关键,就会和认识的年轻创业者探讨这个方向。
第二,我们能“插件式”地对接资源。无论是传统的搜广推、新模型算法、大模型 Infra、Fine-tuning 等技术人才,还是社区运营、社交、ToC 产品、关系链运营等方面的人才,我们都有广泛的网络,从头部负责人到一线执行者我们都可以连接。这种连接有时能促成优秀团队的组建或激发好想法,甚至让行业大佬成为新团队的顾问。
第三,我和欢哥能给创始人提供很多情绪价值,因为我们自己也是创业者。
Creek Stone 钟陆欢:我们希望成为创业者遇到任何事情时会拨打的第一通电话。现在,我们可以更彻底地将个人资源,包括募资端、业务端以及我们 LP 的资源,更直接、灵活地对接给创始人,真正的做到共同创业。
Founder Park: 作为投资人,除了不断 Sourcing,当下你们最重要的工作是什么?
Creek Stone 李一豪: 我们的定位是做 “思想实验皮条客”,既高尚又接地气。乍听有些奇怪,意思是我们要把最前沿的认知和想法,传递、对接给合适的创业者。同时保持弱者思维,我们尊重任何角度的独立思考。
二十二、机构现在的投资策略和逻辑是什么?
Founder Park:投资策略或者逻辑是什么?有变化吗?
Atypical 邵帅:在软件方面,ToB 方向主要集中在垂直领域的 AI Agent 应用,前面有提到。ToC 方向主要集中在通过 PLG 驱动的生产力工具方向。
在 ToC 方向上,一类是通过 PLG 驱动的生产力工具,例如 Cursor、Abridge 这类直接让个人用户实际使用的产品,效果立竿见影。
但更让我兴奋的,是基于 AI 技术所带来的全新内容形态和全新内容平台的可能性,因为大型语言模型的能力还未完全成熟。但就像移动互联网时代,最大机会最终诞生在短视频、文娱和社交领域一样,我相信 AI 时代的“超级奖池”可能也在这里,未来会不会出现下一个“抖音”或“小红书”?
在硬件方面,AI 技术的发展正在催生一类全新的计算机形态出现,它需要全新的感知方式。如果便携设备能够采集我们在线下生活中产生的大量语音、视觉乃至生理数据,并通过 AI 模型进行实时处理和反馈,提供对应的服务,那么这些产品就具有极高的价值。
在健康领域,像 Oura Ring、Whoop Band 这类设备也在大量采集用户的睡眠、压力与运动数据,甚至已经有技术可以采集类似荷尔蒙水平等更细微的指标(例如利用光谱传感)。
这些硬件产品的核心价值在于,它们能采集到此前尚未被数字化的高质量人体数据。这些数据,既是智能手机难以捕捉的,也是目前大模型公司难以轻易获取的。然后这些数据给到模型,可以训练出一个 AI 健康顾问,指导我们的日常健康,让我们活得更好,我会非常愿意买单。
当产品或服务必须依赖于这类独特、由硬件采集的数据来优化模型性能时,就能建立了一个极其重要的护城河。如果公司/产品的核心竞争力仅仅是基于通用大模型之上,总有一天会被它吞噬,但拥有属于自己的高质量且难以替代的数据资产,具备更强的持续竞争力与独立性。
高瓴创投王蓓:(还是)最普适的商业逻辑。“太阳底下无新事”,不可能有哪个模式或供需关系是前无古人、后无来者的。底层需求一直都在。最终,我们坚持的是常识驱动。只有常识才是不变的。很多价值投资的理论,核心也是常识。
Founder Park:“常识”具体怎么定义?
高瓴创投王蓓:你能给用户创造什么价值、大家为什么要用你的产品?如果你能用三句话给一个完全不懂行的人讲清楚,对方能理解,那可能就符合常识。如果需要堆砌一堆专业术语、花哨词汇,只有创投圈千把号人自嗨,那这个事情可能既破不了圈,也带不来大的商业价值。
靖亚资本何沛:靖亚的策略没变,在我们发布的年度报告上,总结为五个方面:
一是 AI for Content(即 AIGC),随着多模态技术的发展,语音、视频、3D、互动视频、互动游戏等模态的价值还将继续放大,目前还处在很早期阶段。
二是 AI for Productivity。大家常说的 Copilot 或 Agent 方向的产品/应用,核心目的是提高我们的生产力。我们观察到业内从 Copilot 向 Agent/Autopilot 演进的趋势,我们非常看好这一方向。
三是 AI for Insights 。 AIGC 为互联网带来了指数级增加的内容,甚至让人难以分辨真伪。这意味着,在海量噪音中找到真正有价值的信号将变得极其困难。唯一的解决办法可能是“用魔法打败魔法”,让 AI 来帮我们去分辨什么是对我们有用的“信号”。
四是 AI for Service,我们坚信 AI 最终会取代人类的某些相对可以清晰定义边界的工作,并直接交付结果。我们在这一领域持续布局,例如 AI 编程、AI 招聘、AI 客服等方向,这些领域已经能够带来很大的商业价值。
五是 AI for Real World。 我们觉得生成式AI 不应该只停留在数字世界,而是需要与现实世界交互。我们已经投资了几家很有潜力的公司,例如千寻智能和 Hilbot,都是非常优秀的具身智能公司。
明势创投夏令:会更积极地面向 Agent 去做投资:
应用层:包括专业/垂直领域 Agent、Kill Time 类 Agent。
Agent Infra 层:Agent 相关的基础设施,包括记忆、工具相关。
我们认为,垂直领域的 AI Agent 绝不能按过去投中国 SaaS 的逻辑去看。中国 SaaS 市场这么些年,中国投资人交了这么多学费,它很清晰的特点是为结果付费,而不是为效率工具付费。中国当然有企业愿意为效率工具付费,但相比美国整体盘子小,付费能力弱。AI 作为更强的生产力工具,我们希望投的是能直接交付结果的 AI Agent。
比如我们投的 AI 律所艾语智能 vs 美国 Harvey。Harvey 服务的是世界 500 强的律师,为他们提效,收席位费,工具导向。艾语是自己服务金融机构提供某一类细分的批量诉讼业务,AI 完成大部分流程,有些环节需要 AI 指导小白操作,收费模式是 take rate,交付的是结果;包括销售工具,美国 SDR 工具收席位费,中国我们看到有创业公司直接做销售拿 take rate。
本质上,技术跟垂直行业的结合,是把原有行业中无法标准化、结构化的业务环节进行标准化、结构化,从而实现规模化,最终交付结果。
Founder Park:真格现在有投 Agent 的逻辑吗?
真格基金刘元:我们的逻辑是“投人”。 如果现在有人来说要做 Agent,我们会问:为什么现在做?之前在干嘛?未来想干嘛?
我们总说,如果你跟别人做一样的事,选一样的路,就会得到一样的结果。我们所有的问题都围绕着:你不一样的地方在哪里?
最近一两个月好像确实没投过纯粹说自己是做 Agent 的。我们投的那些沾点边的,都是一两年前聊的了。到现在出来说要做 Agent,你得拿出点别人没说过的话、没做过的事,其实挺难的。
Founder Park:真格在 AI 领域没有“赛道”的投资逻辑?
真格基金刘元:没有,我们不做预设。
我们的心态非常开放。我们会根据从创业者那里学到的东西形成一些观点,但我们清楚地知道这些观点随时可能被颠覆,并且非常期待被优秀的创业者来改变我们的看法。这一点,真格十几年都没变过。
二十三、好项目在哪里?好项目的标准变了吗?
Founder Park:怎么看今年的创业环境?好项目变多了吗?
明势创投夏令:有机遇,有挑战。大环境是技术仍在高速发展,“+AI”的应用越来越多,但“+AI”在中国市场更多是原有玩家的机会,创业公司想简单地“+AI”机会有限。而且融资环境依然有较大不确定性,比如关税导致的二级市场的波动。
总体判断:好项目一定会变多。因为技术驱动力在,人才供给也在增加。但这些好项目一定不在拍脑袋就能想到的地方,而是在非共识的、精心挑选的、深扎场景找到的切口。
Atypical 邵帅:我注意到一个趋势是如今很多一线机构愿意重金投资那些背景雄厚、有过大公司成功经验的“明星创始人”,并给予他们充足的资金去探索 AI Native 应用方向。体现在很多项目在早期阶段就获得了大额融资,估值也水涨船高。这与移动互联网时代按部就班的融资节奏有很大不同。
在这种模式下,优秀项目的标准似乎更多侧重于,拥有一个有潜力的 CEO 和一个大赛道,至于产品的具体形态可能还在摸索。
从我个人的角度,我还是偏向“本分”一些。
我认为,创业团队过早拿到大额资金,可能导致战略方向的偏离。参考移动互联网,张一鸣早期只有周子敬等人给的几十万天使(2012 年),后来王琼 SIG 的百万美金(2012 年),甚至 B 轮融资挺痛苦的。
但今天呢?很多背景不错的创始人,一出来就是几轮,具身智能也是这样,有点重现当年最疯狂的时候,华贸一天闭环,三轮结束了啊。(笑)
当然,做通用模型或 Agent 这类需要大规模资金投入的项目另当别论。
但对于大多数软件应用类和硬件项目,我更看重创始人如何打磨产品、实现商业化的能力,关注 PMF、Retention 、ROI 等一些核心指标,虽然看起来有些“守旧”,但是我们坚守的投资逻辑。
创新工场任博冰:一个变化是,出来创业的人,相比前两年整体趋势是变少的。去年相对前年就少了很多,今年下半年可能会比去年稍多一点,但总量仍在低位。这主要是因为 AI 创业门槛确实变高了,事情本身就很难。
另一个变化是,今年大量人民币基金开始进入 AI 领域。一方面是政府引导,设立 AI 生态基金;另一方面,一些原有投硬科技的基金发现其他方向机会减少,开始转向 AI,疯狂招人。但对于硬科技基金来说,投 AI 应用其实挑战很高。
长期来看,好项目会变多。因为好的“主题”也在变多。过去两年,能赚钱的好主题不多。
AI Infra,前两年热,但长期能赚多少钱还是问号。
AI 硬件,短期可能是主题,但长期未必是最好的。
最好的主题一定是 AI 应用。但过去两年,赚钱的 AI 应用主题很少,流量榜靠前的多是工具类。连 AI 陪伴,留存和 ROI 都面临挑战。
真正好的主题,肯定不是工具。最好的主题,比如 ToC 的娱乐应用,还没真正出来。今年可能会冒出一些苗头。还有一些平台性的主题,之前没人做,现在才刚开始有人摸索。
Founder Park:为什么下半年创业者会比去年多?
创新工场任博冰:去年市场极其冷淡。今年春节后,我们接触到的人里,表达创业意愿的变多了。这和信心有关:
技术可用性:像 DeepSeek 这样的高质量开源模型出现,让国内创业者有了更好的基础,感觉与美国的差距在某些点上缩小了。
产品有机会:像 Manus 这样的产品,让大家看到通过产品创新和能力,依然能做出不错的成绩。
方向更清晰:相比去年的迷茫,现在很多人对底层机会想得更清楚了。能不能迈出创业这一步,很多时候是个信心问题。
Creek Stone 钟陆欢:数量上不好判断,但春节后 DeepSeek 爆发以来,市场上项目的估值确实普遍变贵了,这更考验我们对早期项目的判断能力,也更能体现我们的打法的优势。我们相信,随着 Token 价格下降、基建完善,未来好项目会越来越多。
Founder Park: 项目变贵是迅速形成共识带来的负面影响吗?
Creek Stone 李一豪: 不完全是共识造成的,也与供需关系有关。
相比上一个全球化周期,中国的美元基金总规模是大幅减少的,但同比创业团队的数量也少了很多,这也和技术阶段息息相关。因为数量少了,同时一级市场有效性很高,优秀的团队和热点方向估值增长就会很快。
行业里主要有两种打法,ETF 打法对市场 beta 有效体现,以及现在在硅谷也很流行的 solo fund 打法。Solo fund 在现在的优势,是更多利用社交网络和媒体,把个人认知、资源串联和品牌效应放大了,我们就在这个道路上做尝试,在更早甚至半孵化的阶段去服务创业者。
换个角度看,我们自己其实从去年年初开始喊着要投 AI 应用的时候,被好多投资人质疑过。大家当时觉得,基础大模型都还没做好,你凭啥去投应用呢?结果,一直等到今年所有人才突然意识到好像都没怎么投过应用,这也导致市场上一些应用的项目反而一下子变贵了。
线性资本郑灿:这可能跟共识没有关系。投资的马太效应、项目的马太效应,其实从去年就开始了。但这并不是共识的结果,“共” 的状态可能反而是“都没想清楚”。
什么情况是共识?大家都在抢着领投、独投。现在没有那么多项目是大家抢着独家投的。具身另说。
(创业环境)可以从两个方面看:
模型能力变强了,能做的事情肯定变多了。很多原来做不到的场景现在能做了,原来只能做到及格的产品现在能做到优秀了。这打开了很多新的创业方向。我们会看到更多优秀的人在做有价值的事情。
认知/情绪层面,市场认知提升了,客户教育成本降低了。大家不再怀疑 AI 有没有用,这为商业化扫清了一些障碍。
综合来看,无论是从能做的事情、对商业环境的影响,还是对投资情绪的影响,都是正面的。体感上,投资人肯定比过去更积极了。
至于好项目,我觉得肯定是变多了。原因包括:创始人的思考在变得成熟;技术催生了更多能做的方向和场景。
当前阶段,尤其是在 AI 应用领域,有强商业 sense 和产品 sense 的团队更有优势。他们需要对目标场景有深刻理解,对如何提供好的用户体验有深刻理解,对如何商业化推广有深刻理解。一旦这些要素契合,结果交付可能会非常快。
真格基金刘元:整体感觉,此刻还决定创业的,很多是真正想创业的人。一级市场冷清,To VC 的项目少了很多,这是好事,项目的纯度变高了。当然,追热点的还是有,比如去年有很大比例的创业者做陪伴机器人,前年有大量创业者做中国的 Character.ai 一样。
我们现在更愿意跟那些从小团队,甚至独立开发者开始,或者几个同学一起动手做东西的人聊。踏踏实实做事的人还是挺多的。
Founder Park:独立开发者是好的画像吗?
真格基金刘元:“独立开发者”这个标签不一定是。关键看 ta 是享受做一个“作者”,还是想做一个“系统和组织的建立者”?作为独立开发者的状态是一个创业的开端还是创业的目的本身?这从他的行动(有没有找合伙人、有没有系统化运作)能看出来。
二十四、投资人角色有变化吗?
Founder Park:现阶段,VC 能给创业者提供的帮助和以前有变化吗?
Atypical 邵帅:这是我想特别强调的 Atypical 的优势所在。现如今的 AI 创业,尤其是 Agent 和其他应用类项目,从 Day One 就应该考虑全球市场,尤其是欧美市场。出海的原因有很多,比如考虑到模型能力、用户的付费意愿、人力替代的 ROI(尤其在 B2B),以及相对宽松的监管环境(尤其是面向消费者的内容和娱乐类产品)。
然而,华人面孔的创业者出海面临着不少挑战,涉及文化差异、市场理解、用户习惯、法规政策和融资环境等多方面因素。同时,在一开始就想拿到 A16Z、Benchmark 等顶级美元基金的钱其实并不容易,需要有信任基础的早期美元基金来支持早期更好。
Atypical 的优势在于具有硅谷背景的美元基金的“基因”。Atypical 基金的团队成员拥有深厚的硅谷背景与全球化的网络资源,我们的 LP 也涵盖了很多全球领先企业。我们能够为有出海意图的华人创业者提供架构设计与身份规划建议、欧美市场的洞察和调研、当地资本、人才、合作伙伴和客户资源的对接,以及通过 LP 网络加速商业化进程等服务。
尤其是在我们擅长的内容平台,SaaS、Agent、消费级硬件等领域,我们拥有丰富的经验与认知,能够为出海的优秀华人创业者提供切实的帮助。
创新工场任博冰:变化很大,帮助几乎是全方位的。现在大家(VC 和创业者)都坐在“车的前排”。
以前投硬科技,投资人很多时候坐后排就行,创业者经验认知可能更强,是他们给投资人上课。现在,我们和被投企业更像是“副驾”关系,都是学习者和探索者。
我们可以提供信息和视角,思考一些他们可能没精力想的事,把之前周期的经验(比如移动互联网的打法)告诉他们。链接资源, 找人帮他们解决具体问题。以及辅助一些决策,比如讨论是否开源、融资节奏、如何建立决策系统等。
这些帮助比以前单纯的精神支持或资源对接要深入得多。移动互联网早期,投资人起到的作用也是非常大的。
真格刘元:坦率说,AI 之前,市场太久没有大机会了,投资人也面临“青黄不接”。投资人最重要的成长是陪伴伟大的公司一起成长。移动互联网红利期过后,大家都在摸索。
现在能提供的,尤其对我们这种非创业者出身的投资人来说:
首先是别管太多。
提供信息。创业者是隧道视野(tunnel vision),投资人可以提供广度信息,告诉他赛道格局、行业最佳实践等。
提供网络。比如我们给 Manus 介绍了张涛和 Peak,以前也给大量的真格被投公司介绍过高管。这种合伙人级别的牵线,我们一直在做。
但说到底,真正的好公司,不太需要投资人帮太多忙。
二十五、最近在思考什么问题?
Founder Park:近期在思考哪些问题?
创新工场任博冰:VC 行业本身就面临巨大调整。过去几年的状态和未来的挑战,必然要求 VC 组织做出巨大调整——战略、打法、组织结构都要变。能快速自我进化、适应变化的 VC 组织,才能在新的时代生存下来。这和对大厂、对创业公司的要求是一样的。
VC 需要重新思考:
如果未来是应用驱动,用什么方式做决策?谁去看项目?
如何吸引创始人?投前投后关系如何处理?过去几年大家都在搞退出,现在还能这样吗?
条款是不是也要变?
这些都要大改。虽然现在公开讨论不多,但我相信很多 VC 内部在思考或已经在做这些事了。
明势创投夏令:Agent 会带来哪些深远改变?
商业模式: Agent 可能改变现有的互联网商业模式。比如,Agent 不看广告,那以前基于点击的广告模式怎么办?Agent 时代的商业模式会是什么?
组织形态: Agent 可能成为我们组织的一员。HR 是否要招聘 Agent?Agent 是否需要培训?Agent 会对现有组织结构、工作流程产生什么影响?
这些都是我们正在思考的,关于 Agent 将如何重塑商业和社会的问题。
线性资本郑灿:最常讨论和思考的问题是:今天的技术进步,能够新打开哪些应用的门?
这里的“打开”是指,把原来做不到及格线的事情做到及格。只要有可能及格,就值得我们从投资角度开始观察了。当技术有大的提升时,我们就会去思考它能在哪些方向上带来落地的可能性。判断“及格”的标准就是,使用者能否接受它,比如 AI 生成的语音是否听起来和真人差别不大。
另一个思考角度是:在足够大的场景里,今天的技术还有哪些明显的短板或痛点?
比如 Coding 领域,现有工具仍有上下文长度限制、大代码库处理不佳、易出错且难以修正等问题。那么,有没有什么方式可以解决这些核心痛点?
以下是出现在这篇访谈中的投资人们:Alphaist 创始人 - 陈哲(ex 五源),Atypical Ventures 合伙人 - 邵帅,创新工场执行董事暨前沿科技基金总经理 - 任博冰,Creek Stone 创始人 - 李一豪、钟陆欢(ex 弘毅),高瓴创投合伙人 - 王蓓,锦秋基金合伙人 - 臧天宇,靖亚资本创始合伙人 - 何沛,明势创投合伙人 - 夏令,线性资本董事总经理 - 郑灿,真格基金合伙人 - 刘元。
特别说一下,两家新成立的基金,从五源出来的陈哲做了 Alphaist,从弘毅出来的李一豪、钟陆欢做了 Creek Stone。新基金的 GP 很有趣,他们也成了创业者。
本文来自微信公众号:Founder Park,作者:Nico编辑 :Nico、万户
下一篇:宜宾的下一个十年