从0到1打造Labubu ,MiniMax Agent 让我看到了智能体未来的样子
创始人
2025-06-18 00:00:38
0

从 0 到 1 打造 Labubu,MiniMax Agent 展现出了令人惊叹的能力。它仿佛拥有着无尽的创造力和学习能力,如同一个神奇的工匠,在虚拟的世界中雕琢出一个个鲜活的 Labubu 形象。它不断地探索、尝试,优化每一个细节,仿佛知道用户心中对 Labubu 的期待。看着它逐渐成型的过程,仿佛看到了智能体未来的样子,它们将不再是冰冷的程序,而是能够理解人类需求、创造价值的伙伴。MiniMax Agent 为我们打开了一扇通往智能体未来的大门,让我们对未来充满了期待。


本文来自微信公众号:APPSO (ID:appsolution),作者:发现明日产品的,原文标题:《从 0 到 1 打造 Labubu ,MiniMax Agent 让我看到了智能体未来的样子》


今年上半年,最吊足胃口和期待的,莫过于Agent工具,饼画得都很大:日常中那些烧脑、重复、耗时间的任务,现在似乎只需要动动手指、敲几行prompt就能搞定。


大饼真的很诱人,但仔细想想:想要真的做到那么有用,需要的,是某种与你我类似的思考、规划,甚至还有能自己跟自己较劲、主动反思的能力。


带着这个想法,我们测试了最新的MiniMax Agent进行了一轮深度测试——不再满足于入门级的考察,而是把它丢进了一些充满趣味和挑战、又不失真实的工作场景,想看看它到底能聪明到什么程度。


对MiniMax Agent的期待,千言万语只有一点:玩着玩着,就把活儿干了。


创意内容:超越想象的视觉叙事


MiniMax本身就在多模态模型上积累深厚,这样的优势,对于想要出产创意型作品,可谓是信手拈来。


最近的Labubu简直火出天际,刚好就来给Labubu搞个宣传计划——听起来很复杂,这个Agent丝毫不慌,先制定一套完整的宣传策略计划,确定交付物清单,再有序生成海报,再按部就班地准备宣传海报。


全程看下来,MiniMax Agent一边动脑思考,一边调用合适的工具,主打一个行云流水,有条不紊。


就交付的结果来说,还真是不小的惊喜:不仅视觉审美在线,介绍文案也讲得清清楚楚,主题海报画廊一套接一套,别说,MiniMax Agent不只能做事,居然还有点「品味」。


类似的,还可以继续用Labubu做主角,让MiniMax Agent整一本20页图画书。


效果出人意料地出色,角色形象一致性比较好,每页图配文也不敷衍,读起来有内容,看起来不枯燥,还支持网页端部署,排版合理,细节讲究。


当然,我更喜欢它将Labubu改成了小兔帽熊熊的昵称,听起来软萌,看起来也确实养眼,图文兼备的情况下,适合小朋友,也适合大朋友。


PPT制作:不止美观,更会「雕花」


这次更新中,一大亮点是能做漂亮的PPT——职场打工人的刚需。


对于MiniMax Agent来说,PPT也是多模态的一种。看上去只是图片和文字,但无论是排版、内容规划和组织,都得有主题、有思路、有逻辑,并且还要能自主补全内容。


比如面向初中生设计一份物理讲解的PPT:


或者面向投资者,制作的商业报告:


简单来说,要做好PPT,不仅是简单的信息查找,更是对信息的筛选、去噪和跨领域关联的能力测试。


成品的效果都很好看,不禁让人好奇:在制作的过程中,MiniMax Agent都做了些什么?


我们用市场调研类别的PPT做了一个测试,这类PPT通常数据量大、信息密集,正好可以看看它在理解数据、选择合适图表以及呈现效果方面的能力到底怎么样。


首先它能准确地拆分任务,按照「页面布局+图表类型+数据样式」三层结构来梳理内容,页面规划很有一套。



可视化的呈现,不仅完整无遗漏地展示了关键数据点,还根据不同的数据特点,选用合适的可视化方式来展示。整个PPT的动画过渡也做得非常流畅,把重点自然地突出出来,连微调动画的工夫都省了。



最后交付时,除了要求的PPT文稿外,还额外提供了Web和PDF文件,以及Markdown文件。


总体来看,Minimax agent在「理解-整合-推理-生成-表达」这一完整链条上的能力都很不错,尤其是在非代码、偏文案和商业分析方面,完全称得上「专业」两个字。


音频到网站:一站式智能内容工作流


如果说图文都还不算进阶,那更考验agent实力的场景出现了:这个任务要求把上传过去的音频文件转换一遍格式,然后转成逐字稿,并且带时间戳。最后还要根据内容生成一个思维导图。


拆开来看,这些任务都没什么难度,但合在一起完成才是难点所在。


过去,要么熟练掌握转格式工具,或耗费时间寻找并尝试各种在线转换工具。而MiniMax Agent直接在内部完成了这一操作,大大节省了我们寻找、安装和操作外部工具的精力。


MiniMax Agent在整个流程中展现出的高效与便捷非常值得一赞。最直观的感受便是格式转换的无缝衔接。从进程视窗里可以看到,MiniMax Agent在生成逐字稿方面的快速、准确。


除了能把将音频内容转换为文本,还能对音频内容有深层理解,这些都体现在给出的思维导图里。


思维导图不仅能清晰地梳理出音频的核心观点和逻辑脉络,还能准确捕捉到内容的层次结构和关键信息点。


这远超简单的关键词提取,展现了MiniMax Agent将零散信息结构化、可视化的强大能力。


虽然是我给下的需求,但具体该怎么实现,其实我心里也没数。倒是它自己,主动给自己安排好了工作:从安装依赖包到启动服务器,自行完成了该做的工作,一点不需要操心。


UI设计:边学边用,高效产出


真正回到日常工作中,一定会涉及的环节是:调研了解-学习领悟-上手实践。这是人类最最基本的作业流程。毕竟,没有调研,就没有想法。


那么,想要成为一个优秀的agent,这个流程也必不可少——很复杂,但是很必要。


下面的案例中就是考察整个流程的实现:研究Apple iOS 26的液态玻璃的设计风格,制作一个类似的UI。


显然,MiniMax Agent也知道这是个相当复杂的任务,给自己制定了一整个作业计划。


接下来则是一步步的设计、部署和写代码。步骤很杂很多,但它自己有条不紊地执行,完全不需要人来操心——甚至还能想到要找「视觉冲击力强」的素材。


最终交付出来的,不仅有代码包,还有一个网站,来展示整个过程中调研获得的成果,视觉化地展示不同维度的成果。


甚至还专门留出了个交互体验的专区,可以简单体验效果——完全超出了原有prompt本身的设定,超额完成任务。


原有的prompt其实非常简单,对比最后交付的成果可以看到,MiniMax Agent不仅仅是有调研、深入的能力,用代码完成任务的能力,更加是对任务有「自己的理解」。


深度研究:不止是搜索,更需要推理


资料调研是基本功了,难度不高,但是个细致活——尤其是根据最新的新闻做调研,信息获取要尽量延伸。


从思维链的过程,以及交付成果上来看,Agent在完成这份研究报告的表现,远超预期:不仅完成了结构化的信息整合,还展示了自己的推理本领。


在报告中,MiniMax Agent并不只是简单罗列数据,而是能识别了市场规模「自上而下」与「自下而下」的巨大差异,并将其作为「重要的市场洞察」提出。


显然,简单的信息罗列,称不上是真正的「深度研究」。Agent需要识别数据背后的模式、趋势、因果关系,并在这些基础上,形成有价值的「洞察」和「核心观点」——这需要的,是超越文本匹配的推理能力。


总结:左手模型,右手Agent,MIniMax让我看到了智能体未来的样子


Agent是今年AI最火的赛道之一,大家都在谈论Agent的未来,但真正让Agent从炫技演示和「五分钟热度」的玩具走向能改变生产力的工具,其实寥寥无几。


拥有自研模型的MiniMax推出了自己的Agent产品,给我们展现出了不一样的打法。在测试后我们也对Agent有了新的理解:决定Agent体验的,不只是模型本身,还更多体现在那些看不见的基础设施上。


这里有个特别值得一提的细节——作为独立公司,MiniMax几乎是唯一一家能够提供完整全模态能力的厂商。



MiniMax语音模型Speech-02-HD位列Artificial Analysis Speech Arena榜单第一



MiniMax视频模型Hailuo 02位列Artificial Analysis Video Arena榜单第二


Agent大部分的能力都依赖于模型这个引擎,「模型即Agent」的趋势也越来越明显。


在这一点上,模型公司做AI应用的优势就体现得淋漓尽致了。由于直接掌控模型底层,他们能更有效地优化调度逻辑、降低运行成本,并构建数据飞轮来自主迭代。


MiniMax就是这样的典型代表——随着其自有模型能力的提升,Agent的运行成本不断优化,性能也显著增强。



今天MiniMax开源全球首个大规模混合架构的推理模型MiniMax-M1,原生支持100万token的输入长度和8万输出token的行业最长输出,推理算力生成10万token只需要DeepSeek R1的25%,将推理模型的价格又打了下来。


当其他创业公司还在为高昂的token成本发愁时,MiniMax已经能够通过提升自有模型比例来系统性地降低Agent运营成本,这对用户能持续稳定地体验十分重要。


这正是「MinimizeEfforts,MaximizeIntelligence」的极致诠释,简单来说,就是用最小的努力换取最大的智能。


MiniMax这种「左手模型,右手Agent」的布局,让他们能够在技术能力和用户价值之间找到最佳平衡点,确实具备了在这场智能体竞赛中脱颖而出的条件。


我们正身处一个前所未有的转折点:AI正从工具进化为拥有「大脑、感官、手脚」的复合智能体,它为未来工作与生活,开启了更新、更酷的想象空间。

相关内容

热门资讯

A股脑机接口板块周二逆势大涨 中新社北京6月17日电 (记者 陈康亮)中国A股17日(周二)遭遇调整,主要股指小幅下跌,但市场结构...
世界黄金协会:超九成受访央行认... 各央行依然对黄金青睐有加。 世界黄金协会6月17日发布的《2025年全球央行黄金储备调查》(CBGR...
AGV激光叉车应用现状与发展趋... 随着工业4.0时代的深入发展,智能物流装备正加速渗透制造业的毛细血管。在众多自动化搬运方案中,AGV...
活动 | 三周年:2025福布... 2025福布斯中国出海全球化30&30评选正在申报中。本次评选聚焦中国品牌全球化的创新力量与行业影响...
原创 风... 你有没有发现,最近一打开新闻,全是外资又在往中国砸钱的消息?我本来还以为是噱头,结果仔细一看,嗯?真...
管理不足4个月即卸任!这位基金... 管理不到4个月就火速“清仓式”卸任,这位基金经理是怎么回事? 6月17日,格林基金发布多份基金经理变...
从全球第五到第二,光伏支架龙头... 图源:图虫创意 来源|时代商业研究院 作者|陈佳鑫 编辑|韩迅 2024年,在多数光伏产业链企业业绩...
华阳新材股票三日涨幅达20% ... 雷达财经 文|杨洋 编|李亦辉 6月17日,华阳新材(证券代码:600281)发布公告称,公司股票于...
机构席位卖出509.91万 北... 每经讯,2025年6月17日,北交所上市公司方正阀门(920082,收盘价:22.69元)登上龙虎榜...
再见!福州公交告别人工售票!3... 再见!福州公交告别人工售票!这一转变标志着福州公交发展的新里程碑。33 路作为率先实行无人售票的线路...
更新!厦门:各小区涨跌排行榜 今天,带来的是:厦门各区最新的二手房成交数据。 临近6月中旬,夏至日也即将到来,接下来户外的气温将会...
加码“中资”| 专访美世亚洲多... 每经记者|黄婉银 每经编辑|张益铭 在全球经济格局深度调整、国际贸易政策频现变数的宏观背景下,投...
沈阳一公交与多车相撞致2死16... 近日,沈阳发生一起令人痛心的事故。一辆公交与多车相撞,现场惨不忍睹,造成 2 人不幸死亡,16 人受...
礼来以13亿美元收购基因编辑初... 财联社6月17日讯(编辑 牛占林)美东时间周二,美国制药巨头礼来公司宣布,将以高达13亿美元的价格收...
600462,财报虚假记载,终... 又一家公司,被终止上市! *ST九有(600462)6月16日晚间公告,公司收到上海证券交易所《关于...
致同审计合伙人王娟:构建多层次... 近日,致同举办“破局·立势·共生——民营经济新质跃迁的多维赋能”媒体分享会,聚焦民企转型、融资及出海...
曾金策:黄金今日多空如何破局关... 黄金行情回顾: 6月17日,现货黄金周一在 3445 美元/盎司布局做空策略,精准命中行情转折点,金...
从0到1打造Labubu ,M... 从 0 到 1 打造 Labubu,MiniMax Agent 展现出了令人惊叹的能力。它仿佛拥有着...
对话地瓜机器人CEO王丛:行业... 地瓜机器人CEO王丛(图片来源:地瓜机器人) 2017年,中国首款嵌入式AI视觉芯片旭日1.0处理器...
大基金二期减持思特威;中油资本... 今日焦点思特威:大基金二期持股比例降至6.99% 思特威公告称,截至2025年6月17日,公司持股5...