来源:钛媒体
2026年Las Vegas的CES展会上人潮涌动,当全球科技巨头们还在讨论人形机器人何时可以实现真实场景的商业闭环时,North Hall区一个60平米的展位前却聚集了近百人围观。一台拥有双灵巧机械臂和生动数字人交互的咖啡机器人成为在场所有人关注的焦点,多位现场观众都给出了类似的评价——“这应该是本届CES里最落地的具身智能产品”。
这台名为XBOT的咖啡机器人来自于一家聚焦消费场景的中国具身智能企业:影智XBOT,而这家公司的创始人正是先后作为腾讯与小米的早期成员,主导了QQ表情、QQ空间、小爱音箱、小米路由器等爆款产品的唐沐。
当大部分具身智能企业还在工业场景和家庭场景的红海中搏杀内卷之时,这位中国顶级产品经理已经用600台机器人部署、400万杯咖啡的销售数据,实现了具身智能首次以标准化商业产品形态进入全球最高频消费场景的突破,这不仅是影智科技交出的第一份商用具身智能的落地答卷,对于整个具身智能行业的商业落地进程而言,也具有里程碑的意义。
如何让机器人做出一杯不输于人类咖啡师的精品咖啡?
“这可不是一台装了机械臂的咖啡机,而是一台真正会做精品咖啡的机器人。”影智XBOT的负责人对钛媒体表示。XBOT的精品咖啡制作“手艺”的背后,是一套从数据采集、算法校准到模型迭代的完整技术闭环。
在口感标准上,XBOT搭载了进口全自动咖啡机,预设超30种基础饮品菜单,实现100%还原精品咖啡口味。通过智能研磨、电子布粉、智能萃取技术,确保每次出品的浓缩咖啡和奶基咖啡都达到专业咖啡师的手工水准,口感一致,粉量误差为±0.3g(人类咖啡师为±2g),另一方面保持了机器人的最大优势,即高效性(110秒即可完成两杯咖啡制作,单日输出超500杯)与品质稳定性。
精品咖啡核心情绪价值的显性符号在“拉花工艺”上,为了让XBOT能够完美复刻人类顶级咖啡师的手部动作细节,公司自建了好莱坞级机器人视觉实验室,部署了11组摄像机与红外光标记点,全角度捕捉黑杯咖啡大赛冠军等顶级咖啡师的双手动作路径。在积累了上百小时的视频数据之后,通过数字孪生技术将三维动作数据转译为机械臂智能规划路径,实现重复精度±0.02毫米的精准复刻。
体现在量产XBOT上,它不仅能完美复刻人类咖啡师擅长的爱心、天鹅等经典拉花图案,也能实现文字、图片、节日主题等富含打卡属性的多种创新印花咖啡。甚至能通过上传自拍照片,通过AI大语言模型生成AI数字形象,制作成为用户专属定制的AI印花咖啡。
同时,为了解决具身行业常见的量产机械臂精度校准误差难题,影智XBOT自研了一套“自动校准+虚实同步算法”。实现了在数字孪生调试好动作后,真实机械臂可自动校准初始位置与定位精度,无需人工逐台调整,结合AI对动作进行微调优化,将单台机器人调试时间压缩至3小时,极大降低了咖啡机器人量产与部署的难度。
更值得关注的是,影智XBOT还构建了行业首个“咖啡大模型”,集成饮品知识库、口味拼配算法与多模态交互能力。当顾客向生动的数字人咖啡师提出口味要求,比如“要一杯热带风情的咖啡”或“更浓/淡”时,大模型会自动解析语义,调整配方参数并生成制作脚本,实现“千人千面”的近百种个性化口感定制。甚至,即使用户没有发出主动要求的情况下,数字人咖啡师也会通过摄像头识别用户情绪与消费历史,主动推荐专属饮品,让一杯咖啡成为有温度、有记忆点的社交载体。
从动捕学习、自动校准到大模型驱动,影智XBOT用三年400万杯的咖啡制作数据,将冰冷的机械臂训练成一位不知疲倦、千杯如一、还能读懂人心的“赛博咖啡大师”。
二元产品基因,助力商业具身智能的最快落地
XBOT咖啡机器人的产品灵魂,深深烙印着创始人唐沐横跨腾讯与小米两大科技巨头的双重基因。凑巧,这两家公司正好代表了国内最强的互联网产品能力和智能硬件产品能力。
两大最强基因的融合为唐沐构筑了一套独特的产品设计哲学,他自己曾在某次公开采访中提到一套“天平理论”——“左边是科技,右边是美学,正中间是情绪价值,基座是质量、成本与交付。”而正是基于这套产品设计哲学,才成就了XBOT今天顺滑的交互体验与扎实的硬件品质。
情绪价值作为唐沐设计哲学的核心要素,体现在XBOT的每一个细节之中。为了弱化机械臂拒人于千里之外的冰冷气质,唐沐毅然决定要给咖啡机器人加装43英寸的交互大屏与AI数字人多模态交互系统。不同的数字人咖啡师还被赋予不同的MBTI人格,支持多种语言和方言的实时交互,让用户获得真实“他乡遇故知”的亲近感。当摄像头识别到老用户,数字咖啡师用亲切的乡音主动喊出用户的名字并推荐道“还是老样子?一杯少冰冰美式?”,行业所普遍追求的“有温度的具身智能”已经呼之欲出。同时,XBOT重金研发的定制拉花能力,又让每一杯咖啡成为“可饮用的社交货币”,这种“裂变”的营销玩法自然也传承至腾讯领先全球的社交基因。
唐沐在采访中坦言:“机器人必须突破工具属性,具备多模态交互与情绪感知能力。”这正是他在腾讯十年打磨亿级用户产品所沉淀的核心认知——技术必须服务于人性的温度。
而另一方面,传承自小米的硬件供应链能力,则让XBOT实现从概念到量产的跨越。小米在硬件生态上的快速迭代、性能翻倍和价格减半的极致风格,被唐沐同样带到了影智XBOT。从XBOT初代机售价60万,二代机降至38万,Lite版直击18.9万元,价格降至三分之一的同时各项功能提升50%,这种跨越式迭代的背后正是影智XBOT全链条自研能力的硬支撑,正如同小米当年对各类供应链的极致整合。
当被问到为什么不做人形,唐沐说道:“十五五规划建议用的是具身智能而非人形机器人,这个表述让我特别振奋。”在他看来,人形机器人是具身智能的“子集”而非“全集”,追求形态像人不如追求能力解决问题。“比如养老场景需要的是智能助浴系统而非站立不稳的机器人护工,而咖啡场景需要的是稳定精准的机械臂而非会走路的咖啡师。强行赋予人形,是资源浪费,更是安全隐患。”
今年11月,影智XBOT还落地了上海首家XBOT机器人7S服务中心,涵盖销售、服务、配件、信息反馈、金融、数据运营、设备回购全链条服务。闭环了整个设备的交付和服务过程,也将客户决策和部署的门槛降到了最低。
根据影智XBOT提供信息,截至发稿,XBOT已部署涵盖商业地产、文旅、城市图书馆、影院、剧场等落地场景,落地国家和地区15+,覆盖城市100+,全球落地总量600+,累计为全球用户提供精品咖啡超400万杯。预计2026年,XBOT的总部署量将突破3000台。对于整个具身智能行业的商业落地进程而言,影智XBOT的快速落地案例无疑非常具有里程碑意义。而在唐沐眼中,这只是其真正想要打造的具身智能消费生态的第一步。
以咖啡机器人为切口的消费具身革命
当XBOT咖啡机器人凭借双臂协同、视觉感知与咖啡大模型在600余个点位完成400万杯咖啡的交付后,其沉淀的硬件物理能力与AI模型能力已展现出惊人的泛化性。XBOT这套通用身体+AI大脑,如同一个可插拔的U盘,让同一套技术底座得以快速迁移至冰淇淋、牛排、拉面、调酒、快餐等十余个消费品类。其中,XBOT的冰淇淋机器人已经实现量产,在本次CES上也同步展出,占地仅1.35㎡,零售价15.9万元。这种“一机多脑、平台+插件”的架构,极大缩短了新消费品类机器人的研发周期,均摊了初期的消费场景拓展成本,将XBOT的产品线从单一的消费设备升级为可规模复制的跨品类解决方案。
而唐沐眼中的终局还远不止如此。当这些机器人高密度部署于文旅景区、商业综合体、医院、图书馆、企业总部等高流量场景时,它们共同构建起一个覆盖大量真实消费行为的数据入口。每台机器人将不止是消费行为的交付工具,更是实时采集用户消费偏好、消费动线、复购率、情绪反馈的智能终端。机器人不再仅是替代人力服务的“效率工具”,而是成为连接消费者、商户、供应链的“场景智能体”。这些分散在物理空间的消费行为数据将成为引发消费具身革命的基础,既能进一步为消费者提供更加智能和个性化的服务,更能为商业体等消费场景提供运营优化、投资行为的决策意见,这正是物理AI赋能商业场景的深层价值。
工业具身智能优化的是生产流程与资源配置,家庭具身智能满足的是个体需求与情感陪伴,而消费具身智能,则需要同时解决消费者的非标服务需求和商业场景的运营优化需求,本身就是一件更为复杂的任务。消费生态具身智能或将可以崛起为独立于工业场景与家庭场景之外的第三大具身智能赋能领域,但相较于工业场景的真实订单数量优势和家庭场景的C端故事优势,消费具身智能还需要更多时间来被资本和客户认知。
XBOT在CES的火热只是个开始,唐沐也深知他自己选择这条路线的坎坷,而无论前路如何艰难,影智XBOT正以咖啡机器人为切口,拉开的是一个万亿级线下消费生态智能化升级的序幕。
特别声明:以上内容仅代表作者本人的观点或立场,不代表Hehson财经头条的观点或立场。如因作品内容、版权或其他问题需要与Hehson财经头条联系的,请于上述内容发布后的30天内进行。