中国企业,率先交出智慧空间Agent答卷。
作者 | 陈骏达
编辑 | 漠影
2026年,AI Agent正加速涌入数字世界。从年初爆火的OpenClaw,再到后来诞生的Hermes,Agent框架层出不穷。接入大模型后,它们能调用工具、操作软件、完成复杂任务,一夜之间,数字世界的许多工作和琐碎事务,似乎有被Agent接管的趋势。
然而,在物理世界,Agent的渗透程度仍然有限。智慧空间类产品虽已涌现,却大多停留在“用户发指令,设备被动响应”的初级阶段。设备语义理解能力弱、缺乏记忆与主动服务等痛点,让“智慧”二字多少有些名不副实。
Agent在数字世界的成功,让不少国内外厂商开始思考:如何将这种自主执行、长期记忆、主动智能的能力,迁移到更复杂的物理世界,并在酒店、地产、工厂、办公场所、家庭等场景提供更为智能的交互体验?
今天,科大讯飞发布了对未来空间智能的最新理解——Agent架构SpaceMind。这也是全球首个在智慧空间领域落地的Agent平台。与传统方案不同,这一架构打通了空间感知、语义理解、记忆学习、智能决策与真实设备执行的全链路能力,给智慧空间的未来,提供了一个新的架构设计。
01.
接入Agent后反而“降智”?
双路由架构成解题思路
在讨论SpaceMind的具体细节前,我们有必要先看清一个行业现状:当AI能力、Agent能力被引入现有智慧空间产品时,体验并非总是正向提升。实际上,不少产品反而变得不如以前好用了。
这些问题已经在海外许多产品上集中爆发了,不少用户抱怨大模型接入智慧空间产品后,原有的流畅体验没了。
在海外社交媒体,有用户反馈大模型参与后,设置一个30秒倒计时需要等待10多秒,开关灯也变得像碰运气一样。在他把设备恢复出厂设置后,才重新拥有之前丝滑的天气预报、播放音乐等体验。
另一位用户分享道,以前用智能音箱开盏灯只要不到5秒钟,大模型被接入后要等个20~40秒,完全毁掉了智能家居的体验。
这些用户的吐槽不无道理。大模型固然强大,但并非所有任务都需要,或者适合它亲自出马。在智慧空间中,许多设备控制类、信息查询类指令天然要求低延迟、高稳定性,而大模型推理本身存在延迟和不确定性,两者之间存在着根本性冲突。
科大讯飞也看到了这一问题。SpaceMind对上述问题的解决思路是对指令进行分流。其双路由架构将控制指令与推理任务分别交由两条互不干扰的通道处理,分工逻辑类似人类的大脑和小脑。
其中,一级路由(控制通道)主要负责处理设备控制类指令。这些指令不经过大模型,端到端响应仅需700毫秒,其中负责判断指令的自研家居语义模型耗时不足200毫秒。相比传统方案,速度提升100%,稳定性提升30%。
现场演示中,我们能看到,在响应诸如开灯、拉窗帘、切换场景等指令时,SpaceMind一般仅需要1秒左右,用户等待的时间已经基本无感,体验十分丝滑。
针对更为复杂的任务,比如复杂语义理解、任务规划、Agent任务等,SpaceMind则提供了二级路由(推理通道),交给大模型深度推理。
从本质上来看,科大讯飞在SpaceMind中所做的,就是将“控制平面”与“推理平面”解耦。这套架构的价值在于,控制类指令不会因为引入大模型而变慢,而在需要大模型出马的复杂任务中,SpaceMind可以灵活切换,提供更为智能的体验。
在此基础上,SpaceMind还采用了双模型协同模式:云端部署的自研家居语义模型负责高频、简单的指令理解,成本低、延迟小;而推理大模型则专注于长期记忆、日程管理、冲突检测、主动提醒等复杂任务。两个模型各司其职,互不干扰。
除了架构创新,多模态感知能力对智慧空间同样至关重要。因为智慧空间需要实时理解“谁在哪里、在做什么、环境如何”,仅靠语音难以获取完整上下文。
SpaceMind架构已经支持通过毫米波雷达技术实现“无感感知”,把空间状态信息也作为输入,给Agent提供决策信息。
这项技术可以实现精确到5厘米的三维空间定位、呼吸级微动检测、识别人数、区分人与宠物、判断静止/移动/跌倒。更重要的是,毫米波雷达不依赖光线,在烟雾、黑暗、遮挡等环境下依然稳定,还从传感器源头解决了隐私问题——雷达无需采集影像,只会获取空间里的位置和状态。
在真实应用场景里,这套方案可以帮助企业在办公、酒店等场景实现大幅节能。以一家100个房间的酒店为例,每年可以省下约40万元的电费。
02.
复杂场景语音指令一步到位
真实记忆自学习重塑主动服务
如果说双路由架构、双模型架构解决了速度和智能的平衡问题,那么SpaceMind接下来的任务,就是把真正的Agent能力引入智慧空间。
科大讯飞海外产品部总经理卢尧认为,如今,用户对智慧空间的期待已经越来越高。智慧空间能否记住用户偏好、能不能主动提供服务、能不能理解复杂意图,都是用户关心的问题。
科大讯飞曾探索能否将OpenClaw框架引入智慧空间,但在研究后他们发现,该框架并不直接适用于智慧空间,但其核心设计理念值得参考。最终,科大讯飞打造的SpaceMind拥有了多智能体协作、长期记忆与主动智能的特性。
多智能体方面,科大讯飞为不同领域的任务打造了专家智能体,每个专家智能体都拥有处理其专精领域所需的知识和技能。
在记忆方面,SpaceMind能够记住用户偏好、家庭习惯、房间状态和长期使用历史,甚至区分说话人。这一系统还具备自学习能力,可以从日常行为中学习规律,让空间适应用户的真实生活习惯。
现场演示中,当不同用户说出同一句“我想休息一下”时,SpaceMind会根据说话人的个性化需求,自动切换到各自偏好的休息场景。用户也可以直接告诉SpaceMind记住特定设置,以后就可以便捷调用。
主动智能是SpaceMind区别于传统智慧空间系统的核心标志之一。传统系统只能被动等待指令,而SpaceMind可以在合适的时间主动提醒或执行。
发布会现场演示的这一功能就十分实用。当用户要求SpaceMind帮他订明天晚上7点的晚餐时,SpaceMind会发现与已有的网球课冲突,并主动提醒用户修改日程。
在SpaceMind这一智慧空间Agent架构中,我们看到了不少与OpenClaw在数字世界中相似的特性,比如能主动理解用户、记住偏好、个性化地执行任务等等。这些能力是OpenClaw在数字世界能斩获不少用户喜爱的关键,而SpaceMind要做的就是把这种体验带到智慧空间之中。
03.
两级Gateway打通生态
从开发者共创到全球规模化落地
架构再先进、智能再强大,如果无法连接真实世界的设备,SpaceMind终究无法发挥其全部能力。目前,智慧空间领域涉及的产品、厂商、协议种类繁多,从KNX、Zigbee到Matter,从照明、暖通到安防,不同品牌、不同标准之间的设备往往互不兼容。
用户不可能为了使用SpaceMind而淘汰项目、厂房或家中已有的全部设备,智慧空间厂商也不可能靠一己之力覆盖所有品类。
SpaceMind选择用开放生态来解决这一问题。具体来看,科大讯飞为SpaceMind设计了两级Gateway体系,打通了不同协议、不同品牌设备之间的壁垒。
在基础网关(Gateway Lite)中,SpaceMind支持接入KNX、Zigbee、Matter、Thread等主流控制协议。用户无需替换现有设备,就能使用SpaceMind的AI能力。
在包含基础网关能力的同时,SpaceMind的高级网关(Gateway Pro)新增了多媒体控制能力,同时还将支持Agent现场可编程、本地NAS存储等高阶用户需求,为未来更复杂的空间智能预留了扩展空间。
这意味着,无论企业和个人用户使用的是高端的私有化方案,还是开源生态,SpaceMind都能无缝接入。
科大讯飞还为这一生态推出了SpaceMind Marketplace,它可以被理解为智慧空间的“应用商店”。单一用户的开发能力、想象力终归是有限的,而通过SpaceMind Marketplace,用户可以获取由第三方专家与开发者提供的丰富能力,并在自己的真实空间调用。
为了加速生态繁荣,科大讯飞同期发布了SpaceMind AI Agent创新应用大赛,面向全球开发者、高校团队、创业团队和生态伙伴,鼓励围绕家庭智能管家、老人关怀、儿童陪伴、能源管理、安全守护、沉浸式家庭体验等方向,打造下一代AI Agent应用。这一机制有望进一步释放社区想象力,也让智慧空间里的Agent进一步深入细分场景。
在硬件层面,WallEX是科大讯飞面向海外市场的智慧空间解决方案品牌,承担着将SpaceMind能力落地的重要角色。目前,WallEX可提供智能控制面板、语音设备、传感器、照明、窗帘、暖通、安防等全系硬件,并打造 “终端+方案”的一体化产品。
今天,WallEX联合生态伙伴发布了KNX艺术面板(与世聪联名)和NOVA系列氛围灯,不仅支持WallEX,也支持与CSA、Matter、Alexa、Google Home等生态联动,实现“灯随人动”等智能体验。
从科大讯飞的整体布局来看,今天发布的SpaceMind负责理解、决策与规划,而WallEX负责连接设备与场景落地,两者共同构成完整的智慧空间Agent体系。
04.
结语:中国企业,率先交出智慧空间Agent答卷
如何将新一代AI能力与Agent能力引入家庭、酒店、办公场所,正成为智慧空间赛道的主战场。过去,全球智慧空间的竞争更多集中在连接协议、单品生态与入口之争;而未来,谁能真正把优秀的AI能力和Agent体验交付给用户,实现理解用户、主动服务,谁就有望掌握竞争的关键筹码。
正是在这一方向上,科大讯飞SpaceMind与WallEX的组合迈出了关键的第一步。它标志着中国企业已不再满足于只输出模型和产品,而是开始输出完整的智慧空间Agent系统能力。在全球AI竞争从模型层走向系统层、从虚拟世界走向物理世界的进程中,科大讯飞率先提交了一份来自中国的最新答卷。