四川具身科技新品发布,腾讯云全栈AI能力助力提升机器人情感交互能力
创始人
2025-12-31 19:31:54
0

12月31日,四川具身人形机器人科技有限公司首款情感交互人形机器人“爱湫”发布。 腾讯云依托腾讯天籁实验室的声学科技、腾讯实时音视频(TRTC)、自动语音识别(ASR)及混元大模型等全栈AI能力,助力四川具身科技突破了机器人交互中的“失声、失聪、失语”瓶颈,为人形机器人迈向“情感温度”博弈提供了坚实的技术底座。

天籁声学科技破解嘈杂环境交互,让“爱湫”听音知意

在开放场景中,环境噪声常使机器人语音识别准确率骤降,导致交互失效。腾讯天籁实验室为“爱湫”定制了智能语音系统,融合AI降噪、远场拾音、声纹识别及声音记忆算法,可智能消除超300种噪声干扰,实现全空间均匀收音。

这套系统不仅让“爱湫”在成都交子大道等人潮汹涌的复杂声场中“听得清”,更能通过声纹识别精准区分对话者,实现“闻声识人”的专属互动。

腾讯云西南区域解决方案总经理赵巍在分享中强调:“这种‘视听动’协同的高带宽交流,让机器的聆听从单向数据接收变为双向情感奔赴,真正实现了从‘听音’到‘知意’的质变。”

此外,结合ASR技术对中文、英语、日语等130种国际语言及23种方言的精准识别,以及TTS技术支持的53种接近真人音色的语音合成,“爱湫”能够无缝适应多语言场景,用软萌声线完成地道的四川话邀约,彻底抹平了人机交互的“恐怖谷”效应。

腾讯云TRTC AI实时对话技术底座,让爱湫更懂你

作为行业领先的RTC厂商,腾讯云TRTC为用户搭建了性能最优、延时最低的对接通道,整合ASR、LLM、TTS等能力并深度优化,将AI对话总延迟低至1000ms,媲美人类对话反应速度,并融入声纹识别、语义断句、背景音、情绪识别等创新能力,使对话效果更自然、拟真。

同时,方案具备多服务容灾能力,并依托腾讯云遍布全球的3200+加速节点以及智能编码、动态接入等自研技术,全面提升通话流畅性和稳定性。TRTC AI实时对话解决方案还支持RAG框架,可通过检索系统获取最近、权威的外部知识,确保回答基于事实,避免传统生成模型易产生“幻觉”的问题,显著提升生成内容的准确性、时效性和可追溯性。

除了强大的云产品力之外,云服务智能化也是“爱湫”诞生的重要技术支撑。腾讯云智能顾问·TRTC云助手通过场景方案、架构设计、交付保障与云端巡检等一站式服务,协助客户高效完成从方案设计到规模化上线的关键环节,显著降低了AI实时交互系统的工程复杂度和落地风险。

贴身技术支持与持续运营保障,助力四川具身科技将技术优势转化为稳定、可持续的业务价值,加速智能交互场景的规模化应用。

腾讯混元铸就“聪明大脑” 让爱湫更有情感

作为“爱湫”的核心认知引擎,腾讯混元大模型赋予了机器人深度的语义理解、多模态生成与逻辑推理能力。

在康养陪伴、文旅导览等场景中,腾讯混元大模型支持“爱湫”进行多阶段语义推理,避免答非所问或信息不实,确保应答的可靠性与一致性。此外,混元近期发布的3D 3.0版本及开源世界模型(WorldMirror),进一步强化了“爱湫”对物理环境的感知能力,为具身智能的“人文时刻”奠定基础。

面向具身智能在开发过程中技术链路复杂、开发周期长、创新门槛高等痛点,腾讯云通过智能体开发平台(ADP)为四川具身科技提供了高效开发框架,基于RAG知识引擎、workflow工作流、multi agent等框架,可以灵活创建机器人问答、动作执行等智能体应用,显著降低软硬件结合、子系统耦合的技术门槛,多种复杂任务应对自如。

未来,腾讯云将持续发挥技术能力,携手更多伙伴,推动具身智能在情感交互领域的规模化落地。

相关内容

热门资讯

长征五号B遥一运载火箭顺利通过... 2020年1月19日,长征五号B遥一运载火箭顺利通过了航天科技集团有限公司在北京组织的出厂评审。目前...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
湖北省黄冈市人大常委会原党组成... 据湖北省纪委监委消息:经湖北省纪委监委审查调查,黄冈市人大常委会原党组成员、副主任吴美景丧失理想信念...
《大江大河2》剧组暂停拍摄工作... 搜狐娱乐讯 今天下午,《大江大河2》剧组发布公告,称当前防控疫情是重中之重的任务,为了避免剧组工作人...