断网都没用,机器人终于“摆脱”人类控制,Google 首发离线AI 大脑,一句话让它干活
创始人
2025-06-25 12:04:49
0

在科技领域,一场革命性的突破正在悄然发生。断网都无法阻挡其前进的步伐,谷歌率先推出了离线 AI 大脑。这意味着机器人终于成功“摆脱”了人类的控制束缚,获得了前所未有的自主性。只需一句简单的指令,它便能迅速投入工作,高效地完成各种任务。这种离线 AI 大脑的出现,将为各个领域带来全新的变革,让机器人在没有网络连接的情况下也能发挥出强大的智能,开启了人工智能发展的新纪元,为人类的生活和工作带来更多的可能性。


本文来自微信公众号:APPSO (ID:appsolution),作者:发现明日产品的,原文标题:《断网都没用,机器人终于「摆脱」人类控制!Google 首发离线 AI 大脑,一句话让它干活》


在影视作品里,我们看过太多机器人失控的场面。一些应对方案的段子也早已烂熟于心:断网、拔电、重启三连,一键送它回炉重造。


但现在,这一套流程可能不太管用了。


今天,Google DeepMind推出了一款全新机器人控制模型——Gemini Robotics On-Device。这款大模型能在机器人本地运行,集视觉识别、语言理解和动作执行于一体。


而它最大亮点在于,即使完全离线,它也能理解人类指令,流畅完成任务。


比起诸如ChatGPT、Gemini等擅长聊天、写作、答题的大模型,Gemini Robotics On-Device则给机器人装上了一个真正的「大脑」,让其也能具备类似的理解力和执行力。


它本质上是一个专为双臂机器人打造的VLA基础模型,顾名思义,Vision(视觉)+Language(语言)+Action(动作),三者结合,看得见、听得懂、动得了,是它的基本素养。


举例而言,你可以对机器人发出请求,比如拉开背包的拉链。过去这需要提前编写程序、分解动作,现在Gemini On-Device可以直接理解这句话的意思,然后一步一步执行下来。


那既然联网也能跑,为什么还要费劲折腾本地运行?答案不外乎速度和稳定性。


机器人若需将数据传至云端、等待服务器分析再返回结果,必然产生延迟。在医疗操作、灾难救援、工厂自动化等任务中,延迟容错空间几乎为零。何况,现实中许多地方网络条件差,甚至完全无网。


实际上,让机器人顺利应对复杂、动态的现实任务,一直是AI领域最难啃的骨头之一。


从公开视频看,Gemini On-Device已能胜任多种常见场景,如叠衣、拉链、抓取陌生物体并放置到指定位置。而这一切得益于它的学习机制。



强大的泛化能力


它不需要从零开始进行长时间训练,开发者仅需提供50至100次人工演示,如亲自操控机器人叠衣,模型便能迅速学会并独立操作。


在更具挑战性的分布式任务或复杂的多步骤指令执行中,Gemini Robotics On-Device的表现依然优于目前其他本地运行的替代方案。



而且,它的适配性也很强。


虽然Gemini Robotics On-Device最初在Google自研的ALOHA双臂机器人平台上进行训练的,但稍加适配,它也能稳定运行于Franka FR3工业机械臂。


甚至结构迥异的人形机器人Apollo也能丝滑运行,同一个通用模型通过少量学习,就习惯了完全不同的身体形态。


理想情况下,开发者无需为每种新机器人重新训练一个AI,只需训练一次通用模型,之后通过轻量级的迁移学习即可部署到各式各样的机器人平台上。这种「一模多用」的能力将有望加速机器人技术的普及和应用。


当然,理想归理想,它也还有短板。


随着机器人智能与自主性提升,安全要求也随之提高。Gemini On-Device虽然能执行动作,但它并不能合理判断你给的任务是否安全,因此,必须为模型加装「安全栓」。


DeepMind给出的建议是,开发者可以给模型接入Google Gemini Live API接口,让系统先判断这个指令合不合理,再决定是否执行;同时在动作层面设置物理限制,如力度、角度、速度,以防意外。


此外,模型多步骤逻辑规划能力仍有提升空间。


像做三明治、整理桌面这这类需要先后逻辑、顺序安排的操作,目前还不在它的舒适区。这和它所基于的Gemini 2.0架构有关,未来随着升级到2.5,这部分能力可能也会补齐。


另一个现实挑战,是数据的质量。


虽然它只需几十次演示就能上手,但最理想的示范,是由真人实际操控机器人时采集的真实数据,而不是虚拟模拟。这类数据训练出来的效果,更快、更准,也更稳定。


技术报告地址:https://arxiv.org/pdf/2503.20020


据项目负责人Carolina Parada介绍,这是Google首次发布完全脱离云端运行的机器人AI模型,也是首个供开发者根据自身需求进行微调的版本。


目前,DeepMind向「可信测试者」开放了Gemini Robotics On-Device的SDK和模型访问权限。如果你是做机器人开发、工业自动化,或智能系统研究的开发者,现在就可以申请试用。


附上申请链接:


https://docs.google.com/forms/d/1sM5GqcVMWv-KmKY3TOMpVtQ-lDFeAftQ-d9xQn92jCE/edit?ts=67cef986


欢迎加入APPSO AI社群,一起畅聊AI产品,获取#AI有用功,解锁更多AI新知


我们正在招募伙伴


简历投递邮箱hr@ifanr.com


✉️邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)

相关内容

热门资讯

上海机场,打响一场顶级商战 上海机场,宛如一座繁忙的商业舞台,正悄然打响一场顶级商战。这里汇聚着全球的人流、物流与信息流,每一个...
伊朗处决3名受雇于以色列的间谍 据伊朗塔斯尼姆通讯社25日报道,经过相关法律程序,伊朗当天上午处决了3名为以色列情报和特勤局(摩萨德...
海南省委常委、秘书长倪强被查 海南省委常委、秘书长倪强涉嫌严重违纪违法,目前正接受中央纪委国家监委纪律审查和监察调查。
小心被骗子盯上!公安部公布高发... 公安部公布高发电诈类型 Top10,需小心被骗子盯上!这些类型涵盖了生活的各个方面,如网络购物诈骗,...
大圆柱电池:在国内沉默,在海外... 大圆柱电池,犹如一颗隐藏在国内的“沉默巨星”。在国内市场,它或许暂时处于低调状态,默默耕耘,积蓄着力...
万亿资金腾挪的背后,泛红利ET... 不知道大家是否还记得2019年基金行业万人空巷的场景?如今在经历了“阵痛期”之后,基金行业似乎又迎来...
董明珠看不上的小米,如今正在家... 6月19日,雷军在微博上主动提到了小米大家电业务的发展目标。他罕见地表态:“美的、海尔都是非常优秀的...
广大特材:预计上半年净利润同比... 6月24日盘后,广大特材公告称,经财务部门初步测算,公司预计2025年上半年实现营业收入25亿元左右...
原创 美... 随着昨日美国宣布以色列和伊朗停火,市场风险偏好也跟随回升。美股三大指数隔夜均收高逾1%,其中纳指盘中...
小米YU7标准版价格比SU7标... 6月25日,小米集团创始人、董事长兼CEO雷军通过微博再度回应有关小米YU7的定价等问题。 问题1:...
郑棉、美糖、苹果期货:多因素影... 【棉花&棉纱、白糖、苹果期货市场动态】今日,郑棉大幅下跌,突破前期窄幅震荡区间,不过基本面暂无新变化...
智元机器人等在东莞成立机器人科... 天眼查App显示,近日,东莞领智创新机器人科技有限公司成立,法定代表人为汤尔英,注册资本2000万人...
从技术狂欢到盈利拷问,中国AI... 在技术狂欢的浪潮中,中国 AI2.0 看似蓬勃发展。各类先进算法与模型不断涌现,研发投入持续增加,仿...
家中常备这3种药,关键时刻可救... 家中常备退烧药、止咳药和创可贴这 3 种药,关键时刻能救命。退烧药如布洛芬,能有效降低高烧,缓解因发...
四川宜宾市珙县发生4.5级地震... 近日,四川宜宾市珙县遭遇了一场 4.5 级的地震,震源深度达 10 千米。此次地震虽未造成严重的人员...
中国最容易转行的大学专业,谁读... 在众多大学专业中,有一种专业常被认为是最容易转行且读了容易后悔的,那就是工商管理。这个专业看似涵盖广...
蔡文胜,拟4600万收购香港上... 来源:瑞恩资本RyanbenCapital 香港上市公司中国金融租赁(02312.HK)公布,林树...
原创 啥... 文丨詹詹 编辑丨杜海 来源丨新商悟 (本文约为1300字) 6月23日,胖东来创始人于东来在直播...
英国号称要投入8亿美元调查“中... 6月25日,外交部发言人郭嘉昆主持例行记者会。法新社记者提问,有报道称,英国政府发现,近年来中国在英...
福州继续发布高温橙色预警信号!... 福州持续遭遇高温炙烤,今日又继续发布了高温橙色预警信号,这意味着炎热的天气将继续笼罩这座城市,人们需...