阶跃星辰CEO姜大昕:强化学习不是AI的尽头,下一步是自主学习,Agent将成超级应用
创始人
2025-02-21 17:35:56
0

出品 | 搜狐科技

作者 | 梁昌均

“十年前,大家谈起通用人工智能(AGI),觉得这是一个遥不可及的梦想。但随着大模型的飞速进步,今天越来越多的人开始相信AGI在未来的几年就会成为现实。”2月21日下午,阶跃星辰创始人&CEO姜大昕在生态开放日上演讲时提到。

阶跃星辰是一家成立于2023年的大模型公司,由微软前全球副总裁、微软亚洲互联网工程研究院副院长姜大昕创办,此前获得上海国资、腾讯、五源资本、启明创投等投资,并位列六小龙之列。

姜大昕表示,阶跃在成立之初,就规划了实现AGI的路线图,包括模拟世界、探索世界和归纳世界三个阶段。

在模拟世界阶段,训练模型的主要范式是模仿学习,学习的主要目标是各种模态的表征,下一步是培养模型能够解决复杂问题的能力。人脑对复杂问题的解决是启动系统2的模式,通过问题拆解不断探索。

“如何让模型也能够学会这种探索的过程,学会慢思考,采用的方法就是强化学习。AlphaGo以及最近非常火热的DeepSeek,采用的就是强化学习的训练方法。”姜大昕提到。

不过,姜大昕认为,强化学习还不是AI的尽头,AI的下一个尽头是机器能够通过自主学习,主动发现物理规律。

对于最近爆火的DeepSeek,姜大昕认为,它开源了模型,为整个AI社区做出了了不起的贡献。“受到DeepSeek的感召,我们在近期发布了两款开源的多模态大模型。”

他提到的这两款模型是300亿参数的文生视频模型,以及1300亿参数的语音模型Step Audio。“我们希望通过这两款多模态大模型的的开源,助力开发者创建出更丰富多彩的应用出来。”

姜大昕还透露,阶跃正在研发推理模型Open-Reasoner-Zero,其方案相比DeepSeek-R1- Zero,效率可以达到25倍,并表示会开源实验结果、代码数据以及论文。

同时,阶跃还在研发视觉推理模型。姜大昕认为,视觉和文本一样,遇到复杂的问题,还是需要慢思考和思维链的能力,如何把强学习的方法能够引入视觉领域,实现慢思考,这是前沿的问题。

对于大模型的应用发展,姜大昕认为,随着Agent逐渐升温,已经成为海内外公认的AI超级应用。

他表示,Agent最重要的特点是能够自主帮助人类完成复杂的任务。所谓自主有两层含义,一个是自动,在执行任务的时候尽可能自动完成,减少或者无需人类的干预;一个是主动,Agent能够观察用户所处周围的环境,主动发起或者完成任务,而不是仅仅被动接受任务。

“为什么Agent会在眼下这个时间点突然变得火热,以至于很多人认为2025年将是Agent元年,我想这是因为Agent的爆发需要两个必要条件,一个是多模态的能力,一个是慢思考的能力,这两个能力在2024年的时候都实现了。”姜大昕说。

他进一步解释到,多模态的能力能够使Agent充分的理解和感知世界,更好的理解用户任务。除了多模态的能力,想要让任务的完成率或效率更高,还需要强大的推理,也就是慢思考的能力。

“现在机器的思考的能力还是比较弱,它只能思考几十秒钟,最多达到几分钟。”姜大昕认为,随着模型能力不断增强,机器思考的时间会变得越来越长,这意味着距离AGI的目标会越来越近。

同时,他认为未来会出现不同形态的Agent,未来每一台终端设备都会有一个Agent,它具备的能力会从简单任务、组合任务、复杂任务,升级到主动发起任务和最后的情感陪伴。

相关内容

热门资讯

南方多地强降雨持续 华北黄淮等... 今明两天(6月9日至10日),南方多地仍有强降雨,东北、华北等地雷雨频繁,需警惕强对流天气,恰逢高考...
一季度跨省异地就医直接结算惠及... 记者从国家医保局获悉:2025年一季度,全国跨省异地就医直接结算运行基本平稳,惠及参保群众7075....
国家统计局:5月份居民消费价格... 2025年5月份,全国居民消费价格同比下降0.1%。其中,城市持平,农村下降0.4%;食品价格下降0...
全国首批试点城市,厦门入选! 全国首批试点城市,厦门成功入选!这一喜讯无疑为厦门的发展注入了新的活力与机遇。厦门凭借其独特的地理位...
出海中东,如何适应当地市场? 出海中东,要适应当地市场需多方面努力。首先,深入了解中东文化,包括宗教信仰、风俗习惯等,避免因文化差...
投资要眼里有光心中有数——访景... 在过去几年的震荡调整行情中,科技成长股遭遇深度调整,不少成长风格的基金经理,遭遇了所管基金净值下跌和...
价格狂飙,近期涨幅超过黄金! 金价高位震荡,白银狂飙。 近日,贵金属市场上演了一场令人瞩目的行情。 现货白银价格大幅飙升,一度涨幅...
江阴市恒润重工股份有限公司股东... 本公司董事会、全体董事及相关股东保证本公告内容不存在任何虚假记载、误导性陈述或者重大遗漏,并对其内容...
投资3.5亿的博物馆闲置两年当... 据央视新闻报道,6月8日晚,江西南昌小蓝经济技术开发区管理委员会发布公告称: 2025年6月7日晚,...
Coze/Dify/FastG... 在选择 Agent 平台时,Coze、Dify、FastGPT 和 N8N 各有特点。Coze 可能...
福建便利店领全国风骚,老生意如... 福建便利店在全国可谓独领风骚,传统的小生意正以令人惊叹的方式玩出新花样。在福建,便利店不再仅仅是售卖...
开考前25分钟,考生发现身份证... 开考前 25 分钟,一位考生焦急地发现自己的身份证不见了。时间紧迫,他心急如焚。就在这关键时刻,民警...
万斯:希望马斯克重归特朗普阵营 万斯希望马斯克重归特朗普阵营,这背后或许蕴含着复杂的政治考量。马斯克作为科技界的巨头,其态度和行动往...
美国IT业裁员狂飙35%,“硅... 近期,美国 IT 业裁员现象如狂飙般肆虐,裁员比例竟高达 35%。曾经被誉为“硅谷梦”的辉煌之地,如...
闽台“山盟海誓”结婚登记集体颁... 近日,闽台“山盟海誓”结婚登记集体颁证活动隆重举行。活动现场布置得温馨而浪漫,鲜花簇拥,彩带飘扬。来...
福州:智改数转加速产业“换芯” 福州正以智改数转的强劲动力,加速产业“换芯”。在这座充满活力的城市,先进的数字技术与传统产业深度融合...
残疾人车队“1+1”助考生顺利... 在高考的关键时刻,一支特别的“1 1”残疾人车队悄然行动。车队由两位残疾车手组成,他们虽身有残疾,但...
海天之间,书写生态答卷 海天之间,那是大自然最广阔的舞台。在这里,生态答卷正徐徐展开。湛蓝的天空如巨大的幕布,洁白的云朵似灵...
2025乒超明日开赛,樊振东王... 2025赛季中国乒乓球俱乐部超级联赛将于6月9日揭开战幕,王楚钦、梁靖昆等所在的山东魏桥·向尚运动队...
四预警齐发 山东北部等地有10... 中央气象台6月9日06时发布强对流天气蓝色预警、高温黄色预警、大雾黄色预警、暴雨蓝色预警。强对流天气...