OpenAl发布Agent工具包,网友:谢谢Manus AI
创始人
2025-03-12 08:22:27
0

OpenAI 近期发布了 Agent 工具包,这一举措引发了广泛关注。该工具包为开发者提供了更强大的能力,有助于构建更智能的应用程序。网友们纷纷表示感谢,其中提到“谢谢 Manus AI”。这或许是对 OpenAI 研发成果的一种认可,也反映出大家对人工智能技术发展的期待。OpenAI 的这一行动将推动人工智能领域的进一步创新,为人们的生活和工作带来更多便利与可能。


就在刚刚,OpenAI发布了一系列专为构建AI Agents设计的新工具和API,帮助开发者更容易创建能自动完成任务的AI Agents(智能体)。


OpenAI认为,虽然过去一年推出的高级推理、多模态交互等模型能力为Agent奠定了基础,但开发者在构建生产级Agent时,还是会遇到不少难题。


为此,他们今天特地发布了全新的Responses API、三种内置工具以及一个开源的Agents SDK。



省流版如下:


  • Responses API:结合Chat Completions API简洁性与Assistants API工具使用能力的新型API接口;


  • Web搜索工具(Web Search Tool)让模型访问互联网获取最新信息的工具;


  • 文件搜索工具(File Search Tool)从大量文档中检索相关信息的增强工具;


  • 计算机使用工具(Computer Use Tool)由Computer-Using Agent(CUA)模型提供支持的计算机操作自动化工具,让AI能像人一样操作电脑界面;


  • Agents SDK:基于Swarm框架升级,简化多Agent工作流程编排的开源框架。


具体来说,Responses API结合了Chat Completions API(主要用来生成对话回复)的简洁性和Assistants API(能让AI调用外部功能,比如查资料、操作东西)的工具使用能力,成为构建Agent应用的新基础。


开发者只需调用一次API,即可利用多种工具和多轮模型交互解决复杂任务。



在内置工具方面,Web搜索工具支持GPT-4o和GPT-4o-mini模型获取网络最新信息并提供清晰的引用。在SimpleQA基准测试中,这两款模型的搜索预览版分别拿下了90%和88%的亮眼准确率。



升级后的文件搜索工具更是给力,支持多种文件格式,还能优化查询、过滤元数据、自定义排序,让开发者从堆积如山的文档中迅速找到关键信息。


计算机使用工具则由与Operator相同的Computer-Using Agent(CUA)模型提供支持,可捕获模型生成的鼠标和键盘操作,在OSWorld、WebArena和WebVoyager基准测试中分别取得38.1%、58.1%和87%的成绩。



OpenAI还推出了开源的Agents SDK,专门用来简化多Agent工作流程的编排。


相比去年发布的实验性Swarm框架,这个全新SDK有了显著的改进。


提供易于配置的LLM与内置工具集成、Agent间智能交接控制、可配置安全检查以及可视化追踪等功能,适用于客户支持自动化、多步研究、内容生成等多种应用场景。


一些早期测试用户已经使用这些新工具做出了实打实的成果。


在官网列举的案例中,Hebbia利用Web搜索工具帮助资产管理者和法律从业者从海量数据中提取可行见解;Navan将文件搜索工具应用于AI旅行Agent中,为用户提供精准的旅行政策答案。


Unify和Luminai则使用计算机使用工具自动化复杂操作流程,特别是对缺乏API的传统系统;Box利用Agents SDK快速构建和部署了企业数据搜索应用。



产品发布后,网友也在OpenAI的评论区玩起了梗。



还有网友专门留言感谢Manus AI。



在今天凌晨的现场直播中,演示人员也通过一个“个人造型师”Agent的应用案例,向我们展示了这些新工具的能耐。


举个例子,他们先用文件搜索工具翻看了用户(比如“Elon”和“Kevin”)的服装喜好数据,系统轻松整理出这些人的穿衣风格。


接着结合Web搜索工具,系统能够基于用户所在位置(演示中使用“东京”作为Kevin的位置)搜索附近的相关商店,为Kevin推荐了东京的Patagonia店铺。



然后,计算机使用工具(Computer Use Tool)登场,自动操作网页界面,为Kevin买下一件黑色Patagonia夹克,整个过程行云流水——点击、拖拽、填信息,宛如真人在操控。


最后还演示了Agent间的交接功能。Agent将退货请求无缝交接给客服Agent,后者能够调用获取密码和提交退款请求等功能,帮助用户完成Patagonia夹克的退货。


可以说,凭借新工具和API的默契配合,这些AI Agent不仅能读懂用户喜好、获取实时资讯、执行复杂操作,还能在不同任务间灵活切换,完美覆盖从推荐到购买再到退货的全流程。



至于现有API的安排,OpenAI表示会继续全力支持Chat Completions API,为不需要内置工具的开发者提供新模型和功能。


而基于Assistants API测试版的反馈,他们已经把关键改进整合到Responses API中,计划在功能对齐后,于2026年中期正式停用Assistants API,同时会提供详细的迁移指南。


新工具的定价也已经新鲜出炉。


Web搜索每千次查询分别为GPT-4o搜索30美元和GPT-4o-mini搜索25美元;文件搜索每千次查询2.5美元,文件存储0.1美元/GB/天(首GB免费);计算机使用工具则按每输入百万token/3美元和每输出百万token/12美元计费。


OpenAI表示,随着模型能力变得更加具有Agent属性,他们会继续深化API间的整合,并提供新工具帮助部署、评估和优化生产环境中的Agent。


英伟达CEO黄仁勋曾指出,未来每个公司的IT部门将转变为AI Agent的“HR部门”。


从管人到管AI,Agent将很快成为劳动力的重要组成部分,提高各行业的生产力,此次发布的工具集将是帮助开发者和企业构建、部署和扩展可靠高效AI Agent的重要一步。


此前,开发者需要自行组合不同API和编写复杂的协调逻辑来构建AI Agent,有了新工具,能够极大地简化了这一过程。


Responses API将多种功能整合成一个简单接口,而内置工具为AI提供了“感知”和“行动”的能力,Agents SDK则提供了协调多Agent的标准框架。


通过降低技术门槛,更多企业能够快速构建和部署AI Agent。


这或许也是OpenAI所说的“Agnet元年”的真正含义——让AI不再局限于聊天框,而是能融入现实工作流程,成为你的“数字助理”甚至“数字同事”。


附上AMA问答:


Q:哪种操作系统最适合computer use:Linux、Mac还是Windows?是图形界面(UI)、终端(terminal),还是其他方式更好?哪些应用程序在计算机上表现最佳,还是说这并不重要?


A:CUA模型主要是针对网页任务进行训练的,但早期用户发现它在桌面应用程序上的表现也出乎意料地好。不过现在还处于早期阶段,我们还有很多可以改进的地方!


Q:你们会提供TypeScript SDK吗?


A:很快会推出。


Q:我们未来会在API中看到o1 pro吗?


A:计划很快在responses API中发布。


Q:我们需要自行管理Docker环境来使用计算机功能吗?


A:可自行管理Docker环境,也可以使用云服务。


Q:何时会有Operator在API中可用?


A:从今天开始,你可以在API中使用与Operator相同的功能!我们已经在新的Responses API中部署了驱动Operator的CUA模型。


Q:你们会考虑提供集成的虚拟机(VM)来支持“computer use”,或者与合作伙伴合作,以减少搭建环境的需求吗?


A:目前还没有这样的计划,但可以查看CUA示例应用,其中包含一些示例环境,用于远程托管。


Q:在整个agent-handoff流程中,如何确保个人隐私?有没有什么方法可以增强用户与Agent交互时的隐私保护?


A:有多种隐私保护机制。Agents SDK支持开发者定义的安全措施(guardrails),用于输入/输出验证,还可以使用input_filter来限制在交接过程中传递的消息上下文。


本文来自微信公众号:APPSO (ID:appsolution),作者:APPSO

相关内容

热门资讯

我在飞机上被“赶” 在那次飞行中,原本平静的旅程突然发生了变故。当飞机即将降落时,我正沉浸在即将抵达目的地的喜悦中,却突...
美英达成贸易协议,美股集体收涨 5月8日,美国总统特朗普在华盛顿白宫出席活动。美国总统特朗普8日在白宫宣布,美国与英国达成一项新的贸...
泽连斯基称已准备好30天停火,... 当地时间5月8日,乌克兰总统泽连斯基在社交媒体上透露,他与美国总统特朗普进行了一次电话交谈。双方对乌...
总体业绩显韧性、技术创新势头强... 目前,沪深5100余家上市公司披露了2024年年报和2025年一季报。总体看,去年以来,一系列稳增长...
《人民日报》点赞山东烟台大学生... 齐鲁网·闪电新闻5月9日讯 今天出版的《人民日报》第10版以《山东烟台大学生返乡当新农人,同时打十几...
美英协议还值得欢呼?反正市场先... 如果之前还有任何怀疑,现在应该已经很清楚了:对于关税究竟将如何影响全球经济,各国央行其实和普通人一样...
默茨惊险过关,打造“经理人内阁... 请你提供具体的相关内容呀,没有具体信息我没法准确进行描述呢。比如默茨的相关背景、“经理人内阁”的具体...
华为的鸿蒙PC来了,它用起来到... 华为的鸿蒙 PC 来了,宛如一场科技盛宴的开启。它的使用体验令人惊艳。从开机那一刻起,那流畅的界面过...
东方“纳斯达克”的契机来了 在时代的浪潮中,东方“纳斯达克”的契机已然悄然降临。如今,全球经济格局正在发生深刻变革,东方市场凭借...
论吹牛的能力,对贾跃亭不服不行 贾跃亭曾以其“吹牛”能力让人印象深刻。他在商业领域不断描绘宏大的蓝图,仿佛手中握着无尽的财富和无限的...
“亏”上热搜,文旅重镇谁赚了? “亏”上热搜,文旅重镇谁赚了?这一话题引发广泛关注。众多文旅重镇曾以辉煌的历史和独特的文化吸引游客,...
知识产权质押融资为人工智能企业... 近日,太仓工行辖内的港区支行通过知识产权质押融资,成功向一家专注于工业机器人智能传感器研发的科创企业...
广交会3%增长的背后:全球客商... 面对复杂严峻的国际环境,我国各行各业展现出强大韧性,7日公布的一组经济数据,展现出中国经济的强劲动力...
调梦师GMN入驻北京全家便利店... 近年来,国民睡眠健康状况持续恶化,睡眠市场迎来需求高峰。据《中国睡眠健康研究报告》显示,2024年中...
彪马公布2025财年第一季度财... 封面新闻记者 付文超 5月8日,彪马公布2025财年第一季度财报。财报显示,经货币调整后本季度彪马全...
拼多多遇上一道坎儿 拼多多一直以来以低价策略和便捷购物模式深受消费者喜爱,但如今也遇上了一道坎儿。随着市场竞争的加剧,各...
10件让生活更开心的小事 以下是 10 件让生活更开心的小事:清晨,拉开窗帘,让第一缕阳光洒在脸上;午后,泡一杯热茶,静静品味...
“非洲心脏”为何成功逆袭? 请你提供具体的“非洲心脏”相关内容呀,没有具体信息我没法准确进行描述和分析其成功逆袭的原因呢。 我过...
3天600万打赏,70亿市场的... 在如今的数字娱乐领域,有这样一个奇特现象。短短 3 天就能获得 600 万的打赏,背后的语音厅仿佛隐...