刚刚,OpenAI最强编程智能体上线ChatGPT,AI的“终极外挂”来了
创始人
2025-05-17 03:40:52
0

刚刚,一个震撼的消息传来!OpenAI 最强编程智能体正式上线了 ChatGPT。这无疑是 AI 领域的一大里程碑,仿佛为 AI 戴上了“终极外挂”。ChatGPT 展现出了令人惊叹的编程能力,能够快速理解各种编程需求,生成高效、准确的代码。它就像是一位编程大师,在代码的世界里游刃有余。无论是复杂的算法还是简单的脚本,它都能迅速给出解决方案。这将极大地改变编程的方式,让开发者们能够更加高效地工作,推动着整个编程领域迈向新的高度。


本文来自微信公众号:APPSO (ID:appsolution),作者:发现明日产品的,原文标题:《刚刚,OpenAI最强编程智能体上线ChatGPT!AI的「终极外挂」来了》


Altman昨天早上还在X上卖关子,说有个研究预览版本快上线,要给它起个「如果它成了会很好记」的名字。


就在刚刚,OpenAI正式发布Codex。


这是一款基于云端运行的软件工程智能Agent,能够并行处理多个开发任务,协助开发者高效完成编程工作。


UI设计没整花活,Codex提供一个输入框和两个按钮——「Ask」(提问)和「Code」(编码)。你只需明确描述任务,它就会开始执行。


兴奋的Altman在X平台连发数条推文表示:


像这样的工具,让一个人能开发出的软件数量,实在令人惊叹又令人兴奋。「你其实可以直接去做」是我最喜欢的梗之一;我原本没想到,它会这么快以如此重要的方式应用到AI本身以及它的使用者身上。


Codex能胜任的工作不仅仅是编写功能代码,还包括理解代码结构、回答关于代码库的问题、修复bug,甚至直接提交可审查的拉取请求(Pull Request)。


每个任务都在云端独立的沙箱环境中执行,自动加载用户的代码仓库。运行时长从1分钟到30分钟不等,取决于任务复杂度,同时用户可以实时查看任务进度。


任务完成后,Codex会输出一整套可追溯的执行结果,包括终端日志、测试记录等验证信息。你可以对修改结果进行审查、提出建议,甚至直接在GitHub上发起PR,或者合并进本地项目。


借助项目中的AGENTS.md文件,用户还可自定义Codex的行为,让它更贴合具体项目的开发规范与测试标准。


Codex的核心模型为codex-1,这是OpenAI o3系列里专为软件工程微调过的版本。


基准测试结果显示,codex-1在SWE-Bench的得分为72.1%,纸面参数优于Claude 3.7以及o3-high。



训练方式也很「实战」,通过在真实开发环境中进行强化学习训练,Codex能够生成更符合人类编码风格和审查偏好的代码,严格按照指令执行,并不断运行测试,直到测试通过为止。


从今天开始,Codex将向ChatGPT Pro、Enterprise和Team用户开放,而Plus和Edu用户的支持也将很快上线。


安全性方面,Codex做得也够克制。执行任务时,它只会访问你提供的代码库和预设依赖,不能联网、不能访问外部API,遇到不确定问题会停下来提示你处理。


并且,Codex经过专门训练,能够识别并拒绝与恶意开发相关的请求,避免被滥用于开发恶意软件。


目前,OpenAI已在内部广泛使用Codex,协助工程师完成重构、命名规范、编写测试等重复性任务,显著提升开发效率。一些外部合作团队也给出了积极反馈,比如Cisco与Temporal借助Codex加快了开发与调试节奏。


在深夜直播中,OpenAI的员工展示了Codex更具实用性的能力:


它能够理解整个代码库的结构,自动定位并修复bug,处理超时设置或拼写错误等常见问题。即使是在命令行报错时,Codex也能分析出错原因,自动生成修复脚本和相应的测试用例。


此外,它还具备代码审查功能,能梳理所有改动点,并指出可能导致测试失败的风险。换句话说,Codex正在逐步进化为一个真正可用的编程协作助手。


OpenAI员工也分享了他们用Codex管理大型代码变更的经验,即使这些变更代码从未跑过本地环境,也能顺利合并、通过测试。


知名科技作者Dan Shipper提前体验了Codex,并用一篇博客分享了他的使用感受。


在他看来,通过Codex,用户可以像管理团队一样分配任务,而不需要编写代码。Codex特别适合资深开发者,在执行任务时能够产生简洁高效的代码变更,并自动生成pull request提交到GitHub。


然而,Codex也有一些局限性,比如对于新手工程师不太友好,不擅长处理后续的修改与补充任务,并且尚未完全整合到主流开发平台如GitHub和Slack。


它的设计主要面向专业开发者,而不是那些喜欢边聊边编程的用户。Codex的核心优势在于提高高级开发者的工作效率,使他们能够同时管理多个任务,从而加速开发进程。


如果你是技术主管、需要在已有项目中添加功能或修复bug,那么Codex是你会常用的工具;但如果你是在从零开始搞一个「一人十亿级美元SaaS」,可能就用不上它。


简单来说,如果你一个人做了一个网站或工具,用户通过订阅使用,每月收入达到几百万,年收入破千万甚至过亿,那么你就是在做「一人十亿级美元SaaS」。


除了云端主力模型之外,OpenAI还同步推出了专为命令行优化的轻量模型codex-mini-latest,支持开发者在本地环境快速接入AI。


Codex CLI登录流程简洁,可直接使用ChatGPT账号接入,并享受基础的免费API配额。目前已向全球范围内的Pro、Enterprise和Team用户开放,未来几周内还将陆续支持Plus与Edu用户。


对于接入codex-mini-latest的开发者,该模型可通过Responses API调用,价格为每百万输入tokens花费1.5美元、每百万输出tokens花费6美元,支持高达75%的提示缓存折扣,进一步降低调用成本。


OpenAI对Codex的长线愿景很明确:


它不仅是一个写代码的工具,更是未来协作模式的雏形。多代理、异步执行、自动汇报进度,这一套逻辑未来可能内嵌进IDE、Git工具、甚至Slack里,成为开发者真正的「副驾驶」。


目前Codex仍处于研究预览阶段,图像输入等高级功能尚未开放。


但过去那些对AI编程助手的畅想,比如自动写代码、提PR、修bug,终于在Codex身上以可用工具的形式落地,成为真正能上手、能跑进实际工作流的产品。


我们正在招募伙伴


简历投递邮箱hr@ifanr.com


✉️邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)

相关内容

热门资讯

德国总统解散现任政府 近日,德国总统依据宪法规定,做出了一项重大决策——解散现任政府。这一举措引发了广泛关注与热议。德国政...
外交部:中方将采取必要措施,坚... 外交部郑重宣布,中方将采取必要措施,坚定维护中国企业的合法权益。在国际经济舞台上,中国企业面临着诸多...
张一鸣超钟睒睒马化腾成中国首富 近日,张一鸣以惊人的速度超越了钟睒睒和马化腾,荣登中国首富之位。张一鸣凭借其在互联网领域的卓越创新与...
躺进高科技“人体能量舱”,就能... 躺进高科技“人体能量舱”,仿佛开启了一场神奇的疗愈之旅。在这特殊的舱内,无数先进科技交织运作。它声称...
2024年度“中国科学十大进展... 2024 年度“中国科学十大进展”正式发布,这是我国科学界的年度盛事。这些进展涵盖多个前沿领域,如基...
速查!手机上有这些App,赶紧... 如今,手机上某些 App 暗藏隐患,务必赶紧卸载!比如某些恶意广告弹窗频繁的 App,它们会在后台偷...
成都5岁女童在小区遭轿车辗轧身... 近日,成都一 5 岁女童在小区遭轿车辗轧身亡事件有了新进展。家属在悲痛之中,以极大的包容与理解,出具...
穆迪下调美国主权信用评级 国际信用评级机构穆迪16日宣布,由于美国政府债务和利率支付比例增加,该机构决定将美国主权信用评级从A...
杭州上学的内蒙女孩一篇作文火了 在杭州上学的内蒙女孩一篇作文悄然火了。她用细腻的笔触描绘着杭城的繁华与江南的温婉,仿佛将那座城市的每...
违法犯罪经历岂能作流量密码 “如果你们还想听我讲在‘里面’的故事,还有我当‘酒托’的经历,记得进粉丝群,给我卡个灯牌……”近日,...
美国将对所有进口汽车征收25%... 美国宣布对所有进口汽车征收 25%关税,这一举措引发广泛关注。外交部迅速作出回应,强调美方此举是贸易...
预警、降级、劝退!多所高校发布... 近期,多所高校纷纷发布通知,引发广泛关注。这些通知主要涉及预警、降级和劝退等重要事宜。预警方面,学校...
和讯投顾文太彬:本周市场分化缺... 本周股指涨跌分化,下周走势如何运行?和讯投顾文太彬预计下一周股指的走势判断为下跌调整走势,因为我们说...
上海对边走边抽烟的游烟族出手了 在上海,那些边走边抽烟的“游烟族”迎来了强力整治。上海相关部门行动迅速,明确规定禁止在公共场所边走边...
连续作战创纪录!金川镍钴检测中... 日前,随着最后一批银锭数据精准录入系统,金川集团镍钴股份有限公司检测中心内检车间贵金属银锭计量岗连续...
美联储计划裁员约10% 当地时间16日,美国联邦储备委员会主席杰罗姆·鲍威尔向员工发送的一份备忘录显示,美联储计划在未来几年...
严打上市公司犯罪,公安部公布5... 近期,公安部严打上市公司犯罪,公布了 5 起典型案例。这些案例彰显了国家对上市公司违法违规行为的零容...
瞄准“好房子”各地积极鼓励第四... 近年来,“好房子”的概念不断升级,各地积极鼓励第四代住宅建设。第四代住宅以其独特的空中庭院设计,将自...
穆迪:下调美国主权信用评级 近日,穆迪作出重大举动,下调了美国的主权信用评级。这一决定引发了全球金融市场的强烈震荡。穆迪作为国际...
云南震感强烈:吊灯猛晃 民众上... 近日,云南地区震感强烈,这一幕令人心惊。只见那原本安稳悬挂的吊灯如受惊的舞者,猛烈地晃动起来,仿佛在...