可独立工作7小时以上!OpenAI升级Codex代理,首份ChatGPT使用研究显示52%为女性

头部科技 2025-09-16 18:05
资讯配图
资讯配图
文丨丁灵波
许久没有大动作的OpenAI,今天迎来了一波产品更新,将其AI编码代理Codex正式升级到GPT-5版本。
该公司表示,新模型GPT-5-Codex的“思考”时间比之前的模型更加动态,完成一项编码任务所需的时间可从几秒到七个小时不等,因此,它既擅长快速的交互式会话,也能够独立完成冗长复杂的任务,其代码审查功能还可以在产品发布之前发现关键错误。
资讯配图
Codex可以在涉及开发的任何平台运行——终端或IDE、网页、GitHub甚至ChatGPT iOS应用。

OpenAI官方表示,GPT-5-Codex在SWE-bench Verified上的表现优于GPT-5,实现了大型成熟存储库的代码重构任务性能的新基准。

资讯配图
强化AI编码市场竞争

此次更新是OpenAI努力提升Codex在AI编码代理市场竞争力的一部分,其竞争对手都实力不俗,例如Claude Code、Anysphere的Cursor和微软的GitHub Copilot、谷歌的Jules等等。

由于用户需求旺盛,AI编码工具市场正在变得更加拥挤也开始加速洗牌。Cursor披露的年度经常性收入(ARR)在2025年初超过了5亿美元,而类似的代码编辑器Windsurf则遭遇了一场混乱的收购,导致其团队被谷歌和Cognition两家公司瓜分。

资讯配图

在国内,通义灵码、文心快码、腾讯CodeBuddy、字节跳动的Trae等等,深度适配各自的技术生态,逐步形成了与国际工具差异化的竞争力。

GPT‑5-Codex是GPT‑5的一个全新改进版本,专门针对代理软件工程进行了深度优化,聚焦解决更多实际工程任务,例如从头构建完整开发项目、添加功能和测试、调试、执行大规模重构以及进行代码审查。

资讯配图

GPT‑5-Codex会根据任务的复杂程度,更动态地调整其思考时间。

该模型结合了编码代理的两项基本技能:在交互式会话中与开发者配对,以及在较长的任务上持续、独立地执行。这意味着Codex在处理小型、定义明确的请求或与它聊天时会感觉更敏捷,并且在处理大型重构等复杂任务时也能工作更长时间。

在测试中,GPT‑5-Codex能够独立处理大型复杂任务超过7小时,不断迭代实现,修复测试错误,并最终交付成功的实现。

资讯配图

在OpenAI员工内部评估中,对于按模型生成的token(包括隐藏推理和最终输出)排序的后10%的用户轮次,GPT-5-Codex使用的token量比GPT-5少93.7%,但对于前10%的用户轮次,GPT-5-Codex的思考时间也更长,其推理、编辑和测试代码以及迭代的时间是GPT-5的两倍。

资讯配图

Sam Altman发帖透露,GPT‑5-Codex一上线就被开发者热捧,已经占据了Codex流量的约40%,今天某个时候应该会占到大多数。

资讯配图
比人类程序员审查还“严谨”
为了使Codex成为更好的AI程序员搭档,OpenAI还针对Codex CLI和Codex IDE等进行了扩展改进。
Codex CLI命令行界面:CLI现已围绕Agentic工作流重新构建,允许开发者直接附加线框图或屏幕截图等图像、共享上下文,并使用内置待办事项列表跟踪进度,还包含网页搜索和MCP等用于连接外部系统的工具,从而整体上提高了工具使用准确性;
资讯配图
Codex IDE扩展:该扩展可在VS Code、Cursor及类似分支中使用,使开发人员能够预览本地更改并在编辑器中使用Codex编辑代码;
资讯配图
Codex云环境:OpenAI在幕后改进了部署基础设施,将平均完成时间缩短了90%;
以及包含经过训练的代码审查功能,用于发现关键缺陷,在GitHub代码库中启用Codex后,它会随着拉取请求的进展自动审查、标记问题,甚至在同一审查线程内实施建议的修复方案,开发者还可以请求专门的审查,例如检查安全漏洞,官方称,即使是严谨的人工审查人员也未必总是能做到这种程度的细致工作。
资讯配图
女性用户过半,七成使用与工作无关
除了技术产品的更新,OpenAI今天还推出了迄今为止最大规模的消费者ChatGPT使用情况研究,这项研究是美国国家经济研究局(NBER)的一份调研论文,由OpenAI经济研究团队和哈佛大学经济学家戴维·戴明共同撰写。
ChatGPT现在每周有超7亿活跃用户,该研究基于150万次对话进行了大规模隐私保护分析,追踪了自ChatGPT三年前推出以来消费者使用情况的变化,这是迄今为止发布的关于消费者实际使用ChatGPT的最全面研究。
资讯配图
资讯配图
截至2025年中,ChatGPT的早期性别差距已大幅缩小。ChatGPT于2022年底推出时,每周活跃的用户中约80%是男性,到2025年7月,女性命名用户比例已上升至一半以上(52.4%),而且,全球成年用户覆盖率已达到约10%。
资讯配图
ChatGPT的经济影响力已渗透工作和个人生活,尽管人们都在谈论AI可能会彻底改变职场,但数据显示仅约30%的用户使用与工作相关,约70%与工作无关。
从地域来看,ChatGPT在中低收入国家尤其增长迅速,截至2025年5月,ChatGPT在最低收入国家的采用增长率是最高收入国家的4倍以上。
其中,“实用指导”(Practical Guidance)、“信息查询”(Seeking Information)和 “内容创作”(Writing)是三大最常见应用场景,合计占所有对话的近80%。
资讯配图

越来越多的人将ChatGPT用作信息搜索引擎,2024年6月,约有14%的ChatGPT对话被标记为与“信息查询”相关,到2025年6月,这一数字上升至24.4%。


使用模式也分为从“询问”、“执行”“表达”三个方面,大约一半的消息(49%)是询问,执行占使用量的40%,表达占使用量的11%,通常涉及个人反思、知识探索和娱乐,ChatGPT有助于提高用户判断力和生产力,尤其是在知识密集型工作中。
这份用户研究凸显了ChatGPT的双重角色,它既是生产力工具,也是用户日常生活中的高频AI助手,也见证了AI在人们的工作和日常生活中产生越来越重要的实际经济价值。

-END-

资讯配图
如果您有什么想说的,欢迎在评论区留言讨论!
投稿或寻求报道,欢迎私信“投稿”,添加编辑微信。
【2025免费新年礼】:了解最新科技趋势分析、行业内部的独家见解、定期的互动讨论和知识分享、与行业专家的直接面对面交流的机会,领取100份AI科技商业研报合集,加群共同探讨与成长——
扫描下方二维码,添加头部科技晶总微信!
资讯配图

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 显示
more
京东的“他她它”App藏不住了!实测后:这个AI产品暴露了京东的野心
AI应用,创新赋能!第四届GMIF2025创新峰会圆满落幕
AI芯片厂商,从英伟达嘴里“抢蛋糕”
上海人工智能实验室与模速空间接力孵化企业,用AI赋能千行百业
马斯克与OpenAI再生纠葛 旗下xAI指控对方窃取商业机密
先进存力站稳AI应用落地主场!平头哥镇岳510以六大特性镇场
标志卓信亮相上海工博会,AI驱动软件创新引关注
海康威视亮相2025中国工博会:以“物联感知+AI”驱动工业智变
哈啰发布全栈AI战略,Robotaxi或将彻底颠覆传统出行
「会议室的声音枢纽」来了!影石Insta360发布AI录音全向麦克风Wave
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号