跳转到主要内容

OpenAI Codex 2026年3月更新:发生了什么变化,现在到底能做什么

A
13 分钟阅读AI 开发工具

2026 年 3 月,Codex 开始更像一整套代理系统,而不再只是几个表面的拼盘。GPT-5.4 成为主模型,GPT-5.4 mini 改变了低成本任务分工,Codex Security 进入 research preview,而 Codex 应用则把并行代理、worktrees、skills 和 Automations 真正串了起来。

OpenAI Codex 2026年3月更新:发生了什么变化,现在到底能做什么

如果你对 Codex 的心智模型还停留在“OpenAI 的云端编程代理”,那你已经落后于 2026 年 3 月这轮变化了。真正重要的,不是某一个新功能,而是 Codex 开始作为一整套更完整的代理系统一起工作起来了:桌面应用负责并行代理,GPT-5.4 成为新的主模型,GPT-5.4 mini 负责更便宜的辅助任务,Codex Security 把安全审查带进 Codex 栈,而本地与云端的运行边界也终于被 OpenAI 讲清楚了。

这很重要,因为今天的 Codex 只有把这些表面放在一起看才说得通。它不再只是一个云端任务代理,不再只是一个 CLI 编码工具,也不只是“OpenAI 的编程模型”。它明确覆盖 应用、CLI、IDE 和云端 四个表面,而且这些表面不再是各讲各的故事,而是在互相加强。

一眼结论(验证日期:2026-04-01)

  • 2026 年 3 月 5 日: GPT-5.4 进入 Codex,成为新的主模型。OpenAI 把它定位为重要工作场景下的旗舰模型,强调原生计算机操作与更强的工具工作流。
  • 2026 年 3 月 17 日: GPT-5.4 mini 进入 Codex 的应用、CLI、IDE 和 web,使用 GPT-5.4 配额的 30%,适合更快、更便宜的辅助型子任务。
  • 2026 年 3 月 6 日: Codex Security 通过 Codex web 进入 research preview,把带上下文的应用安全审查拉进了 Codex 体系。
  • 2026 年 2 月 2 日加 3 月 4 日更新: Codex 应用先在 macOS 发布,后续扩展到 Windows,正式把多代理、worktrees、skills 和 Automations 变成一个更顺手的桌面工作流。
  • 真正的变化: 现在理解 Codex,最有用的方式已经不是把它看成一个接口或一个模型,而是把它看成一套跨表面的代理系统。

证据说明: 本文基于 OpenAI 当前产品页与 Codex 官方文档,于 2026 年 4 月 1 日复核。接入范围、模型路由和配额策略变化很快,请把它当作带日期的操作快照。

3 月这轮变化,不是单个功能,而是整套栈的变化

2026年3月 Codex 能力栈:应用、GPT-5.4、Codex Security 与 GPT-5.4 mini

最容易误解 Codex 的方式,就是把 3 月这些发布拆开来看。

如果你只看 Codex 应用 的发布,很容易以为 OpenAI 只是做了一个更好看的桌面壳子。如果你只看 GPT-5.4,你可能会觉得 Codex 只是换了更强的模型。如果你只看 GPT-5.4 mini,又很容易把它当作一个更便宜的选项。如果你只看 Codex Security,又可能会误以为这是一个和 Codex 并列的独立安全产品。

这种看法都抓不到重点。2026 年 3 月真正发生的是:Codex 变得更连贯了。

应用让 Codex 有了更像“代理控制台”的入口。GPT-5.4 把主代理的能力上限往上抬了一层。Codex Security 说明 Codex 正在进入更高信任、更偏审查型的工作流。GPT-5.4 mini 则让“主模型负责规划和判断,小模型负责更便宜的辅助任务”这件事开始变得现实。把这些放在一起看,Codex 就不再只是“又一个 AI 编程工具”,而更像一套真正能组织代理工作的系统。

这也是为什么 2026 年 3 月 4 日 的 Windows 更新比表面上更重要。单看它只是平台覆盖,但放进整轮变化里,它意味着 Codex 应用不是给少数 macOS 用户试玩的附属物,而是 Codex 正式的长期表面之一。

Codex 现在是一套四表面系统

OpenAI Codex 表面图:应用、CLI、IDE 与云端如何组成同一工作流

现在的 OpenAI 文档与产品页,已经把 Codex 明确写成 四个主要表面

  • Codex 应用
  • CLI
  • IDE 扩展
  • Codex cloud

这件事为什么重要?因为真正有用的问题已经不是“哪个才是真正的 Codex”。现在它们都是。真正有用的问题是:每个表面各自更适合什么。

应用 最能体现 OpenAI 现在希望开发者如何与代理一起工作。官方产品页把它定义成代理的 command center,而不是一个普通聊天窗口。你可以同时跑多个线程;不同代理可以在隔离的 worktree 里工作;你可以直接看 diff、评论改动、让后台任务继续跑,同时又不污染自己本地 git 状态。这和“打开终端,让模型给你补丁”是两种完全不同的工作姿势。

CLIIDE 扩展 仍然重要,因为它们让 Codex 紧贴本地仓库与真实编辑环境。应用甚至会继承 CLI 和 IDE 的会话历史与配置,这其实是一个很强的产品信号:OpenAI 不是要替代本地工作流,而是要把它统一起来。

然后是 cloud Codex。当任务已经足够清晰,最优路径是把仓库接进来、把任务发出去、需要时再看日志、最后回来看干净的 diff 或 PR,这仍然是 Codex 最强的模式之一。因为 OpenAI 对云端路径的描述是明确的,而不是模糊地写在营销文案里。

真正把这些表面串起来的,是 skills、rules,以及越来越重要的 Automations。应用发布页把这点讲得很具体:skills 可以在应用里创建,在应用、CLI、IDE 里使用,也可以直接 check 进仓库,让团队共享。这让 Codex 不再只是“有记忆的助手”,而更像一个能沿着 repo 组织工作流的系统。

GPT-5.4 把能力上限抬高了

这轮变化里,最大的能力升级依然是 2026 年 3 月 5 日 GPT-5.4 进入 Codex。

它重要,至少有三个原因。

第一,OpenAI 明确把 GPT-5.4 定位成 ChatGPT、API 和 Codex 中面向重要工作的主模型。这不是一个安静的后端替换,而是直接改变了大家默认应该如何理解 Codex 的能力上限。

第二,OpenAI 把 GPT-5.4 在 Codex 和 API 里的定位写得很直接:它是首个具备 原生计算机操作能力 的通用模型。这个变化的意义在于,它让 Codex 不再只适合“改几行代码”。一个更擅长处理工具、软件环境和界面的代理,会自然扩展到更多技术工作:测试、UI 检查、工作流验证、文档处理、通过 skills 生成表格或演示材料,以及混合浏览器与代码的任务。

第三,GPT-5.4 也把长链路任务的上限拉高了。OpenAI 说 GPT-5.4 支持最高 100 万 token 上下文,并改进了更大工具生态中的 tool search。我不会把它粗暴翻译成“Codex 现在什么超长任务都能自动搞定”,那样太草率。但它确实改变了实操上限。它让主代理在面对更多文件、更多工具、更多步骤的长链路工作时,更有机会保持规划、协调和验证的一致性。

这也是为什么现在的 Codex 故事已经不能简化成“模型更聪明了”。GPT-5.4 的价值,在于它让应用、skills 与自动化这层叙事真正站得住。一个多代理表面,只有在底层代理足够擅长长任务和工具使用时才有意义。3 月这次,OpenAI 终于把这些层对齐了。

信任边界终于讲清楚了

Codex 信任边界图:本地默认值、云端设置阶段与离线代理阶段

当前 Codex 文档中,最有价值的提升之一其实不是某个新能力,而是 OpenAI 终于把信任边界讲得足够清楚。

本地 CLI 和 IDE 使用 下,默认行为是:

  • 不开网络
  • 只允许写当前工作区

这比那些空泛的“默认更安全”说法实用得多,因为它直接告诉你默认盒子到底有多大。

Codex cloud 里,OpenAI 把运行时明确分成两个阶段:

  • setup 阶段 可以联网安装依赖、准备环境
  • agent 阶段 默认离线,除非你显式给环境打开 internet access

OpenAI 还明确写到:secrets 只在 setup 阶段可用,进入主 agent 阶段前会被移除。这不是小细节,而是会直接影响你如何理解依赖安装、构建准备与后续执行边界。运行边界终于被写清楚之后,很多实际操作判断也才真正有了明确前提。

所以现在关于 Codex,真正值得记住的不是“让代理自己跑”。而是你终于可以更清楚地推理:

  • 本地默认能碰到什么
  • 网络访问什么时候出现
  • 云端在 setup 之后会进入什么边界
  • 你什么时候是在主动突破默认值

对于重视策略、审查性和风险隔离的团队来说,这种清晰度本身就是一种能力。

被低估的 3 月新增,其实是 GPT-5.4 mini

模型分工图:GPT-5.4 负责规划判断,GPT-5.4 mini 负责更窄更便宜的支持任务

2026 年 3 月 17 日 的 GPT-5.4 mini,很容易被看成一次“便宜模型补位”。但在 Codex 里,它的意义比这大得多。

OpenAI 明确说,GPT-5.4 mini 会进入 Codex 的 应用、CLI、IDE 扩展和 web,并且只消耗 GPT-5.4 配额的 30%。这本身已经足以让很多开发者把它用于更快、更便宜的简单任务。但真正更重要的,是 OpenAI 对它在 Codex 中工作方式的描述。

GPT-5.4 mini 的发布页直接写到:在 Codex 里,更大的 GPT-5.4 可以负责 规划、协调和最终判断,而 GPT-5.4 mini 子代理则并行处理更窄的辅助子任务,例如:

  • 搜索代码库
  • 审阅大文件
  • 处理支持性文档

这已经不是“选一个模型然后一路用到底”的故事了,而更像一种真正的代理内部任务分工。反过来,这也让 Codex 应用里那套多代理界面变得更有意义,因为 UI 层和模型层开始互相强化。

这里还有一个边界需要讲清:GPT-5.4 nano 并不在 Codex 里。 OpenAI 把 nano 定位成 API-only。所以,现在真正 relevant 的 Codex 模型故事其实是:

  • GPT-5.4 负责更重的规划与判断
  • GPT-5.4 mini 负责更便宜、更窄的辅助工作

这比单纯罗列模型菜单有用得多。

Codex 现在最强的地方是什么

把 3 月这些变化放在一起看,Codex 现在最强的场景主要有四类。

1. 并行后台工作,但结果仍然要可审可回看。
应用里的线程模型、worktrees 和 diff-first 审阅方式,就是为这种任务准备的。如果任务已经足够清楚,Codex 现在更像一个能把多个后台事项同时推进、最后再统一审查的系统,而不是一个单线程会话助手。

2. 同时涉及代码、工具和界面的混合任务。
GPT-5.4 的原生计算机操作方向在这里很关键。应用层和 skill 层也很关键。现在的 Codex 已经不再只是“帮你改文件”,而是越来越擅长那些同时触及代码、文档、浏览器、资源和外部工具的工作流。

3. 那些应该被变成定时后台工作的重复工程杂务。
Automations 是最容易被低估的新增之一。OpenAI 明说自己用它做 issue triage、CI 失败总结、release brief、bug 检查。这类工作,本来就更适合“代理跑完后进 review queue”,而不是“每次都在聊天里手动催”。

4. 更高信任、更偏审查型的工作流,尤其是安全相关。
Codex Security 当然不是 Codex 的全部,但它说明了平台正在往哪里扩展。OpenAI 显然不满足于让 Codex 只负责生成代码,而是在推进它进入“审查、验证、修补”这类更高上下文要求的流程。

这并不意味着 Codex 会自动成为一切编码工作的最佳选择。它真正意味着的是:你评价 Codex 的方式已经该变了。如果你还把它当成一个单表面的编程助手,你会错过它现在真正变强的部分。

如果你接下来的问题变成“那它和另一款编码代理比,日常到底该先用谁”,可以接着看我们的 Claude Code vs Codex 对比。在先把现代 Codex 的图景看清之后,再做这种二选一判断会更靠谱。

FAQ

Codex 现在主要是一个应用吗?
不是。应用很重要,因为它把并行代理、worktrees、skills 和 Automations 组织得更顺手,但 OpenAI 仍然明确把 Codex 写成应用、CLI、IDE 扩展和云端四个表面的组合。

Codex 现在用的是什么模型?
OpenAI 当前文档里,GPT-5.4 是 Codex 的主模型。GPT-5.4 mini 也已经进入 Codex,负责更快、更便宜的辅助工作。GPT-5.4 nano 则是 API-only。

Codex 现在还适合本地工作吗?
适合。OpenAI 当前文档明确写到,本地 CLI / IDE 默认无网络、写权限只限当前工作区。所以 Codex 并不是一个只属于云端的产品。

Codex Security 真正新的地方是什么?
它不是简单的“多了个安全扫描器”,而是一个在 Codex web 里理解项目上下文、验证发现并提出补丁的应用安全代理。真正重要的是,它说明 Codex 正在进入更偏审查与验证的工作流,而不只是生代码。

为什么 GPT-5.4 mini 这么重要?
因为它改变的是工作分工,而不只是成本。OpenAI 直接把 GPT-5.4 mini 写成更适合窄任务并行子代理的模型,而 GPT-5.4 负责规划与最终判断。

一句话怎么理解现在的 Codex?
把 Codex 理解成一套跨表面的代理系统最合适。应用负责组织并行工作,本地表面让它贴近仓库,云端表面负责可交接的后台任务,GPT-5.4 抬高主代理上限,GPT-5.4 mini 让便宜的辅助工作变得现实,而现在的安全模型终于清楚到足以影响部署决策。


核心判断: 2026 年 3 月,Codex 真正更新的地方,不是“它能做更多了”,而是它终于开始像一套连贯的代理栈那样工作了。表面、模型和信任边界现在能互相解释彼此,这才是最重要的变化。

分享文章:

laozhang.ai

一个 API,所有 AI 模型

AI 图片

Gemini 3 Pro Image

$0.05/张
官方2折
AI 视频

Sora 2 · Veo 3.1

$0.15/个
异步API
AI 对话

GPT · Claude · Gemini

200+ 模型
同官方价
已服务 10万+ 开发者
|@laozhang_cn|送$0.1