Codex in Action
全面介绍 OpenAI Codex 的核心能力、多种接入方式(桌面应用、CLI、IDE 插件、网页版)、定价计划及其与 Claude Code 的对比,是使用 Codex 的参考指南。
Codex 是 OpenAI 打造的 AI 编程智能体(coding agent),由 ChatGPT 提供技术支持。官方定义为「助力构建并交付产品的 AI 编程智能体」—— 从常规 Pull Request 到复杂功能开发、代码重构与迁移,Codex 端到端完成;也可在后台自动化运行 Issue 分流、告警监控、CI/CD 等日常工作。相关背景可进一步阅读 Builder.io 的深度对比分析。更多官方资源链接见本文末尾的参考资料。
什么是 Codex
Codex 是 OpenAI 的编程智能体,帮助开发者更快地编写、审查和交付代码。它可以配对在你的本地工具中使用,也可以委托到云端完成任务。
核心能力
根据官方文档,Codex 能帮助你:
- 编写代码:描述你想构建的内容,Codex 生成符合意图的代码,并适配你的项目结构与规范。
- 理解代码库:阅读并解释复杂或遗留代码,帮助你理解团队如何组织系统。
- 审查代码:分析代码以识别潜在 Bug、逻辑错误和未处理的边界情况。
- 调试修复:追踪失败、诊断根因并给出有针对性的修复建议。
- 自动化开发任务:执行重复性工作流,如重构、测试、迁移和配置任务,让你专注于更高层次的工程工作。
默认模型
注意:GPT-4o 在 Codex 中不可用。Codex 目前默认使用 GPT-5.1-Codex 模型家族(Max 默认,可选 Mini)。Retired 或已移除的模型(包括 GPT-4o)无法恢复或作为 Legacy Tier 购买。可通过模型选择器(查看 “Legacy”)或
-mflag 或config.toml指定其他支持的模型。详细可用的模型列表见 Models 文档。
多端使用方式
Codex 支持多种接入方式,所有方式都由同一个 ChatGPT 账号统一连接。
Codex 应用(桌面 App)
Codex 桌面应用是「智能体式编码的指挥中心」:
- 支持 macOS(Apple Silicon)和 Windows。
- 内置 Worktrees(工作树)与 云端环境,允许多个智能体在多个项目间并行工作,将数周的开发周期缩短至数天。
- 支持 Skills(技能)与 Automations(自动化),可在后台无人值守运行。
- 自带 Git 功能,可在应用内完成分支切换、PR 创建等操作。
下载链接(Quickstart 页面):
# macOS / Windows 下载地址
https://chatgpt.com/codex → 下载 App
CLI(命令行)
Codex CLI 是轻量级编程智能体,直接在终端运行,支持 macOS、Linux、Windows(Windows 为实验性支持,推荐使用 WSL)。
安装方式
# npm
npm install -g @openai/codex
# Homebrew
brew install codex
核心功能
CLI 支持的功能与 App 类似,具体包括(参考 CLI 文档):
| 功能 | 说明 |
|---|---|
交互式 TUI (Text-based User Interface) |
运行 codex 启动交互式终端会话 |
| 模型切换 | 使用 /model 在 GPT-5.4、GPT-5.3-Codex 等模型间切换 |
| 图片输入 | 附加截图或设计稿,让 Codex 同时阅读 |
| 本地代码审查 | 在 commit 或 push 前使用独立 Codex 代理审查代码 |
| 子代理 (Subagents) | 使用子代理并行化复杂任务 |
| 网页搜索 | 让 Codex 搜索网络获取最新信息 |
| 云端任务 | 在终端内启动 Codex Cloud 任务并应用 diff |
| 脚本化 | 使用 exec 命令自动化重复工作流 |
| MCP 支持 | 通过 Model Context Protocol 连接第三方工具 |
| 审批模式 | 选择 Codex 执行编辑或运行命令前的审批级别 |
IDE 插件
Codex 提供编辑器插件,支持以下 IDE:
- VSCode(官方扩展:vscode:extension/openai.chatgpt)
- Cursor(cursor:extension/openai.chatgpt)
- Windsurf(windsurf:extension/openai.chatgpt)
- VSCode Insiders
安装后 Codex 扩展出现在侧边栏,默认为 Agent 模式,可读取文件、运行命令、在项目目录中写入更改。
在 Cursor 中使用 Codex 的示例:
网页版
直接访问 chatgpt.com/codex 使用,支持:
- 连接 GitHub 仓库
- 实时监控任务进度
- 在云端隔离沙箱中运行任务
- 在 diff 视图中审查结果并直接创建 Pull Request
核心概念与功能
Skills(技能)
Skills 让 Codex 超越单纯写代码,直接参与将 PR 变成产品的工作,例如代码理解、原型构建、文档编写,并与团队标准保持一致。
- 每个项目根目录可放置
AGENTS.md文件,定义 Codex 在该项目中遵循的规范和上下文。 - 社区可在 OpenAI 博客 查看用 Skills 加速开源维护的案例。
与 Claude Code 的
CLAUDE.md的区别:Claude Code 仅支持CLAUDE.md,Codex(和 Cursor、Builder.io)支持AGENTS.md标准。如果多工具团队使用同一个指令文件,AGENTS.md可避免维护多份同步文件。详见 Builder.io 的对比分析。
Automations(自动化)
Automations 让 Codex 无需提示即可自动运行,处理「问题分流、告警监控、CI/CD」等日常但重要的工作,使你专注于构建本身。
Worktrees(工作树)
内置 Git worktree 支持,多个智能体可以在同一项目的不同分支上并行工作,互不干扰。
Subagents(子代理)
使用子代理并行化复杂任务,Codex 可以同时处理多个方向的问题,再汇总结果。
Cloud(云端环境)
Codex Cloud 提供:
- 隔离沙箱:每个任务在独立沙箱中运行,带有你的仓库和环境配置。
- 互联网访问:可选开启云端任务的互联网访问权限。
- 更大的虚拟机:Business plan 可用更大规格虚拟机加速云端任务。
GitHub 集成
Codex 的 GitHub 集成是其相对于其他编程智能体的显著优势:
- 自动代码审查:安装 GitHub App 后,可为整个团队开启自动 PR 审查。它会在 PR 中添加内联评论,你可以要求它修复问题,并在 PR 页面直接审查和合并。
- Issue 中 @Codex:在任何 Issue 或 PR 中 @Codex,它会自动接手处理。
- 与 CLI 行为一致:GitHub UI 中的提示词与 CLI 中的效果相同,相同的模型、相同的配置、相同的行为,确保一致的体验。
参考 Builder.io 的评测:Codex 的 GitHub 集成「能发现团队会错过的真正有难度的 Bug,在行内评论,可以要求它修复问题,在后台运行,可以在 PR 中审查和更新,然后合并」,而 Claude Code 的 GitHub 集成「评论冗长但找不到明显的 Bug,无法以有效方式要求修复」。
Slack 集成
可在 Slack 中直接 @Codex 执行任务,详见 Slack 集成文档。
Plugins(插件)
Plugins 将可复用工作流打包,方便连接 Codex 到你依赖的工具和服务,并在团队间共享。Plugin 可组合一个或多个 Skills、可选的 App 集成或 MCP 服务器配置,是可安装的分发单元。详见 Plugins 文档。
Superpowers:工程化工作流插件
Superpowers(Jesse Vincent / Prime Radiant)是一套面向编程智能体的可组合技能(Skills)框架与软件工程方法论。它通过 Codex 官方插件市场 分发,把「需求澄清 → 设计评审 → 计划拆解 → TDD 实现 → 子代理协作 → 代码审查 → 分支收尾」串成强制工作流,而不是让代理一上来就改文件。
与 Codex 原生能力的关系:Codex 自带的 Skills、Subagents、Worktrees 提供平台能力;Superpowers 在其上提供方法论与技能清单(何时 brainstorming、如何写计划、怎样 RED-GREEN-REFACTOR)。二者互补:Superpowers 的 subagent-driven-development 与 using-git-worktrees 分别与 Codex 的子代理、worktree 能力天然对齐。更完整的技能库、口令示例与 Cursor 对照见站内 Superpowers 使用指南.
安装(CLI 与 App)
Superpowers 在 Codex CLI 与 Codex App 中均需单独安装(与其他 Harness 互不同步)。当前插件版本 5.1.0,技能目录挂载于 ./skills/。
Codex CLI(在 codex 交互会话内):
/plugins
搜索 superpowers,选择 Install Plugin。插件来自 官方 Codex 插件市场。
Codex App:
- 侧边栏打开 Plugins
- 在 Coding 分类找到 Superpowers
- 点击旁的
+并按提示完成安装
安装后无需手动 @ 每个技能。代理会按 using-superpowers 规则自动判断是否加载相关技能;你仍可通过项目根目录的 AGENTS.md 补充技术栈、目录约定或「禁用 TDD」等项目级偏好(用户显式指令优先于 Superpowers 技能)。
标准工作流(七步)
| 步骤 | 技能 | 作用 |
|---|---|---|
| 1 | brainstorming |
苏格拉底式澄清需求,分节展示设计并征求确认 |
| 2 | using-git-worktrees |
设计通过后在新分支 / worktree 隔离开发 |
| 3 | writing-plans |
拆成 2–5 分钟一步的可执行计划 |
| 4 | subagent-driven-development 或 executing-plans |
子代理分任务执行(推荐)或当前会话逐步执行 |
| 5 | test-driven-development |
RED-GREEN-REFACTOR,先写失败测试 |
| 6 | requesting-code-review |
按严重程度自检,阻断 Critical 问题 |
| 7 | finishing-a-development-branch |
验证测试,选择合并 / PR / 保留 / 丢弃 |
设计规格与实现计划默认落在仓库内,便于审阅与版本管理:
| 路径 | 内容 |
|---|---|
docs/superpowers/specs/ |
brainstorming 产出的设计文档 |
docs/superpowers/plans/ |
writing-plans 产出的实现计划 |
在 Codex 中的使用示例
提出一个明确的功能需求后,观察代理是否先进入 brainstorming(提问、给方案)而非直接改文件——这是 Superpowers 生效的最直观信号。若代理「跑偏」(跳过设计、未看失败信息就猜修复),可在 Codex CLI / App 对话中显式点名技能:
使用 brainstorming skill,和我一起梳理这个需求,不要直接写代码
【描述需求,例如:给 API 加按用户限流,返回 429 与 Retry-After】
设计确认后写计划:
使用 writing-plans skill,为这个改动写一个实施计划
【说明已批准的设计;若有 spec 请写明路径,例如 docs/superpowers/specs/2026-06-15-rate-limit-design.md】
大改造推荐子代理执行(与 Codex Subagents 配合):
使用 subagent-driven-development skill,执行这个计划
【附上计划路径,例如 docs/superpowers/plans/2026-06-15-rate-limit.md】
与 Codex 协同的注意事项
- 审批模式:Superpowers 会频繁跑测试、改多文件;若 CLI 审批过严易卡在权限循环,可按任务调整 审批级别(全自动小步任务 vs 高风险命令人工确认)。
- 用量:brainstorming 与多轮子代理会消耗更多本地消息;复杂功能可先用 Superpowers 走完设计与计划,再交给 Codex Cloud 执行大块实现以分担本地额度。
- 与
AGENTS.md并存:AGENTS.md写项目规范,Superpowers 写流程纪律;若二者冲突,以AGENTS.md为准。 - 更新:Superpowers 更新随 Codex 插件市场推送,部分环境会自动升级;以 官方 README 与 Release Notes 为准。
MCP(Model Context Protocol)
Codex 支持 MCP,可连接第三方工具获取额外的上下文和功能。详细见 MCP 文档。
定价计划
Codex 包含在标准 ChatGPT 套餐中,同时也支持纯 API 按量付费。
各计划包含内容
| 功能 | Plus | Pro | Business | Enterprise |
|---|---|---|---|---|
| 网页 / CLI / IDE / iOS 版 Codex | Yes | Yes | Yes | Yes |
| GitHub 自动代码审查 | No | No | Yes | Yes |
| Slack 集成 | No | No | Yes | Yes |
| 最新模型(GPT-5.4、GPT-5.3-Codex) | Yes | Yes | Yes | Yes |
| GPT-5.4-mini(更高用量限制) | No | Yes | No | No |
| 6 倍本地和云端任务用量限制 | No | Yes | No | No |
| 10 倍代码审查次数 | No | Yes | No | No |
| GPT-5.3-Codex-Spark(研究预览) | No | Yes | No | No |
| API 按量付费(仅 CLI/SDK/IDE) | No | No | Yes(Flexible) | Yes |
| 企业级安全控制(SCIM、EKM、RBAC) | No | No | No | Yes |
| 数据驻留与合规 API | No | No | No | Yes |
| 审核日志与用量监控 | No | No | No | Yes |
当前限时优惠:符合条件的 ChatGPT Business 工作区在团队成员开始使用 Codex 时可获得最高 $500 额度。详见官方条款。
用量限制参考
Plus 用户(5 小时窗口内):
| 模型 | 本地消息数 | 云端任务数 | 每周代码审查次数 |
|---|---|---|---|
| GPT-5.4 | 33–168 | No | No |
| GPT-5.4-mini | 110–560 | No | No |
| GPT-5.3-Codex | 45–225 | 10–60 | 10–25 |
Pro 用户(5 小时窗口内):
| 模型 | 本地消息数 | 云端任务数 | 每周代码审查次数 |
|---|---|---|---|
| GPT-5.4 | 223–1120 | No | No |
| GPT-5.4-mini | 743–3733 | No | No |
| GPT-5.3-Codex | 300–1500 | 50–400 | 100–250 |
注意:本地消息与云端任务的用量共享同一个 5 小时窗口。详细最新的费率信息见 Codex 定价页面。
节省用量的技巧
- 控制 Prompt 大小,只提供必要的上下文。
- 减少
AGENTS.md的体积,必要时使用嵌套方式分层注入。 - 限制使用的 MCP 服务器数量,不需要时禁用。
- 日常任务切换到 GPT-5.4-mini,延长约 2.5x–3.3x 的本地消息限制。
Codex vs Claude Code
Builder.io 的深度对比(2026 年 4 月更新)从多个维度分析了两者:
各维度对比
| 维度 | 胜出 | 说明 |
|---|---|---|
| 智能体能力 | Tie | 三者功能趋同,Codex 行为与 Claude Code 非常接近 |
| 模型与推理控制 | Tie | Codex 提供更多推理级别选项(low/medium/high/minimal) |
| 定价与用量 | Codex | 相同价格下 Codex 用量更慷慨;GPT-5 Codex 效率约为 Claude Sonnet 的 2 倍 |
| UX 与权限 | Claude Code | Claude Code 的 TUI 更成熟,权限系统有所改进但仍偶有摩擦 |
| 功能深度 | Claude Code | Claude Code 在配置深度、hooks、slash commands 上更丰富 |
| 指令文件标准 | Codex | Claude Code 只支持 CLAUDE.md;Codex 支持 AGENTS.md(Cursor、Builder.io 也支持),多工具团队可共用同一套指令文件 |
| GitHub 集成 | Codex | Codex GitHub App 自动审查能发现真正有难度的 Bug;Claude Code 评论冗长但抓不住明显问题 |
| 开放性 | Codex | Codex CLI 完全开源,可自由定制;Claude Code 为闭源 |
Builder.io 的选择
Builder.io 选择使用 Codex 作为核心编码智能体,主要原因:
- GitHub 集成优秀——安装后开启自动代码审查,能发现真正有难度的 Bug,支持 @Codex 在 Issue 中直接处理,形成从发现到修复的闭环。
- 定价更有利——$20 的 Plus 计划比 Claude 同价位更耐用,$200 的 Pro 几乎不遇到上限。
- 同一公司训练模型——工具和模型均由 OpenAI 打造,优化端到端体验,且没有中间商差价。
- 指令文件统一——使用
AGENTS.md标准,与 Cursor、Builder.io 共用同一套规范。
推理行为的细节差异
根据 Builder.io 的实际观察:
- Codex:推理时间略长,但 token 输出速度让人感觉更快(可见的 tokens/s 输出)。
- Claude Code:推理次数略少,但可见输出 token 稍慢。在 Cursor 内切换模型也有类似感受:GPT-5 Codex 模型推理时间更长,Sonnet 推理更少但代码输出略慢,Opus 更明显。
两种风格并无绝对优劣,偏好因人而异。
模型感受数据
Builder.io 对比了用户情绪评分:
在 GPT-5 Codex、GPT-5 Mini 和 Claude Sonnet 中,GPT-5 Codex 平均获得 40% 更高评分。
这与效率数据吻合——在相近成本下,GPT-5 Codex 带来更好的实际体验。
GitHub 集成:核心差异所在
这是 Builder.io 选择 Codex 的最主要原因。两者在 GitHub 上的表现差异显著:
| 方面 | Codex | Claude Code |
|---|---|---|
| PR 审查质量 | 能发现团队会错过的真正有难度的 Bug | 评论冗长但找不到明显的 Bug |
| 交互方式 | 行内评论,可要求修复,在后台运行,可直接合并 | 无法以有效方式要求修复 |
| Issue 处理 | 可 @Codex 在任何 Issue 或 PR 中直接接手 | 不支持 Issue 中的 @ 处理 |
| 与 CLI 一致性 | GitHub UI 与 CLI 使用相同的提示词、模型和配置 | 行为存在差异 |
Builder.io 的评价是:Codex 的 GitHub 集成「从发现问题到修复的闭环无缝衔接」,而 Claude Code 的集成「体验糟糕」。
Builder.io 的团队工作流(不局限于终端用户):
- 设计师直接在 Builder.io 中通过提示词和类 Figma 可视化编辑器使用 Codex 更新站点和应用
- 完成后直接发送 PR,工程师审查合并
- 所有人使用相同的代码库、相同的模型、相同的
AGENTS.md
常见问题解答
2026 年 Codex 是否仍然优于 Claude Code?
Codex 在 GitHub 集成和定价上仍然胜出。但 Claude Code 已显著缩小差距——更好的 UX、VS Code 扩展、网页 IDE 和 Cowork 模式。如何选择取决于工作流:重度终端用户、重视 GitHub 自动化选 Codex;需要更多配置选项和 hooks 选 Claude Code。
预算有限选哪个?
Codex Pro 性价比更高——更低的价位获得更多用量,同时捆绑 ChatGPT、图像生成和视频生成,而不仅仅是编程计划。
可以同时使用两者吗?
可以,很多团队也这样做——用 Codex 处理后台 GitHub 任务,用 Claude Code 处理终端会话(需要更多 slash commands 和 hooks)。
Cursor 仍然相关吗?
仍然相关。Cursor 在 IDE 体验上仍然领先,对从 VS Code 转过来的开发者最熟悉。Bugbot 在代码审查上也表现出色。
Claude Code 仍然不支持 AGENTS.md 吗?
截至本文写作时确认,Claude Code 仅支持 CLAUDE.md。如果想一个指令文件通用于所有工具,为 Codex、Cursor、Builder.io 使用 AGENTS.md,再为 Claude Code 维护一份同步的 CLAUDE.md。
三个工具可以一起用吗?
可以。Builder.io 的做法是:在视觉层之上使用这些智能体,设计师和产品经理不需要在终端操作,通过类 Figma 编辑器与 Codex 或 Claude Code 交互,所有人最终在同一个代码库上工作,PR 从另一端出来。
与 Claude Code 的协同工作流(r/ClaudeCode 社区讨论)
r/ClaudeCode 上的讨论「Best way to combine Claude Code with Codex in real workflows?」 补充了「两者如何放进同一条日常工作流」的实践与坑点,可与上文 Builder.io 的对比对照阅读。
- 常见分工:不少实践者认为 Claude Code 更擅长深度推理、大范围重构与复杂代码库理解;Codex 在快速落地实现、与 ChatGPT / OpenAI 工具链衔接上更顺手。二者可按任务切换,也可串联成一条流水线。
- 编排器模式:在 Claude Code 里用 Skill 或
CLAUDE.md把 Claude 当作编排者——由 Claude 拆解任务,需要实现时再显式调用 Codex CLI,并把约束与上下文写进交接提示。若 Codex 在交互中频繁等待确认,需配合合适的审批 / 自动化策略,避免卡在权限循环。讨论中有人用类似「子代理编排」的思路类比(例如参考 copilot-orchestra 这类编排实验)。 - 「一写一审」:更轻量的做法是 一个主写、另一个专审(例如 Claude 主笔、Codex 做独立审查,或反之);也有人再并行挂第三方的只读 CLI 做补充审查。社区经验是:审查侧宜只读、针对 diff,避免多工具同时改写同一工作树。
- 交接处的上下文流失:帖子里较一致的观察是——瓶颈常常不在「哪个模型更强」,而在「交接后上下文变窄」:Claude 产出的详细推理与取舍,经摘要交给 Codex 后,后者容易丢失「为何否决某条路径」等细节。缓解方式包括:交接提示里显式写出约束、风险区、已拒绝方案;或把实现与审查固定在同一仓库 / worktree 的步骤里,减少口头搬运。
- 官方插件:OpenAI 维护的 codex-plugin-cc 可在 Claude Code 会话内通过
/codex:review、/codex:rescue等命令把 Codex 作为「第二意见」做审查或委托,与 CLI 共用本机安装与登录状态。概述可参考社区文章 Claude Code + Codex Plugin(DEV Community)。 - 其他社区提到的方向(需自行评估维护状况与适用场景):在同一目录分别开 Claude Code 与 Codex、会话末同步
CLAUDE.md与AGENTS.md;多后端编排类工具(如讨论中提到的 kodo、claude-octopus);通过 MCP 把协作命令挂进 Claude Code(如讨论中提到的 claude-co-commands);以及 ensemble 等多智能体在 tmux 中协作的实验项目。另有多模型审查的 相关帖子 讨论在CLAUDE.md中用并行 CLI 做只读审查,可与本帖思路对照。
快速上手
第一步:选择接入方式
| 场景 | 推荐方式 |
|---|---|
| 多项目并行、团队协作 | Codex App |
| 终端重度用户、自动化脚本 | Codex CLI |
| IDE 内联使用、不切换上下文 | IDE 插件 |
| 云端任务、远程协作、PR 自动化 | 网页版 |
| 接入自有系统 | Codex SDK |
第二步:连接 ChatGPT 账号
所有接入方式均支持使用 ChatGPT 账号登录(Plus/Pro/Business/Edu/Enterprise)或 OpenAI API Key 登录。使用 API Key 时部分功能(如 Cloud Threads)可能不可用。
第三步:创建 Git 检查点
Codex 会修改代码库,建议在每个任务前后创建 Git checkpoint 方便回滚:
git checkout -b feature/codex-task-1
# 任务完成后
git checkout main && git branch -D feature/codex-task-1
第四步:编写 AGENTS.md(推荐)
在项目根目录创建 AGENTS.md,定义 Codex 在该项目中应遵循的规范、代码风格、常用命令等。Codex 会自动读取并遵循。例如本博客仓库的 CLAUDE.md 就是类似作用。详见 Builder.io 的 AGENTS.md 指南。
第五步(可选):安装 Superpowers 插件
若希望 Codex 在复杂功能开发时自动走「设计 → 计划 → TDD → 审查」流程,可在 CLI 或 App 中安装 Superpowers 插件(/plugins 搜索 superpowers)。端到端示例与可复制口令见 Superpowers 使用指南.
准备好后,前往参考资料获取所有官方资源链接。
