真的没人觉得 codex 比 claude 笨很多吗？

70 replies • 2026-07-03 21:55:32 +08:00

1

linbenyi

PRO

1 day ago

可能也是定价的底气吧。

2

allgy

1 day ago

还行啊，约束条件给得多，codex 也能变 claude

3

hengxiangbianhua

1 day ago via Android

我也觉得 codex 不太行，现在各种模型价格差不了多少，能力确实天差地别

4

billccn

1 day ago

这两家同档次的模型实际能力差不多，但是系统提示词的优化方向不一样。建议你的偏好写到你的 AI 工具的自定义提示词里面。

另外我记得两家的系统提示词都有避免向用户确认、尽量猜测用户意图的指示。这应该是想避免对话频繁中断浪费导致上下文被踢出缓存。你需要确认的话就自定义呗。

5

banricho

1 day ago

不觉得，持续优化项目的 AGENTS.md ，一次性把话说清楚最重要

6

chengkai1853

1 day ago

10

和你感觉相反，Codex 比 Claude 细致太多了

7

niubee1

1 day ago

3

感觉现在有些人动辄非 Claude 不能干活，我就怀疑你是搞什么外星科技呢，离开 Claude 你就是个瘸子了？不会干活了？

8

lightryanking

1 day ago

一起用 codex5.5 fable 都很好；

谷歌 gemini 啥的就拉跨了

9

yzw7489757

1 day ago

电油之争？别比谁最好，差的是使用习惯和姿势。

相反，我觉得 codex 比 claude 更好操作，边界也相对可控。

10

noahliaszn

1 day ago

1

都差不多 claude 爱说废话, codex 喜欢很快就开始干写一堆没用的 helper
2 个一起用一个做 plan 一个做 execute

11

lianyue

1 day ago

codex 很喜欢自己写代码都不知道用依赖不知道去找 github
然后代码很乱真的很乱功能文件输入输出接口等都不清晰代码到处放
连 cursor 的 auto 都不如真的结构性一点都不如他
但是基础功没问题缺调教 AGENTS.md 要约束的规则偏多很多
吧 AGENTS.md 写好
我觉得边界会很清晰
现在我 AGENTS.md 强制了 4 个文档
TESTING.md README.md FLOW.mmd AGENTS.md
叫他动手之前有必看
并且前三个文档是必须的改动了必须对齐尤其是 flow.mmd 流程图基本我不看内部代码只看流程图+ 输入输出接口和输入输出约束就行了

12

yzw7489757

1 day ago

楼上，一堆错别字...

13

canyue7897

1 day ago

跟楼主相反
codex 是唯一一个能严格按照我的要求干完活儿的
其余的或多或少都会偷懒

14

ebushicao

1 day ago

Codex 最近确实很笨，降智严重。不过一行注释不写不是什么问题吧，vibe coding 没注释更好吧，agent 自己去看代码比被注释带偏好多了

15

kuhung

1 day ago

Codex 比较喜欢写防御性编程，生成一大堆假设。

16

Cloudiver

1 day ago

@chengkai1853 同意，claude 虽然落地快，但 bug 很多。GPT 相对严谨、细心很多

17

Jamieyang

1 day ago

Codex 不是蠢，是懒。比 Claude 更懒就用得更累

18

zuosiruan

1 day ago via iPhone

@chengkai1853 +1 codex 很多时候考虑的比 claude 要好的多，尤其是和 opus4.8 比

19

wolfie

1 day ago

gpt-5.4/5.5 指令依从度太差，而且经常丢上下文。

20

PerFectTime

1 day ago

3

有什么好争的, 我觉得是人的问题

21

little_cup

1 day ago

我的感受是，Codex 系列更适合于依据长文档进行开发； Claude 系列更适合许愿式开发。
当然，Fable 5 确实是目前综合性能最强的。Codex 老爱写过度的防御式编程。但是同样价格，Codex 量实在多太多了。

22

wonderfulcxm

1 day ago via iPhone

@lianyue codex 写代码不是项目决定的吗？相反，我觉得 codex 很爱参考代码，比如写一个 wordpress 插件，它会参考我之前写的插件，结构和代码风格保持高度一致。

23

HappyAndSmile

1 day ago

codex 确实是比 Claude code 差很多的，只能通过建立自己的经验.md ，让它弥补自身的缺陷

24

v2gba

1 day ago

opus 也傻逼

只是 fable 暂时独一档而已看看 5.6 吧

25

fovecifer

1 day ago

GPT5.5 目前写代码是性价比最高的
Opus 比较适合做架构之类的工作

26

KING754

1 day ago

真的没有人用 cursor 吗？
量大，各种模型可以随心所欲。
可视化 UI ，操作简单。

27

zhuang0718

1 day ago

主要是最近降智的原因吧

28

noqwerty

23h 55m ago

5

叽里咕噜说啥呢，反正都比我聪明多了

29

ifconfig

22h 7m ago

codex:现在重跑同一个 suite ，看 10 个测试是否全部通过，尤其是刚才红的那条

30

DefoliationM

21h 27m ago via Android

不觉得，挺好用的，不过写前端不咋地，后端完全按照我的要求来。

31

1874w

19h 17m ago

4

我个人觉得大部分是人的问题.

如果始终是许愿式开发.评价体系为 AI 能一次猜到你想的 = 聪明,猜不到 = 不聪明

那任何模型应该都存在这个问题,除非他能接你的脑机接口,知道你脑子里的全部上下文

而且由于变量的不同,会有一些可能存在的错误判断.

比如在 Claude 中聊问题 A, 发现他能很快明白你的描述,解决你的问题.

后面换到到 Codex 时,聊的是问题 B,但是他没能立马明白你的描述,得聊多轮才能解决你的问题

所以得出的结论: Claude 比 Codex 聪明.或者 Codex 降智严重

但实际上有可能同样的提示词放到 Claude 中也未必能立马解决问题 B

==========================================================

所以我个人感觉许愿式开发,总的来说是不稳定的,除了模型本身的能力是一个影响因素外,一个相对稳定的工作流是很重要的, 最重要的就是得让 AI 知道你当前问题的足够上下文.

理论来说用能力相对低一些的模型 + 稳定工作流也能解决你的问题.

superpowers 的 Brainstorming SKILL 本身的设计理念,就大概是这个意思. 当然毕竟它比较重和费 Token,不是所有问题都得用 superpowers 来解决.

所以 AGENTS.md/CLAUDE.md 和一些你本地的文档,都是非常重要的上下文.

我日常使用时,基本都会让 AI 把稳定的流程固定成本地文档.

例如和他聊完当前项目是怎么部署的,怎么修 bug 的,项目的架构等等文档,都可以在聊完之后让他沉淀成固定文档.下次让他读这些文档就知道怎么开始了.

之前在 X 上也看到一个方法论:

在和 AI 聊完和并改完 BUG 之后,可以再最后问 AI 一句: 如果回到一开始,我该怎么和你描述,你才能一次性解决这个问题

感觉可以试试,也能学习到该如何和 AI 进行交流

32

germain

19h 12m ago

2

这个行业已经从单纯的歧视印度程序员沦落到了歧视 Codex 了。很多人都不曾问过自己，如果现在失业去面试，自己在面试桌上是个什么样的角色。

33

1874w

19h 11m ago

@1874w 如果这些本地文档不想提交到远端仓库或者污染提交历史,可以参考我的这篇博客来设置 git 忽略

这样 Vibe Coing 过程中产生的项目本地文档, 甚至可以放更多私人流程和信息,而不用考虑会被 AI 提交到远端仓库

https://blog.1874.cool/vibe-coding-mid-doc

34

1874w

18h 56m ago

@little_cup 我感觉你可以总结下他的过度的防御式编程规则,然后把不想要的规则写进本地文档,然后在一开始聊天时让他读一下,放到上下文应该能解决一部分

35

Yasuke

14h 7m ago

反正我两个都用，codex 比 cc 好多了，就是 codex 写 ui 简直让人眼前一黑

36

nVic

14h 6m ago

他俩严格来说不是一类工具。

37

coreJK

14h 3m ago

@KING754 #26 之前用得多，但是 cursor 动不动就没响应了

38

mywind

13h 51m ago

我感觉可能和上下文信息有关，如果一个工具用久了，积累了相对多的上下文信息，用起来就会顺手很多，这时候再用另一个就会感觉不太顺手。
我个人用 Codex 多一下，个人的感受 Codex 相对细致，但也更循规蹈矩，Claude 对一些开放性问题会相对有洞察一些，但是也喜欢自嗨。两个都不能突破使用者本身能力的上限，会逐渐适配出一套看着好像是那么回事并且讨喜的回答模式。

39

Meteora626

13h 39m ago

codex 上下文管理一绝好吧，远程压缩一个上下文记录好多东西和大模型压缩一个天一个地

40

nebulabox

13h 30m ago

和你感觉相反，Codex 比 Claude 好用

41

potatowish

13h 28m ago via iPhone

codex 就是缺少一点灵性。写代码比较死板，严谨过头，它甚至改个注释都要给我重新编译一遍。

42

houOne

13h 12m ago

codex 比我聪明很多，就挺好的。我也想用 claude 用不上~

43

NASK

12h 57m ago

首先确认一下你的 codex 推理等级是不是 xhigh

44

Mandelo

12h 55m ago

1

但是奥特曼不封号

45

Bluecoda

12h 49m ago

并没有，只要 context 足够小，足够窄，并不觉得 codex 比 cc 差多少

46

malatang

12h 44m ago

没有啊

47

hengxiangbianhua

12h 39m ago via Android

@NASK 我觉得 xhigh 反而不好

48

rb6221

12h 39m ago

都别吵了，大家一样烂，要我说最强的还得是古法编程[doge]

49

NullIsLife

PRO

12h 35m ago

能畅饮 cc 的会用 codex 吗

50

clemente

11h 47m ago

@NullIsLife 我都用啊

51

lovelyidiot

11h 25m ago

codex 65 分，claude 75 分，差不多就这样。前者比一半以上人强，后者比 3/4 以上人强。65 分就是有经验、能做，做的也就那样，没新意。75 分就是能做，明显比大部分人做的更好，但做不了 85 分人能做到的程度。

52

bojue

11h 20m ago

@lightryanking 北美豆包

53

keenkiller

10h 49m ago via Android

codex 确实不写注释，你要跟他说他才会补

54

fatigue

10h 39m ago

恰恰相反，claude 一个对话刚开始还好，用着用着就开始退化，最后会困在某个点死活出不来，codex 整体性要好很多，很少会卡住

55

Isuxiz

9h 17m ago

codex 现在有个 bug ，症状是固定 516 reasoning token ，体验就是模型降智很厉害
https://github.com/openai/codex/issues/30364
等修复吧

56

ooppstef

9h 10m ago

我的天？居然会有人觉得 claude 比 gpt 强？推理能力完全不在一个层级好吧。。。疯了，当然 gpt 的前端能力很弱，这个 gpt 自己也承认，但推理，review ，找 bug ，写代码的严谨性，把 claude 吊起来打啊。

不过降智了，就没什么好聊的。。。

57

NullIsLife

PRO

8h 52m ago

@clemente #50 能说说在畅饮 cc 的情况下，什么场景你会想用 codex

58

diaoyulao

7h 44m ago

两个都在用，Claude code 适合当军师，Codex 适合干苦力，一个出谋划策做监工，一个猛猛干

59

xidaduo

7h 33m ago

Claude 在出方案和产品思路方面比 Codex 好太多，Codex 干有详细文档和计划的活比较稳定，在执行层面比较靠谱。一个胜在创新想法，一个胜在干活稳定、使用也更稳定

60

MuyuQ

7h 30m ago

我的 codex 会写一大堆单元测试。。有时候我不得不中断他的任务，告诉他别写那么多，费的是我的 token 。

61

smileeast

7h 17m ago

@1874w #31 superpowers 这个太费 token 了，我现在用 https://github.com/mattpocock/skills 这个 skill ，这个 skill 的一个 grill-me 就是解决沟通的问题。如果能和 AI 能把事情沟通明白了，那么人际沟通这一块也会强很多。我们想的>我们表达的>对方想的>对方执行，这是四个层级，很多人想的是直接从我想的就变成执行层，这明显是有问题的。

62

elevioux

6h 47m ago

你们拿到就用的吗？没有全局的 agents.md ？我都是写了一堆约束的。例如，写 docblock ，不要兜底，需求要反复确认后给出计划。

虽然还是时不时会抽风，但要比不加约束好很多。

63

1874w

6h 43m ago

@smileeast 可以，我试试你这个。我目前 Token 比较充足，所以还在用，只不过很少用它来走完整流程。

64

Jamieyang

6h 33m ago

个人感觉

智商：GPT > Claude
写代码: GPT > Claude
Review: GPT > Claude
灵性：Claude > GPT
业务理解/认知：Claude > GPT
运维能力：Claude > GPT

只能说各有长处，使用场景不一样。GPT 合适纯后端，Claude 合适 DevOps 这种跨界工种

65

x4gz

5h 27m ago

他们写不出来原因主要是我的提示词不够细致
结论：我最笨

66

yooomu

5h 22m ago

claude 考虑事情没有 codex 全面，经常丢三落四。只要需求描述清楚，codex 几乎不会返工，测都不用测。claude 适合不清楚怎么做的时候进行需求发散

67

ximaoyang

4h 58m ago

codex 确实很笨，目前智能水平 claude code > deepseek > codex

68

deplives

4h 0m ago

claude 才是一坨，俩月前 opus4.8 /simplify 把原本至少能编译通过的 swift 代码改的乱七八糟，编译都失败，最后好不容易编译过了，app 启动就 crash 最后 5h 用完了也没给修好
codex 5.5 用了一次对话就找到原因并且修复了，然后第二个月就退订了 claude 订阅了 codex 5x

69

techmale

1h 28m ago via iPhone

Skill Issue (pun intended

70

imdoge

1h 1m ago

复杂的 codex 做的更细（虽然也有冗余设计风险）
不降智来说，大概就是 opus4.8 是高考 660 分但做事不够全如果你的代码很屎山各种耦合很多，他可能不看够全，gpt5.5 是高考 650 分但肯给你花半小时认真全面做一件事