甚至一些低级问题,比如一行注释不写,不知道自己生成单元测试,额外多写几个不必要的类出来,也不向我逐个确认要点
甚至一些低级问题,比如一行注释不写,不知道自己生成单元测试,额外多写几个不必要的类出来,也不向我逐个确认要点
1
linbenyi PRO 可能也是定价的底气吧。
|
2
allgy 1 day ago
还行啊,约束条件给得多,codex 也能变 claude
|
3
hengxiangbianhua 1 day ago via Android
我也觉得 codex 不太行,现在各种模型价格差不了多少,能力确实天差地别
|
4
billccn 1 day ago
这两家同档次的模型实际能力差不多,但是系统提示词的优化方向不一样。建议你的偏好写到你的 AI 工具的自定义提示词里面。
另外我记得两家的系统提示词都有避免向用户确认、尽量猜测用户意图的指示。这应该是想避免对话频繁中断浪费导致上下文被踢出缓存。你需要确认的话就自定义呗。 |
6
chengkai1853 1 day ago 和你感觉相反,Codex 比 Claude 细致太多了
|
7
niubee1 1 day ago 感觉现在有些人动辄非 Claude 不能干活,我就怀疑你是搞什么外星科技呢,离开 Claude 你就是个瘸子了?不会干活了?
|
8
lightryanking 1 day ago
一起用 codex5.5 fable 都很好;
谷歌 gemini 啥的就拉跨了 |
9
yzw7489757 1 day ago
电油之争?别比谁最好,差的是使用习惯和姿势。
相反,我觉得 codex 比 claude 更好操作,边界也相对可控。 |
10
noahliaszn 1 day ago 都差不多 claude 爱说废话, codex 喜欢很快就开始干写一堆没用的 helper
2 个一起用一个做 plan 一个做 execute |
11
lianyue 1 day ago
codex 很喜欢自己写代码 都不知道用依赖 不知道去找 github
然后 代码 很乱真的很乱 功能文件 输入输出 接口等都不清晰 代码到处放 连 cursor 的 auto 都不如 真的 结构性一点都不如他 但是基础功没问题 缺调教 AGENTS.md 要约束的规则偏多很多 吧 AGENTS.md 写好 我觉得边界会很清晰 现在 我 AGENTS.md 强制了 4 个文档 TESTING.md README.md FLOW.mmd AGENTS.md 叫他动手之前有必看 并且 前三个文档是必须的 改动了必须对齐 尤其是 flow.mmd 流程图 基本我 不看内部代码 只看流程图+ 输入输出接口 和输入输出约束就行了 |
12
yzw7489757 1 day ago
楼上,一堆错别字...
|
13
canyue7897 1 day ago
跟楼主相反
codex 是唯一一个能严格按照我的要求干完活儿的 其余的或多或少都会偷懒 |
14
ebushicao 1 day ago
Codex 最近确实很笨,降智严重。不过一行注释不写不是什么问题吧,vibe coding 没注释更好吧,agent 自己去看代码比被注释带偏好多了
|
15
kuhung 1 day ago
Codex 比较喜欢写防御性编程,生成一大堆假设。
|
16
Cloudiver 1 day ago
@chengkai1853 同意,claude 虽然落地快,但 bug 很多。GPT 相对严谨、细心很多
|
17
Jamieyang 1 day ago
Codex 不是蠢,是懒。比 Claude 更懒就用得更累
|
18
zuosiruan 1 day ago via iPhone
@chengkai1853 +1 codex 很多时候考虑的比 claude 要好的多,尤其是和 opus4.8 比
|
19
wolfie 1 day ago
gpt-5.4/5.5 指令依从度太差,而且经常丢上下文。
|
20
PerFectTime 1 day ago 有什么好争的, 我觉得是人的问题
|
21
little_cup 1 day ago
我的感受是,Codex 系列更适合于依据长文档进行开发; Claude 系列更适合许愿式开发。
当然,Fable 5 确实是目前综合性能最强的。Codex 老爱写过度的防御式编程。但是同样价格,Codex 量实在多太多了。 |
22
wonderfulcxm 1 day ago via iPhone
@lianyue codex 写代码不是项目决定的吗?相反,我觉得 codex 很爱参考代码,比如写一个 wordpress 插件,它会参考我之前写的插件,结构和代码风格保持高度一致。
|
23
HappyAndSmile 1 day ago
codex 确实是比 Claude code 差很多的,只能通过建立自己的经验.md ,让它弥补自身的缺陷
|
24
v2gba 1 day ago
opus 也傻逼
只是 fable 暂时独一档而已 看看 5.6 吧 |
25
fovecifer 1 day ago
GPT5.5 目前写代码是性价比最高的
Opus 比较适合做架构之类的工作 |
26
KING754 1 day ago
真的没有人用 cursor 吗?
量大,各种模型可以随心所欲。 可视化 UI ,操作简单。 |
27
zhuang0718 1 day ago
主要是最近降智的原因吧
|
28
noqwerty 23h 55m ago 叽里咕噜说啥呢,反正都比我聪明多了
|
29
ifconfig 22h 7m ago
codex:现在重跑同一个 suite ,看 10 个测试是否全部通过,尤其是刚才红的那条
|
30
DefoliationM 21h 27m ago via Android
不觉得,挺好用的,不过写前端不咋地,后端完全按照我的要求来。
|
31
1874w 19h 17m ago 我个人觉得大部分是人的问题.
如果始终是许愿式开发.评价体系为 AI 能一次猜到你想的 = 聪明,猜不到 = 不聪明 那任何模型应该都存在这个问题,除非他能接你的脑机接口,知道你脑子里的全部上下文 而且由于变量的不同,会有一些可能存在的错误判断. 比如在 Claude 中聊问题 A, 发现他能很快明白你的描述,解决你的问题. 后面 换到到 Codex 时,聊的是问题 B,但是他没能立马明白你的描述,得聊多轮才能解决你的问题 所以得出的结论: Claude 比 Codex 聪明.或者 Codex 降智严重 但实际上有可能同样的提示词放到 Claude 中也未必能立马解决问题 B ========================================================== 所以我个人感觉许愿式开发,总的来说是不稳定的,除了模型本身的能力是一个影响因素外,一个相对稳定的工作流是很重要的, 最重要的就是得让 AI 知道你当前问题的足够上下文. 理论来说用能力相对低一些的模型 + 稳定工作流 也能解决你的问题. superpowers 的 Brainstorming SKILL 本身的设计理念,就大概是这个意思. 当然毕竟它比较重和费 Token,不是所有问题都得用 superpowers 来解决. 所以 AGENTS.md/CLAUDE.md 和一些你本地的文档,都是非常重要的上下文. 我日常使用时,基本都会让 AI 把稳定的流程固定成本地文档. 例如和他聊完当前项目是怎么部署的,怎么修 bug 的,项目的架构等等文档,都可以在聊完之后让他沉淀成固定文档.下次让他读这些文档就知道怎么开始了. 之前在 X 上也看到一个方法论: 在和 AI 聊完和并改完 BUG 之后,可以再最后问 AI 一句: 如果回到一开始,我该怎么和你描述,你才能一次性解决这个问题 感觉可以试试,也能学习到该如何和 AI 进行交流 |
32
germain 19h 12m ago 这个行业已经从单纯的歧视印度程序员沦落到了歧视 Codex 了。很多人都不曾问过自己,如果现在失业去面试,自己在面试桌上是个什么样的角色。
|
33
1874w 19h 11m ago
@1874w 如果这些本地文档不想提交到远端仓库 或者 污染提交历史,可以参考我的这篇博客来设置 git 忽略
这样 Vibe Coing 过程中产生的项目本地文档, 甚至可以放更多私人流程和信息,而不用考虑会被 AI 提交到远端仓库 https://blog.1874.cool/vibe-coding-mid-doc |
34
1874w 18h 56m ago
@little_cup 我感觉 你可以总结下他的 过度的防御式编程 规则,然后把不想要的规则写进本地文档,然后在一开始聊天时让他读一下,放到上下文应该能解决一部分
|
35
Yasuke 14h 7m ago
反正我两个都用,codex 比 cc 好多了,就是 codex 写 ui 简直让人眼前一黑
|
36
nVic 14h 6m ago
他俩严格来说不是一类工具。
|
38
mywind 13h 51m ago
我感觉可能和上下文信息有关,如果一个工具用久了,积累了相对多的上下文信息,用起来就会顺手很多,这时候再用另一个就会感觉不太顺手。
我个人用 Codex 多一下,个人的感受 Codex 相对细致,但也更循规蹈矩,Claude 对一些开放性问题会相对有洞察一些,但是也喜欢自嗨。两个都不能突破使用者本身能力的上限,会逐渐适配出一套看着好像是那么回事并且讨喜的回答模式。 |
39
Meteora626 13h 39m ago
codex 上下文管理一绝好吧,远程压缩一个上下文记录好多东西 和大模型压缩一个天一个地
|
40
nebulabox 13h 30m ago
和你感觉相反,Codex 比 Claude 好用
|
41
potatowish 13h 28m ago via iPhone
codex 就是缺少一点灵性。写代码比较死板,严谨过头,它甚至改个注释都要给我重新编译一遍。
|
42
houOne 13h 12m ago
codex 比我聪明很多,就挺好的。 我也想用 claude 用不上~
|
43
NASK 12h 57m ago
首先确认一下你的 codex 推理等级是不是 xhigh
|
44
Mandelo 12h 55m ago 但是奥特曼不封号
|
45
Bluecoda 12h 49m ago
并没有,只要 context 足够小,足够窄,并不觉得 codex 比 cc 差多少
|
46
malatang 12h 44m ago
没有啊
|
47
hengxiangbianhua 12h 39m ago via Android
@NASK 我觉得 xhigh 反而不好
|
48
rb6221 12h 39m ago
都别吵了,大家一样烂,要我说最强的还得是古法编程[doge]
|
49
NullIsLife PRO 能畅饮 cc 的会用 codex 吗
|
50
clemente 11h 47m ago
@NullIsLife 我都用啊
|
51
lovelyidiot 11h 25m ago
codex 65 分,claude 75 分,差不多就这样。前者比一半以上人强,后者比 3/4 以上人强。65 分就是有经验、能做,做的也就那样,没新意。75 分就是能做,明显比大部分人做的更好,但做不了 85 分人能做到的程度。
|
52
bojue 11h 20m ago
@lightryanking 北美豆包
|
53
keenkiller 10h 49m ago via Android
codex 确实不写注释,你要跟他说他才会补
|
54
fatigue 10h 39m ago
恰恰相反,claude 一个对话刚开始还好,用着用着就开始退化,最后会困在某个点死活出不来,codex 整体性要好很多,很少会卡住
|
55
Isuxiz 9h 17m ago
codex 现在有个 bug ,症状是固定 516 reasoning token ,体验就是模型降智很厉害
https://github.com/openai/codex/issues/30364 等修复吧 |
56
ooppstef 9h 10m ago
我的天?居然会有人觉得 claude 比 gpt 强? 推理能力完全不在一个层级好吧。。。疯了,当然 gpt 的前端能力很弱,这个 gpt 自己也承认,但推理,review ,找 bug ,写代码的严谨性,把 claude 吊起来打啊。
不过降智了,就没什么好聊的。。。 |
57
NullIsLife PRO @clemente #50 能说说在畅饮 cc 的情况下,什么场景你会想用 codex
|
58
diaoyulao 7h 44m ago
两个都在用,Claude code 适合当军师,Codex 适合干苦力,一个出谋划策做监工,一个猛猛干
|
59
xidaduo 7h 33m ago
Claude 在出方案和产品思路方面比 Codex 好太多,Codex 干有详细文档和计划的活比较稳定,在执行层面比较靠谱。一个胜在创新想法,一个胜在干活稳定、使用也更稳定
|
60
MuyuQ 7h 30m ago
我的 codex 会写一大堆单元测试。。有时候我不得不中断他的任务,告诉他别写那么多,费的是我的 token 。
|
61
smileeast 7h 17m ago
@1874w #31 superpowers 这个太费 token 了,我现在用 https://github.com/mattpocock/skills 这个 skill ,这个 skill 的一个 grill-me 就是解决沟通的问题。如果能和 AI 能把事情沟通明白了,那么人际沟通这一块也会强很多。我们想的>我们表达的>对方想的>对方执行,这是四个层级,很多人想的是直接从我想的就变成执行层,这明显是有问题的。
|
62
elevioux 6h 47m ago
|
64
Jamieyang 6h 33m ago
个人感觉
智商:GPT > Claude 写代码: GPT > Claude Review: GPT > Claude 灵性:Claude > GPT 业务理解/认知:Claude > GPT 运维能力:Claude > GPT 只能说各有长处,使用场景不一样。GPT 合适纯后端,Claude 合适 DevOps 这种跨界工种 |
65
x4gz 5h 27m ago
他们写不出来原因主要是我的提示词不够细致
结论:我最笨 |
66
yooomu 5h 22m ago
claude 考虑事情没有 codex 全面,经常丢三落四。只要需求描述清楚,codex 几乎不会返工,测都不用测。claude 适合不清楚怎么做的时候进行需求发散
|
67
ximaoyang 4h 58m ago
codex 确实很笨,目前智能水平 claude code > deepseek > codex
|
68
deplives 4h 0m ago
claude 才是一坨,俩月前 opus4.8 /simplify 把原本至少能编译通过的 swift 代码改的乱七八糟,编译都失败,最后好不容易编译过了,app 启动就 crash 最后 5h 用完了也没给修好
codex 5.5 用了一次对话就找到原因并且修复了,然后第二个月就退订了 claude 订阅了 codex 5x |
69
techmale 1h 28m ago via iPhone
Skill Issue (pun intended
|
70
imdoge 1h 1m ago
复杂的 codex 做的更细(虽然也有冗余设计风险)
不降智来说,大概就是 opus4.8 是高考 660 分但做事不够全如果你的代码很屎山各种耦合很多,他可能不看够全,gpt5.5 是高考 650 分但肯给你花半小时认真全面做一件事 |