• 请不要在回答技术问题时复制粘贴 AI 生成的内容
yaocy
V2EX  ›  程序员

真的没人觉得 codex 比 claude 笨很多吗?

  •  1
     
  •   yaocy · 1 day ago via Android · 8193 views

    甚至一些低级问题,比如一行注释不写,不知道自己生成单元测试,额外多写几个不必要的类出来,也不向我逐个确认要点

    70 replies    2026-07-03 21:55:32 +08:00
    linbenyi
        1
    linbenyi  
    PRO
       1 day ago
    可能也是定价的底气吧。
    allgy
        2
    allgy  
       1 day ago
    还行啊,约束条件给得多,codex 也能变 claude
    hengxiangbianhua
        3
    hengxiangbianhua  
       1 day ago via Android
    我也觉得 codex 不太行,现在各种模型价格差不了多少,能力确实天差地别
    billccn
        4
    billccn  
       1 day ago
    这两家同档次的模型实际能力差不多,但是系统提示词的优化方向不一样。建议你的偏好写到你的 AI 工具的自定义提示词里面。

    另外我记得两家的系统提示词都有避免向用户确认、尽量猜测用户意图的指示。这应该是想避免对话频繁中断浪费导致上下文被踢出缓存。你需要确认的话就自定义呗。
    banricho
        5
    banricho  
       1 day ago
    不觉得,持续优化项目的 AGENTS.md ,一次性把话说清楚最重要
    chengkai1853
        6
    chengkai1853  
       1 day ago   ❤️ 10
    和你感觉相反,Codex 比 Claude 细致太多了
    niubee1
        7
    niubee1  
       1 day ago   ❤️ 3
    感觉现在有些人动辄非 Claude 不能干活,我就怀疑你是搞什么外星科技呢,离开 Claude 你就是个瘸子了?不会干活了?
    lightryanking
        8
    lightryanking  
       1 day ago
    一起用 codex5.5 fable 都很好;

    谷歌 gemini 啥的就拉跨了
    yzw7489757
        9
    yzw7489757  
       1 day ago
    电油之争?别比谁最好,差的是使用习惯和姿势。

    相反,我觉得 codex 比 claude 更好操作,边界也相对可控。
    noahliaszn
        10
    noahliaszn  
       1 day ago   ❤️ 1
    都差不多 claude 爱说废话, codex 喜欢很快就开始干写一堆没用的 helper
    2 个一起用一个做 plan 一个做 execute
    lianyue
        11
    lianyue  
       1 day ago
    codex 很喜欢自己写代码 都不知道用依赖 不知道去找 github
    然后 代码 很乱真的很乱 功能文件 输入输出 接口等都不清晰 代码到处放
    连 cursor 的 auto 都不如 真的 结构性一点都不如他
    但是基础功没问题 缺调教 AGENTS.md 要约束的规则偏多很多
    AGENTS.md 写好
    我觉得边界会很清晰
    现在 我 AGENTS.md 强制了 4 个文档
    TESTING.md README.md FLOW.mmd AGENTS.md
    叫他动手之前有必看
    并且 前三个文档是必须的 改动了必须对齐 尤其是 flow.mmd 流程图 基本我 不看内部代码 只看流程图+ 输入输出接口 和输入输出约束就行了
    yzw7489757
        12
    yzw7489757  
       1 day ago
    楼上,一堆错别字...
    canyue7897
        13
    canyue7897  
       1 day ago
    跟楼主相反
    codex 是唯一一个能严格按照我的要求干完活儿的
    其余的或多或少都会偷懒
    ebushicao
        14
    ebushicao  
       1 day ago
    Codex 最近确实很笨,降智严重。不过一行注释不写不是什么问题吧,vibe coding 没注释更好吧,agent 自己去看代码比被注释带偏好多了
    kuhung
        15
    kuhung  
       1 day ago
    Codex 比较喜欢写防御性编程,生成一大堆假设。
    Cloudiver
        16
    Cloudiver  
       1 day ago
    @chengkai1853 同意,claude 虽然落地快,但 bug 很多。GPT 相对严谨、细心很多
    Jamieyang
        17
    Jamieyang  
       1 day ago
    Codex 不是蠢,是懒。比 Claude 更懒就用得更累
    zuosiruan
        18
    zuosiruan  
       1 day ago via iPhone
    @chengkai1853 +1 codex 很多时候考虑的比 claude 要好的多,尤其是和 opus4.8 比
    wolfie
        19
    wolfie  
       1 day ago
    gpt-5.4/5.5 指令依从度太差,而且经常丢上下文。
    PerFectTime
        20
    PerFectTime  
       1 day ago   ❤️ 3
    有什么好争的, 我觉得是人的问题
    little_cup
        21
    little_cup  
       1 day ago
    我的感受是,Codex 系列更适合于依据长文档进行开发; Claude 系列更适合许愿式开发。
    当然,Fable 5 确实是目前综合性能最强的。Codex 老爱写过度的防御式编程。但是同样价格,Codex 量实在多太多了。
    wonderfulcxm
        22
    wonderfulcxm  
       1 day ago via iPhone
    @lianyue codex 写代码不是项目决定的吗?相反,我觉得 codex 很爱参考代码,比如写一个 wordpress 插件,它会参考我之前写的插件,结构和代码风格保持高度一致。
    HappyAndSmile
        23
    HappyAndSmile  
       1 day ago
    codex 确实是比 Claude code 差很多的,只能通过建立自己的经验.md ,让它弥补自身的缺陷
    v2gba
        24
    v2gba  
       1 day ago
    opus 也傻逼

    只是 fable 暂时独一档而已 看看 5.6 吧
    fovecifer
        25
    fovecifer  
       1 day ago
    GPT5.5 目前写代码是性价比最高的
    Opus 比较适合做架构之类的工作
    KING754
        26
    KING754  
       1 day ago
    真的没有人用 cursor 吗?
    量大,各种模型可以随心所欲。
    可视化 UI ,操作简单。
    zhuang0718
        27
    zhuang0718  
       1 day ago
    主要是最近降智的原因吧
    noqwerty
        28
    noqwerty  
       23h 55m ago   ❤️ 5
    叽里咕噜说啥呢,反正都比我聪明多了
    ifconfig
        29
    ifconfig  
       22h 7m ago
    codex:现在重跑同一个 suite ,看 10 个测试是否全部通过,尤其是刚才红的那条
    DefoliationM
        30
    DefoliationM  
       21h 27m ago via Android
    不觉得,挺好用的,不过写前端不咋地,后端完全按照我的要求来。
    1874w
        31
    1874w  
       19h 17m ago   ❤️ 4
    我个人觉得大部分是人的问题.

    如果始终是许愿式开发.评价体系为 AI 能一次猜到你想的 = 聪明,猜不到 = 不聪明

    那任何模型应该都存在这个问题,除非他能接你的脑机接口,知道你脑子里的全部上下文

    而且由于变量的不同,会有一些可能存在的错误判断.

    比如在 Claude 中聊问题 A, 发现他能很快明白你的描述,解决你的问题.

    后面 换到到 Codex 时,聊的是问题 B,但是他没能立马明白你的描述,得聊多轮才能解决你的问题

    所以得出的结论: Claude 比 Codex 聪明.或者 Codex 降智严重

    但实际上有可能同样的提示词放到 Claude 中也未必能立马解决问题 B

    ==========================================================

    所以我个人感觉许愿式开发,总的来说是不稳定的,除了模型本身的能力是一个影响因素外,一个相对稳定的工作流是很重要的, 最重要的就是得让 AI 知道你当前问题的足够上下文.

    理论来说用能力相对低一些的模型 + 稳定工作流 也能解决你的问题.

    superpowers 的 Brainstorming SKILL 本身的设计理念,就大概是这个意思. 当然毕竟它比较重和费 Token,不是所有问题都得用 superpowers 来解决.

    所以 AGENTS.md/CLAUDE.md 和一些你本地的文档,都是非常重要的上下文.

    我日常使用时,基本都会让 AI 把稳定的流程固定成本地文档.

    例如和他聊完当前项目是怎么部署的,怎么修 bug 的,项目的架构等等文档,都可以在聊完之后让他沉淀成固定文档.下次让他读这些文档就知道怎么开始了.

    之前在 X 上也看到一个方法论:

    在和 AI 聊完和并改完 BUG 之后,可以再最后问 AI 一句: 如果回到一开始,我该怎么和你描述,你才能一次性解决这个问题

    感觉可以试试,也能学习到该如何和 AI 进行交流
    germain
        32
    germain  
       19h 12m ago   ❤️ 2
    这个行业已经从单纯的歧视印度程序员沦落到了歧视 Codex 了。很多人都不曾问过自己,如果现在失业去面试,自己在面试桌上是个什么样的角色。
    1874w
        33
    1874w  
       19h 11m ago
    @1874w 如果这些本地文档不想提交到远端仓库 或者 污染提交历史,可以参考我的这篇博客来设置 git 忽略

    这样 Vibe Coing 过程中产生的项目本地文档, 甚至可以放更多私人流程和信息,而不用考虑会被 AI 提交到远端仓库


    https://blog.1874.cool/vibe-coding-mid-doc
    1874w
        34
    1874w  
       18h 56m ago
    @little_cup 我感觉 你可以总结下他的 过度的防御式编程 规则,然后把不想要的规则写进本地文档,然后在一开始聊天时让他读一下,放到上下文应该能解决一部分
    Yasuke
        35
    Yasuke  
       14h 7m ago
    反正我两个都用,codex 比 cc 好多了,就是 codex 写 ui 简直让人眼前一黑
    nVic
        36
    nVic  
       14h 6m ago
    他俩严格来说不是一类工具。
    coreJK
        37
    coreJK  
       14h 3m ago
    @KING754 #26 之前用得多,但是 cursor 动不动就没响应了
    mywind
        38
    mywind  
       13h 51m ago
    我感觉可能和上下文信息有关,如果一个工具用久了,积累了相对多的上下文信息,用起来就会顺手很多,这时候再用另一个就会感觉不太顺手。
    我个人用 Codex 多一下,个人的感受 Codex 相对细致,但也更循规蹈矩,Claude 对一些开放性问题会相对有洞察一些,但是也喜欢自嗨。两个都不能突破使用者本身能力的上限,会逐渐适配出一套看着好像是那么回事并且讨喜的回答模式。
    Meteora626
        39
    Meteora626  
       13h 39m ago
    codex 上下文管理一绝好吧,远程压缩一个上下文记录好多东西 和大模型压缩一个天一个地
    nebulabox
        40
    nebulabox  
       13h 30m ago
    和你感觉相反,Codex 比 Claude 好用
    potatowish
        41
    potatowish  
       13h 28m ago via iPhone
    codex 就是缺少一点灵性。写代码比较死板,严谨过头,它甚至改个注释都要给我重新编译一遍。
    houOne
        42
    houOne  
       13h 12m ago
    codex 比我聪明很多,就挺好的。 我也想用 claude 用不上~
    NASK
        43
    NASK  
       12h 57m ago
    首先确认一下你的 codex 推理等级是不是 xhigh
    Mandelo
        44
    Mandelo  
       12h 55m ago   ❤️ 1
    但是奥特曼不封号
    Bluecoda
        45
    Bluecoda  
       12h 49m ago
    并没有,只要 context 足够小,足够窄,并不觉得 codex 比 cc 差多少
    malatang
        46
    malatang  
       12h 44m ago
    没有啊
    hengxiangbianhua
        47
    hengxiangbianhua  
       12h 39m ago via Android
    @NASK 我觉得 xhigh 反而不好
    rb6221
        48
    rb6221  
       12h 39m ago
    都别吵了,大家一样烂,要我说最强的还得是古法编程[doge]
    NullIsLife
        49
    NullIsLife  
    PRO
       12h 35m ago
    能畅饮 cc 的会用 codex 吗
    clemente
        50
    clemente  
       11h 47m ago
    @NullIsLife 我都用啊
    lovelyidiot
        51
    lovelyidiot  
       11h 25m ago
    codex 65 分,claude 75 分,差不多就这样。前者比一半以上人强,后者比 3/4 以上人强。65 分就是有经验、能做,做的也就那样,没新意。75 分就是能做,明显比大部分人做的更好,但做不了 85 分人能做到的程度。
    bojue
        52
    bojue  
       11h 20m ago
    @lightryanking 北美豆包
    keenkiller
        53
    keenkiller  
       10h 49m ago via Android
    codex 确实不写注释,你要跟他说他才会补
    fatigue
        54
    fatigue  
       10h 39m ago
    恰恰相反,claude 一个对话刚开始还好,用着用着就开始退化,最后会困在某个点死活出不来,codex 整体性要好很多,很少会卡住
    Isuxiz
        55
    Isuxiz  
       9h 17m ago
    codex 现在有个 bug ,症状是固定 516 reasoning token ,体验就是模型降智很厉害
    https://github.com/openai/codex/issues/30364
    等修复吧
    ooppstef
        56
    ooppstef  
       9h 10m ago
    我的天?居然会有人觉得 claude 比 gpt 强? 推理能力完全不在一个层级好吧。。。疯了,当然 gpt 的前端能力很弱,这个 gpt 自己也承认,但推理,review ,找 bug ,写代码的严谨性,把 claude 吊起来打啊。


    不过降智了,就没什么好聊的。。。
    NullIsLife
        57
    NullIsLife  
    PRO
       8h 52m ago
    @clemente #50 能说说在畅饮 cc 的情况下,什么场景你会想用 codex
    diaoyulao
        58
    diaoyulao  
       7h 44m ago
    两个都在用,Claude code 适合当军师,Codex 适合干苦力,一个出谋划策做监工,一个猛猛干
    xidaduo
        59
    xidaduo  
       7h 33m ago
    Claude 在出方案和产品思路方面比 Codex 好太多,Codex 干有详细文档和计划的活比较稳定,在执行层面比较靠谱。一个胜在创新想法,一个胜在干活稳定、使用也更稳定
    MuyuQ
        60
    MuyuQ  
       7h 30m ago
    我的 codex 会写一大堆单元测试。。有时候我不得不中断他的任务,告诉他别写那么多,费的是我的 token 。
    smileeast
        61
    smileeast  
       7h 17m ago
    @1874w #31 superpowers 这个太费 token 了,我现在用 https://github.com/mattpocock/skills 这个 skill ,这个 skill 的一个 grill-me 就是解决沟通的问题。如果能和 AI 能把事情沟通明白了,那么人际沟通这一块也会强很多。我们想的>我们表达的>对方想的>对方执行,这是四个层级,很多人想的是直接从我想的就变成执行层,这明显是有问题的。
    elevioux
        62
    elevioux  
       6h 47m ago
    你们拿到就用的吗?没有全局的 agents.md ?我都是写了一堆约束的。例如,写 docblock ,不要兜底,需求要反复确认后给出计划。

    虽然还是时不时会抽风,但要比不加约束好很多。
    1874w
        63
    1874w  
       6h 43m ago
    @smileeast 可以,我试试你这个。我目前 Token 比较充足,所以还在用,只不过很少用它来走完整流程。
    Jamieyang
        64
    Jamieyang  
       6h 33m ago
    个人感觉

    智商:GPT > Claude
    写代码: GPT > Claude
    Review: GPT > Claude
    灵性:Claude > GPT
    业务理解/认知:Claude > GPT
    运维能力:Claude > GPT

    只能说各有长处,使用场景不一样。GPT 合适纯后端,Claude 合适 DevOps 这种跨界工种
    x4gz
        65
    x4gz  
       5h 27m ago
    他们写不出来原因主要是我的提示词不够细致
    结论:我最笨
    yooomu
        66
    yooomu  
       5h 22m ago
    claude 考虑事情没有 codex 全面,经常丢三落四。只要需求描述清楚,codex 几乎不会返工,测都不用测。claude 适合不清楚怎么做的时候进行需求发散
    ximaoyang
        67
    ximaoyang  
       4h 58m ago
    codex 确实很笨,目前智能水平 claude code > deepseek > codex
    deplives
        68
    deplives  
       4h 0m ago
    claude 才是一坨,俩月前 opus4.8 /simplify 把原本至少能编译通过的 swift 代码改的乱七八糟,编译都失败,最后好不容易编译过了,app 启动就 crash 最后 5h 用完了也没给修好
    codex 5.5 用了一次对话就找到原因并且修复了,然后第二个月就退订了 claude 订阅了 codex 5x
    techmale
        69
    techmale  
       1h 28m ago via iPhone
    Skill Issue (pun intended
    imdoge
        70
    imdoge  
       1h 1m ago
    复杂的 codex 做的更细(虽然也有冗余设计风险)
    不降智来说,大概就是 opus4.8 是高考 660 分但做事不够全如果你的代码很屎山各种耦合很多,他可能不看够全,gpt5.5 是高考 650 分但肯给你花半小时认真全面做一件事
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2756 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 160ms · UTC 14:56 · PVG 22:56 · LAX 07:56 · JFK 10:56
    ♥ Do have faith in what you're doing.