aikilan
V2EX  ›  OpenAI

GPT 5.5 的降智是不是有点严重

  •  
  •   aikilan · 2 days ago · 4308 views

    最近任务往往需要引导 2 次以上,稍微复杂点的引导 3-4 次都有,太奇怪了

    34 replies    2026-05-22 11:20:31 +08:00
    sockpuppet9527
        1
    sockpuppet9527  
       2 days ago
    +1

    怀疑是新模型发布前后,算力被重新分配。
    aikilan
        2
    aikilan  
    OP
       2 days ago
    @sockpuppet9527 完全属于被服务商拿捏的
    YanSeven
        3
    YanSeven  
       2 days ago
    前几天一片夸 codex gpt 5.5 爆杀 claude code 的。

    看来 MaaS 这东西,比传统的各种 aaS 都要不稳定。
    MrL21
        4
    MrL21  
       2 days ago
    是的,变差了很多
    ximaoyang
        5
    ximaoyang  
       2 days ago
    gpt 聪明过吗?在 cc 面前就是个垃圾
    shunia
        6
    shunia  
       2 days ago
    啥问题?昨天在 vscode 和 cli 里都用了,感觉还是一样,能力上没啥变化啊?
    不过出了个新 bug 就是,有一个项目一直触发 cybersecurity 的提示,没法用。去 codex 的 issue 里看了一眼,提的 issue 都被直接关了,也不处理。
    shunia
        7
    shunia  
       2 days ago
    @ximaoyang #5 ??这是从何说起?
    409164
        8
    409164  
       2 days ago via iPhone
    @ximaoyang 确实
    lel020
        9
    lel020  
       2 days ago
    我以前用 medium 的,现在用 xhigh ,起码没比以前的 medium 降智,
    tanrenye
        10
    tanrenye  
       2 days ago
    没觉得降智,工作的任务都能胜任
    ktyang
        11
    ktyang  
       2 days ago
    是的,昨天一个小工具翻来覆去搞了好几遍,每次都有问题,害得我折腾了好久,以前肯定是一次成的。
    lemontrees
        12
    lemontrees  
       2 days ago
    感觉还好
    YangJiLei
        13
    YangJiLei  
       2 days ago
    昨天不是额度偷偷刷新吗,我感觉现在额度消耗的好快
    Yasuke
        14
    Yasuke  
       2 days ago
    @ximaoyang 你真的用过吗
    laved
        15
    laved  
       2 days ago
    @ximaoyang 我用 copilot 的时候用过 cc 反而觉得 cc 比不上 gpt
    sockpuppet9527
        16
    sockpuppet9527  
       2 days ago
    @aikilan 之前 opus 4.7 发布前夕,opus 4.6 降智也很厉害。祖传手艺了算是。
    wy315700
        17
    wy315700  
       2 days ago
    @YangJiLei 降智,额度变少

    都是基操了
    undefine2020
        18
    undefine2020  
       2 days ago
    5.4 也降了,昨天第一次碰到让它改个 shell 脚本都出问题的
    urfree
        19
    urfree  
       2 days ago
    5.6 要来了吧
    evemoo
        20
    evemoo  
       2 days ago
    +1 ,胶水代码特别多,简单功能搞得特别复杂
    yuyue001
        21
    yuyue001  
       2 days ago
    除了 claude ,有哪个值得推荐的模型,和 gpt 互补使用。现在降智的很难受。
    ximaoyang
        22
    ximaoyang  
       2 days ago
    除了 cc 其他的都别用。cc 回答简短。不知道就说不知道。gpt 那套真扛不住,回答特别长,不懂瞎回答。真的到干活的时候就来回的在一个地方打转。
    Zarhani
        23
    Zarhani  
       2 days ago
    连 openrouter 上的 api 也降智了
    isnullstring
        24
    isnullstring  
       2 days ago
    +1 ,今天写的计划和代码开始变得弱智起来,自己定的计划却不按计划来
    aikilan
        25
    aikilan  
    OP
       2 days ago
    @isnullstring 之前经常输出的计划能够把我没注意到的也列出来。。。现在提问频率降低,输出的东西就是一大坨
    Baymaxbowen
        26
    Baymaxbowen  
       2 days ago
    +1 ,一个小项目经常丢三落四的
    v2306
        27
    v2306  
       2 days ago
    更新完,上下文窗口的进度条怎么没有了
    fuchish112
        28
    fuchish112  
       2 days ago
    咋一个个跟着手机厂商学,新的出来,旧的就故意卡顿,降拍照画质等等手段
    bellx
        29
    bellx  
       2 days ago
    是的,之前一遍过的东西现在要返工,我用的还是 5.5 xhigh
    cirzear
        30
    cirzear  
       2 days ago
    @bellx 同感,同样复杂度的任务,现在总是只改差不多就说改完了,闭环逻辑也不如之前,需要‘鞭子抽它’才去一步步干
    isnullstring
        31
    isnullstring  
       2 days ago
    @aikilan 是的,代码里已经有相应变量,代码也是他自己写的,写计划时候又创建个相同含义的变量,那计划我审得恼火 丢给 opus 审,审出 10 个问题 5 个严重问题
    Jonchil
        32
    Jonchil  
       1 day ago
    我也感觉降智了,就这 2-3 天的事
    johnnyyeen
        33
    johnnyyeen  
       1 day ago
    比较复杂和较深的项目,cc 的 coding 能力一坨屎啊。修 1 个 bug 出 3 个 bug 。
    codex 基本可以一次成型。
    caixiaomao
        34
    caixiaomao  
       1 day ago
    很严重,感觉还不如 glm-5.1
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2851 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 94ms · UTC 09:58 · PVG 17:58 · LAX 02:58 · JFK 05:58
    ♥ Do have faith in what you're doing.