我是老用户,按次/请求计费的模式。
最近发现一个问题:一次对话表面上扣的是我选的模型(比如 Claude 4.6 Opus ),但后台如果触发了 Subagent (尤其是 Explore 项目分析那种),就会额外扣好几次 Composer-1 或 1.5 的请求。 简单说,就是:
- 我发一条消息,用 Opus 选的模型
- 系统觉得需要分析项目/搜索代码库 → 自动调用 Explore 子代理
- 子代理每跑一步(工具调用、搜索文件等)都算独立请求,全用 Composer 系列
- 结果账单里:1 次 Opus + 几条 Composer ,复杂点的话题一次扣 4-8 次很常见
而且 Subagent 没法完全关掉,设置里没开关。
提示词里写“不要用 subagent”“只用主模型”“禁止 Explore”基本没用,系统还是会触发。
这样下来,可用次数掉得特别快,尤其是项目大的时候,感觉比以前压缩了不少。

