V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  llggg  ›  全部回复第 1 页 / 共 1 页
回复总数  4
看了下 benchmark ,至少不像很多 Agent 项目只放“精选案例”。

其实现在大家都在卷模型,真正烧钱的很多时候确实是 Harness 层。

尤其 cache 命中率、工具数量、上下文重建这些东西,平时不用大规模跑任务的人很难有体感,一旦真拿来干活,月底账单会非常真实。

Ruby 重写一开始觉得离谱,但细想也合理——Agent 现在瓶颈更多是上下文和调用编排,不是语言性能。

准备明天拿自己一套实际工作流跑跑看,如果真能稳定把成本打到 Claude Code 一半以下,那确实有点东西。
@liaopen123 那个 24 小时邮箱过期了 , 发这个邮箱 czdzZDNyeWpAYW5vbmFkZHkuY29t
@puppyxxx VX 发这个临时邮箱 我加你
@puppyxxx 刚好也在做 ai-codereview ,有兴趣一起交流下吗 临时邮箱 base64: b2xpZGR1aXR5QG1haWxzYmF5LmNvbQ==
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1066 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 17:57 · PVG 01:57 · LAX 10:57 · JFK 13:57
♥ Do have faith in what you're doing.