V2EX › sillydaddy 的所有回复 › 第 10 页 / 共 153 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

1 ... 6 7 8 9 10 11 12 13 14 15 ... 153

❮

❯

3 月 14 日

回复了 duhbbx1119 创建的主题 › 职场话题 › vibe coding 让我对代码的掌控力越来越弱了

@moudy >“不过编译器生成的代码是相当确定的，而 ai 显然还没有到这个程度。”
不能这么类比吧。我上面#6 楼的回复，恰恰是把 AI 类比为人（下属），而不是编译器。

人或者 AI 做事，就是有固有的不确定性。给你一个下属，你也要接受他的不确定性，以及能否把事情做出来的不确定性，但这不影响你对他能力或可靠性的大概判断，对吧。而编译器的确定性，是因为它要处理的编程语言的语法是极其确定和有限的，不确定性为 0 。所以，不能拿编译器与 AI 类比。

3 月 14 日

回复了 duhbbx1119 创建的主题 › 职场话题 › vibe coding 让我对代码的掌控力越来越弱了

我来打消你的疑虑：只需要设想你是一个老板。

你安排手下做事，有管财务的、有管人事的、有管销售的、有管技术研发的，这些领域，你不可能都门儿清，对吧？至少，一般的老板是不懂技术的。那么你怎么授权并信任这些人去做事呢？

1 是看结果。事物是因果驱动的，种善因结善果，没有金刚钻就做不了瓷器活。看 AI 执行的结果，就知道它的功力是不是足够。一个功力不足的 AI ，靠拆东墙补西墙的底层架构，是不能让结果持续满意的。反过来就是说，如果结果持续令你满意，那它的底层实现，大概率也会让你满意。如果你觉得等待结果失败的时间太长代价太大，那还有中间过程的监督和反馈。

2 是监督和反馈。纸里包不住火，管理不善总是会有蛛丝马迹泄漏出来。可以通过利益无关甚至利益冲突的其他人的监督，也可以收集更下层的反馈。对应到 vibe coding ，其他 AI 可以审查代码，你自己也可以亲自抽检其中的某个模块，让代码说话，让你更了解你使用的 AI 是个什么水平，从而只下放对应的权力给它。其实人们也一直是这么做的，在 2025 年末之后，很多人才改变了 vibe coding 的方式，全权放手让 AI 去做。

3 月 13 日

回复了 lelelelelelele 创建的主题 › 职场话题 › 如果你会因 AI 被辞，那你的公司为什么不被你（+AI）取代？

@lelelelelelele #50
“面向市场”是指你知道市场上的需求，并且满足这个需求，从中盈利。无论你是雇人、雇 AI 、还是找合作，这个是老板的职责。你从 AI 能习得这些技能吗？ AI 缺少的恰恰就是实践和经验，那些从经验中得到的 groudtruth 。

我还是那句话，你可以考虑一下，从自身角度出发，看看你能转型到哪行当老板，去直接满足市场需求，并且挣到钱。需要多长时间去学习和实践，能达到打工的收入水平、稳定持久性。哪怕头脑风暴一下也可以。

3 月 13 日

回复了 yisen123 创建的主题 › 程序员 › 随着 AI 写代码的复杂度越来越高，项目越来越难以推动和理解，这个反 speckit 工具可以解决这个问题

看了项目简介，我对它的信任感，甚至比不上我对 AI vibe 出的代码。为啥？

这么长篇幅的介绍，没抓住重点，没介绍核心，那个让人一看就信服的东西：它输出的架构图、treemap 到底是什么？

唯一一个示例动画，还糊的像毛玻璃！

3 月 13 日

回复了 Kinnikuman 创建的主题 › 程序员 › Anthropic 家的模型训练与其他家差别大吗？

真的差别那么大吗，没有特别大的感觉，我的感觉反而是 gpt5.3codex 比较稳定可靠。我是在 cursor 内测试的。

下面的乘法题，gpt5.3codex 能做到，但 opus4.6 做不到（推理卡死、直接放弃改用 python ）。都是用的最高推理能力。

```
你能不借助工具，心算一道乘法题吗？为保证准确性，你必须要一步一步计算。这里的一步一步是指无论加法还是乘法，都只取 1 位数字计算。也就是 1 位数乘以 1 位数，1 位数加 1 位数，无论是中间过程还是结果。

8346783724985839204724623 * 7827329472626174

```

3 月 13 日

回复了 lelelelelelele 创建的主题 › 职场话题 › 如果你会因 AI 被辞，那你的公司为什么不被你（+AI）取代？

@lelelelelelele

你的技能树跟老板的技能树完全不一样啊。所以说是隔行。老板是面向 ToB 或者 ToC 市场的，你是面向 ToBoss 市场的。
你说你也可以习得某个老板的技能，最起码能习得工商个体户的技能，但是，你忘了最关键的变量：时间。

假如说 AI 在 10 年或者 5 年内，替代劳动者的技能，但是由于商业需要真金白银的风险换来的经验，从而导致 AI 在商业领域的进展缓慢。那么劳动者必须要在 10 年甚至 5 年内，习得老板的技能。这时间太短了！

你可以这么问自己，现在的你要找到一份直面市场的工作，而不是面向老板输出的打工技能，你需要多长时间能切换过去。你的经验、投资本钱够不够支持？就比如说做自媒体或者面向 B 端或 C 端的软件开发，这个算是直面市场的，你有多大把握做到跟找工作一样的风险和收益？

3 月 13 日

回复了 lelelelelelele 创建的主题 › 职场话题 › 如果你会因 AI 被辞，那你的公司为什么不被你（+AI）取代？

老板（直面市场）劳动者（直面老板）
----------------------------------
前 AI 时代 1 亿 5 亿
后 AI 时代 +0 +50 亿

劳动者的竞争者增加了 50 亿便宜好用的 AI 。新来的竞争者优势明显。
但老板的 AI 竞争者并没有增加（至少目前没有），老板只会面对劳动者被迫向老板转型所带来的竞争。新来的竞争者劣势明显——隔行如隔山你有什么资格敢跟原老板竞争呢？

3 月 12 日

回复了 v2exgo 创建的主题 › 职场话题 › 为什么 V 站，这么多人觉得裁员是因为经济下行，而不是 AI 工具让开发效率在实打实地提升？

一看到这个，我就想起我的「经济模拟」计划： /t/705459

我感觉这里面的关系很复杂：有人说，效率提高后，成本降低，也会扩大对应的需求，也就是说软件生产成本低了便宜了，那么会有更多的人想要订制、订阅软件。也有人说，像你所说，AI 替代了人工，导致失业率提升，人们收入降低，需求下降。总之很复杂。但这些都是从宏观层面上分析，它们缺少 2 点：1 是时序，这些影响是如何随时间如涟漪般扩散的，2 是缺乏局部细节，涟漪扩散时，怎样影响各类不同的人。

「经济模拟」正是用在这时候的。吐槽：这时候本来应该是经济学家们大展身手，细细分析 AI 革命产生的影响，可惜看不到他们的言论和身影。

3 月 10 日

回复了 SuperDaFu 创建的主题 › OpenClaw › 发现很多人都与 openclaw 的态度怎么感觉是在嘲笑

嘲笑的人总有嘲笑的理由，但阻挡不了趋势。当初说大模型是随机鹦鹉没有理解能力的，你看现在还有吗？

今年的趋势就是 agents 编排，把它们当成一个个人去使唤，让它们自己组织协调。看招聘信息和大模型厂商的动作，都已经在朝这个方向了。有 v 友也已经行动了： /t/1194261 ，多 agent 聊天系统。

早起的鸟儿有虫吃。

3 月 9 日

回复了 yuan321 创建的主题 › Claude Code › 相比 cursor， 100 美刀的 claude code 是不是好用+便宜太多？

@Folayi 我在#41 楼刚发了 Cursor 不支持 CLI ，就被打脸了，似乎是有 CLI 的： https://cursor.com/cn/blog/cli

3 月 9 日

回复了 yuan321 创建的主题 › Claude Code › 相比 cursor， 100 美刀的 claude code 是不是好用+便宜太多？

@Folayi 忘了贴限量了： https://www.v2ex.com/t/1153108

3 月 9 日

回复了 yuan321 创建的主题 › Claude Code › 相比 cursor， 100 美刀的 claude code 是不是好用+便宜太多？

@Folayi #38 应该没有办法了。

不过，用 Claude Code 做替代，应该可以的。看这个 v 友晒出的 Claude Code 100 美刀的 5 小时限量（ 4000 万 token ），还是可以的。

Cursor 的旧版 500 次，从一方面看很爽，从另一方面，它也限制了对 token 的利用：2026 年基于现在的大模型能力，智能体编排肯定会大行其道，说白了就是把智能体当成一个员工去指挥，让它们协作。这时候 Cursor 的 500 次就捉襟见肘了，因为协作最重要的是频繁的交流沟通，而不是一次性的。而且还有一点是 Cursor 不像 Claude Code CLI 这种原生支持智能体编排，特别是本地的。

3 月 8 日

回复了 Lighfer 创建的主题 › Cursor › cursor 按次数的太值了

我不得不说，哥们你真的是狠人，你是怎么能做到几乎次次请求大几百万 token 的？

3 月 8 日

回复了 yuan321 创建的主题 › Claude Code › 相比 cursor， 100 美刀的 claude code 是不是好用+便宜太多？

@wzw #34 手动开启"On-Demand Usage"开关就可以，超出的每个 request 仍然按$0.04 （即$20/500 ）计价，意思是再用 500 次只需要再加 20 刀: https://cursor.com/cn/dashboard?tab=spending 。当然，可能不能无限续杯，不过 500 次其实挺多的了。

3 月 8 日

回复了 yuan321 创建的主题 › Claude Code › 相比 cursor， 100 美刀的 claude code 是不是好用+便宜太多？

那你是不知道 Cursor 旧的计费模式有多爽。现在用旧计费模式的大有人在，Opus 4.6 thinking 一次对话烧掉几千万 token ，只花 0.5 元人民币，500 次对话，烧掉无论几亿 token 都只要 20 刀，花完了还可以原价续费，你敢想吗：
/t/1196640

3 月 8 日

回复了 sillydaddy 创建的主题 › 分享发现 › Scaling Law 真的很有意思！它停止了吗？

@iloveoovx 长篇大论的废话！其实就是在以一种绝对主义的方式，一直在否定贬低 RL 缩放，乃至 Scaling Law 。

我基于现实说话，你在那里意淫。我说 RL 缩放放缓的可能性，你说还有一万种提升的可能性。我从始至终也没否定这一万种可能性啊。你能理解这里面的差别吗？

意淫谁不会啊，你要是有其他的证据，就拿出来，比如说「 2025 年不是 RL 缩放在主导模型的提升」，也算我涨个见识，拿「凭什么你认为这个是最重要的指标别人就认啊」、「退一万步所有人都认 scaling law 的重要，别忘了五台计算机的事」这种逻辑不清的指控，我也懒得跟你辩了，

3 月 7 日

回复了 zhoukevin233 创建的主题 › Cursor › Cursor 旧版 500 次套餐开始缩水了

具体是消耗几次啊？其实也不算缩水吧，MAX mode 本来就是按 token 计费的。Opus 4.6 thinking 也需要消耗 2 次啊。

3 月 6 日

回复了 Livid 创建的主题 › OpenAI › GPT-5.4 Thinking 依然过不了洗车测试

我最喜欢的是这个帖子里的测试：
/t/1192001

当时只有 codex 5.3 extra high 能解决！可以是试试 5.4 能不能解决，如果能，说明是高级推理模式，否则推理应该就是被阉割过的。

3 月 6 日

回复了 Livid 创建的主题 › OpenAI › GPT-5.4 Thinking 依然过不了洗车测试

我用 Cursor 试验了，在 Cursor 里面：
OpenAI 的模型，分为 4 级：low 、normal 、high 和 extra high 。前两者解决不了（包括 codex 5.3 。没试 5.4 ），后两者可以解决。
Anthropic 的模型，分为 2 级，不带 thinking 、带 thinking 。前者只有 Opus 4.6 可以解决，后者都可以解决，甚至 Sonnet4.0 thinking 也可以。

所以可以看到它们 2 家的等级对应。

不知道你用的模型是哪里的，我感觉网页版的推理能力很低，无论是哪家公司。我稍微正式研究一些问题时，都会切换到 Cursor 里面去问。

1 ... 6 7 8 9 10 11 12 13 14 15 ... 153

❮

❯