V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  sillydaddy  ›  全部回复第 10 页 / 共 153 页
回复总数  3059
1 ... 6  7  8  9  10  11  12  13  14  15 ... 153  
@moudy >“不过编译器生成的代码是相当确定的,而 ai 显然还没有到这个程度。”
不能这么类比吧。我上面#6 楼的回复,恰恰是把 AI 类比为人(下属),而不是编译器。

人或者 AI 做事,就是有固有的不确定性。给你一个下属,你也要接受他的不确定性,以及能否把事情做出来的不确定性,但这不影响你对他能力或可靠性的大概判断,对吧。而编译器的确定性,是因为它要处理的编程语言的语法是极其确定和有限的,不确定性为 0 。所以,不能拿编译器与 AI 类比。
我来打消你的疑虑:只需要设想你是一个老板。

你安排手下做事,有管财务的、有管人事的、有管销售的、有管技术研发的,这些领域,你不可能都门儿清,对吧?至少,一般的老板是不懂技术的。那么你怎么授权并信任这些人去做事呢?

1 是看结果。事物是因果驱动的,种善因结善果,没有金刚钻就做不了瓷器活。看 AI 执行的结果,就知道它的功力是不是足够。一个功力不足的 AI ,靠拆东墙补西墙的底层架构,是不能让结果持续满意的。反过来就是说,如果结果持续令你满意,那它的底层实现,大概率也会让你满意。如果你觉得等待结果失败的时间太长代价太大,那还有中间过程的监督和反馈。

2 是监督和反馈。纸里包不住火,管理不善总是会有蛛丝马迹泄漏出来。可以通过利益无关甚至利益冲突的其他人的监督,也可以收集更下层的反馈。对应到 vibe coding ,其他 AI 可以审查代码,你自己也可以亲自抽检其中的某个模块,让代码说话,让你更了解你使用的 AI 是个什么水平,从而只下放对应的权力给它。其实人们也一直是这么做的,在 2025 年末之后,很多人才改变了 vibe coding 的方式,全权放手让 AI 去做。
@lelelelelelele #50
“面向市场”是指你知道市场上的需求,并且满足这个需求,从中盈利。无论你是雇人、雇 AI 、还是找合作,这个是老板的职责。你从 AI 能习得这些技能吗? AI 缺少的恰恰就是实践和经验,那些从经验中得到的 groudtruth 。

我还是那句话,你可以考虑一下,从自身角度出发,看看你能转型到哪行当老板,去直接满足市场需求,并且挣到钱。需要多长时间去学习和实践,能达到打工的收入水平、稳定持久性。哪怕头脑风暴一下也可以。
看了项目简介,我对它的信任感,甚至比不上我对 AI vibe 出的代码。为啥?

这么长篇幅的介绍,没抓住重点,没介绍核心,那个让人一看就信服的东西:它输出的架构图、treemap 到底是什么?

唯一一个示例动画,还糊的像毛玻璃!
3 月 13 日
回复了 Kinnikuman 创建的主题 程序员 Anthropic 家的模型训练与其他家差别大吗?
真的差别那么大吗,没有特别大的感觉,我的感觉反而是 gpt5.3codex 比较稳定可靠。我是在 cursor 内测试的。

下面的乘法题,gpt5.3codex 能做到,但 opus4.6 做不到(推理卡死、直接放弃改用 python )。都是用的最高推理能力。

```
你能不借助工具,心算一道乘法题吗?为保证准确性,你必须要一步一步计算。这里的一步一步是指无论加法还是乘法,都只取 1 位数字计算。也就是 1 位数乘以 1 位数,1 位数加 1 位数,无论是中间过程还是结果。

8346783724985839204724623 * 7827329472626174

```
@lelelelelelele

你的技能树跟老板的技能树完全不一样啊。所以说是隔行。老板是面向 ToB 或者 ToC 市场的,你是面向 ToBoss 市场的。
你说你也可以习得某个老板的技能,最起码能习得工商个体户的技能,但是,你忘了最关键的变量:时间。

假如说 AI 在 10 年或者 5 年内,替代劳动者的技能,但是由于商业需要真金白银的风险换来的经验,从而导致 AI 在商业领域的进展缓慢。那么劳动者必须要在 10 年甚至 5 年内,习得老板的技能。这时间太短了!

你可以这么问自己,现在的你要找到一份直面市场的工作,而不是面向老板输出的打工技能,你需要多长时间能切换过去。你的经验、投资本钱够不够支持?就比如说做自媒体或者面向 B 端或 C 端的软件开发,这个算是直面市场的,你有多大把握做到跟找工作一样的风险和收益?
老板(直面市场) 劳动者(直面老板)
----------------------------------
前 AI 时代 1 亿 5 亿
后 AI 时代 +0 +50 亿

劳动者的竞争者增加了 50 亿便宜好用的 AI 。新来的竞争者优势明显。
但老板的 AI 竞争者并没有增加(至少目前没有),老板只会面对劳动者被迫向老板转型所带来的竞争。新来的竞争者劣势明显——隔行如隔山你有什么资格敢跟原老板竞争呢?
一看到这个,我就想起我的「经济模拟」计划: /t/705459

我感觉这里面的关系很复杂:有人说,效率提高后,成本降低,也会扩大对应的需求,也就是说软件生产成本低了便宜了,那么会有更多的人想要订制、订阅软件。也有人说,像你所说,AI 替代了人工,导致失业率提升,人们收入降低,需求下降。总之很复杂。但这些都是从宏观层面上分析,它们缺少 2 点:1 是时序,这些影响是如何随时间如涟漪般扩散的,2 是缺乏局部细节,涟漪扩散时,怎样影响各类不同的人。

「经济模拟」正是用在这时候的。吐槽:这时候本来应该是经济学家们大展身手,细细分析 AI 革命产生的影响,可惜看不到他们的言论和身影。
嘲笑的人总有嘲笑的理由,但阻挡不了趋势。当初说大模型是随机鹦鹉没有理解能力的,你看现在还有吗?

今年的趋势就是 agents 编排,把它们当成一个个人去使唤,让它们自己组织协调。看招聘信息和大模型厂商的动作,都已经在朝这个方向了。有 v 友也已经行动了: /t/1194261 ,多 agent 聊天系统。

早起的鸟儿有虫吃。
@Folayi 我在#41 楼刚发了 Cursor 不支持 CLI ,就被打脸了,似乎是有 CLI 的: https://cursor.com/cn/blog/cli
@Folayi 忘了贴限量了: https://www.v2ex.com/t/1153108
@Folayi #38 应该没有办法了。

不过,用 Claude Code 做替代,应该可以的。看这个 v 友晒出的 Claude Code 100 美刀的 5 小时限量( 4000 万 token ),还是可以的。

Cursor 的旧版 500 次,从一方面看很爽,从另一方面,它也限制了对 token 的利用:2026 年基于现在的大模型能力,智能体编排肯定会大行其道,说白了就是把智能体当成一个员工去指挥,让它们协作。这时候 Cursor 的 500 次就捉襟见肘了,因为协作最重要的是频繁的交流沟通,而不是一次性的。而且还有一点是 Cursor 不像 Claude Code CLI 这种原生支持智能体编排,特别是本地的。
3 月 8 日
回复了 Lighfer 创建的主题 Cursor cursor 按次数的太值了
我不得不说,哥们你真的是狠人,你是怎么能做到几乎次次请求大几百万 token 的?
@wzw #34 手动开启"On-Demand Usage"开关就可以,超出的每个 request 仍然按$0.04 (即$20/500 )计价,意思是再用 500 次只需要再加 20 刀: https://cursor.com/cn/dashboard?tab=spending 。当然,可能不能无限续杯,不过 500 次其实挺多的了。
那你是不知道 Cursor 旧的计费模式有多爽。现在用旧计费模式的大有人在,Opus 4.6 thinking 一次对话烧掉几千万 token ,只花 0.5 元人民币,500 次对话,烧掉无论几亿 token 都只要 20 刀,花完了还可以原价续费,你敢想吗:
/t/1196640
3 月 8 日
回复了 sillydaddy 创建的主题 分享发现 Scaling Law 真的很有意思!它停止了吗?
@iloveoovx 长篇大论的废话!其实就是在以一种绝对主义的方式,一直在否定贬低 RL 缩放,乃至 Scaling Law 。

我基于现实说话,你在那里意淫。我说 RL 缩放放缓的可能性,你说还有一万种提升的可能性。我从始至终也没否定这一万种可能性啊。你能理解这里面的差别吗?

意淫谁不会啊,你要是有其他的证据,就拿出来,比如说「 2025 年不是 RL 缩放在主导模型的提升」,也算我涨个见识,拿「凭什么你认为这个是最重要的指标别人就认啊」、「退一万步所有人都认 scaling law 的重要,别忘了五台计算机的事」这种逻辑不清的指控,我也懒得跟你辩了,
3 月 7 日
回复了 zhoukevin233 创建的主题 Cursor Cursor 旧版 500 次套餐开始缩水了
具体是消耗几次啊? 其实也不算缩水吧,MAX mode 本来就是按 token 计费的。Opus 4.6 thinking 也需要消耗 2 次啊。
3 月 6 日
回复了 Livid 创建的主题 OpenAI GPT-5.4 Thinking 依然过不了洗车测试
我最喜欢的是这个帖子里的测试:
/t/1192001

当时只有 codex 5.3 extra high 能解决!可以是试试 5.4 能不能解决,如果能,说明是高级推理模式,否则推理应该就是被阉割过的。
3 月 6 日
回复了 Livid 创建的主题 OpenAI GPT-5.4 Thinking 依然过不了洗车测试
我用 Cursor 试验了,在 Cursor 里面:
OpenAI 的模型,分为 4 级:low 、normal 、high 和 extra high 。前两者解决不了(包括 codex 5.3 。没试 5.4 ),后两者可以解决。
Anthropic 的模型,分为 2 级,不带 thinking 、带 thinking 。前者只有 Opus 4.6 可以解决,后者都可以解决,甚至 Sonnet4.0 thinking 也可以。

所以可以看到它们 2 家的等级对应。

不知道你用的模型是哪里的,我感觉网页版的推理能力很低,无论是哪家公司。我稍微正式研究一些问题时,都会切换到 Cursor 里面去问。
1 ... 6  7  8  9  10  11  12  13  14  15 ... 153  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   830 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 53ms · UTC 19:55 · PVG 03:55 · LAX 12:55 · JFK 15:55
♥ Do have faith in what you're doing.