V2EX › sillydaddy 的所有回复 › 第 7 页 / 共 153 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

1 ... 3 4 5 6 7 8 9 10 11 12 ... 153

❮

❯

3 月 31 日

回复了 autojunjie 创建的主题 › 程序员 › Harness 决定 Agent 上限：从代码执行到项目迭代

@Hermitist openclaw 本身就有记忆模块的。我理解的是包括单 agent 记忆隔离+所有 session 的记忆+记忆的 RAG 搜索。还可以定制 memory 模块。

所以，我准备用 openclaw 作为 agent 的外壳或者调度者，去调用 Claude Code 或者 Cursor 这样的编程 Agent 。

我看了，Claude Code ，它有一个 auto memory ，这个 auto 的意思是，它自己决定哪些是要记忆的，哪些可能未来会用到，所以它是个黑盒，这意味着，长程工作中，它可能不是那么有效。我更喜欢 openclaw 这种，带有记忆检索的。

3 月 31 日

回复了 autojunjie 创建的主题 › 程序员 › Harness 决定 Agent 上限：从代码执行到项目迭代

目前我在探索 harness 编程。核心的注意力关注在：

一是怎么构建 human in loop：

1.我可以随时发布新需求，新想法，Agent 团队会自主消化这个需求，想法，有问题会提出，有矛盾会指出。
2.我可以随时请求 Agent 给我汇报最新的进展，且是高度验证过的进展。
3.Agent 以人类友好的形式，定时给我汇报功能进展，向我反馈关键的问题、请求。我打对勾，填写意见表即可。比如已实现的功能以方便人浏览的视频形式展示（类似 cursor 的 cloud agent ）。
4.我只确认核心的决策、需求，Agent 团队保持较高的审美和架构水准。那些低端的验证、交互，Agent 团队可以自己搞定，不用麻烦我。

二是怎么异步长程工作：

1.我随时打断 Agent 向其提出需求，指出问题，不用担心之前的任务。
2.任务以队列形式被 Agent 团队消化吸收，自主安排优先级，自主意识到功能依赖关系和冲突关系。
3.Agent 团队可以自主消化设计、测试、调试，且保持较高的审美和水准，不用让这些烦扰我。也就是说能根据我比较抽象的原则和要求，调整其设计。比如「 UI 要非常方便交互」，减少交互步骤数量。Agent 团队能理解这个精神，并检查其中的交互问题，向给我报告其中疑问比较大的。

3 月 31 日

回复了 autojunjie 创建的主题 › 程序员 › Harness 决定 Agent 上限：从代码执行到项目迭代

说 memory 非常重要，是因为长程（跨越几周或几个月）的工作，是依赖很多前面的对话的，讨论过哪些重点，踩过哪些坑，上次的 commit 为什么这么提交，等等等等。

3 月 31 日

回复了 autojunjie 创建的主题 › 程序员 › Harness 决定 Agent 上限：从代码执行到项目迭代

这类工具看得眼花缭乱了。我有几个直接的问题：
1 是 memory 怎么解决的？没看到。想要真正把一个 agent 看作一个员工，那 memory 就是至关重要的。openclaw 起码有把 memory 当作一个核心组件，有默认的 memory ，也可以自定义 memory ，那我为什么不用 openclaw 作为 agent 呢？它相比于你的设计，就是少了一些前端 Agent 状态的展示吧，这并不难吧，因为后台的所有数据都在。

2 是你是在用 DRG 有向图来约束流程，并把这个作为一个核心卖点，但这似乎完全背离了「 Agent 是智能体」的预设。我为什么不用简单的几句提示词约束，来实现对 Agent 流程的约束呢？

3 月 30 日

回复了 bmpidev2019 创建的主题 › 分享创造 › 我是如何构建一个 AI 原生量化系统的

可视化编辑器似乎有改进空间，比如你设计的 greaterThan 这些组件，2 条连线汇入到一个节点，有些乱。试试给 node 加上 port 呢：
https://i.v2ex.co/2jiuJ30I.png

Origami Studio 在这方面设计的非常简洁美观，它用无线 node ，大大简化了 node-based 的乱糟糟毛线团：
https://blog.prototypr.io/a-cure-for-cable-clutter-in-origami-studio-f07e6a65264f?gi=0e8bfd9bb619

我已经亲自试过了，wireless 有奇效。

3 月 30 日

回复了 passive 创建的主题 › 生活 › 吐槽银行 app

何止银行，还有联通移动这些 App ，想清楚知道自己的套餐是什么，那叫一个难。点名联通，太垃圾。

3 月 30 日

回复了 vyou 创建的主题 › 远程工作 › 找个长期开发技术，后端 / 全栈开发 (Go + ClickHouse)

是远程吗？

3 月 30 日

回复了 worss 创建的主题 › 随想 › vibe coding 就像当初的高级语言

不一样，从信息转化的角度很不一样。编译器可以看作没有带来任何新的信息，没有丢失任何信息。但 vibe coding 不一样，它是是在求解，在填补信息，因为一个问题的解有无数个，当然会有不确定性，你让他生成一个网页，有 10000 种可能性，它填补了你没有提到的信息，它求得了一个解。

3 月 28 日

回复了 sillydaddy 创建的主题 › 分享发现 › 分享一下我最近的感悟： AI 不会取代软件本身，哪怕是一些很小的软件

@beimenjun 对，假设 Agent 是个人助理，那它会将软件作为它的工具。可能是随主人喜好不断迭代，可能是从零开始迭代，也可能借助开源或者授权的二次开发。无论如何，软件作为工具，应该是不会消失的。

3 月 28 日

回复了 neword 创建的主题 › 人工智能 › 大人是不是：时代变了，现在 v 站聊编程的人少了。现在几乎所有主题都是 AI

未来的程序员就像今天的厨师、司机，谁都可以做，但又不是谁都去做。属于没人在意的群体。

就酱，period 。

3 月 28 日

回复了 Hermitist 创建的主题 › OpenClaw › 有了 openclaw, app 会死吗?

几乎可以肯定不会。交互延时、计算效率、交互确定性，都决定了 App 不会消失： /t/1181856
但肯定是与 AI 深度融合的。

3 月 27 日

回复了 cairnechen 创建的主题 › 问与答 › opus 的视觉能力是不是不如 gpt5.4?

其实 benchmark 分数可以证明，不过我还是喜欢这个帖子里的视觉测试：
/t/1192001

当时我测试了只有 codex 5.3 extra high 能解决。不知道最新的 5.4 能不能解决，起码 Opus 4.6 是不行的。

3 月 27 日

回复了 kenshinhu 创建的主题 › ☕Vibe Coding🤖 › 关于 Vibe coding 的一点想法

这个只要看 OpenAI 做的就可以了： https://openai.com/zh-Hans-CN/index/harness-engineering/

首先是完全由 Agent 编码百万行代码：
「我们用了几周的时间来交付最终达到一百万行代码的项目。」
「每一行代码 — 从应用逻辑、测试、CI 配置、文档、可观察性到内部工具 — 全都是由 Codex 编写的。」

然后是针对架构漂移的处理：
「完全自主的智能体也引入了新的问题。Codex 会复现代码仓库中已存在的模式 — 甚至包括那些不均衡或不够理想的模式。随着时间的推移，这不可避免地导致漂移。」

「最初，人类是手动处理这个问题的。我们的团队过去每周五（占一周的 20%）都要花时间清理“AI 残渣”。不出所料，那并不具备可扩展性。」

「相反，我们开始将我们称为“黄金原则”的内容直接编码到代码仓库中，并建立了一个循环清理流程。这些原则是带有主观意见的机械规则，旨在保持代码库的可读性和一致性，以便将来运行智能体。例如：(1) 我们更倾向于使用共享的实用程序包，而不是手工编写的辅助工具，以便将不变式集中管理；(2) 我们不会使用“YOLO 式”探测数据 — 我们会验证边界，或依赖类型化的 SDK ，这样智能体就不会意外地基于猜测的结构进行构建。我们会定期运行一组后台 Codex 任务，扫描偏差、更新质量等级，并发起有针对性的重构 Pull Request 。其中大多数都可以在一分钟内完成审查并自动合并。」

「其功能类似于垃圾回收。技术债务就像一笔高息贷款：不断地以小额贷款的方式偿还债务，总比让债务不断累积，再痛苦地一次解决要好得多。人类的品味一旦被捕捉，就会持续应用于每一行代码。这也使我们能够每天发现并解决不良模式，而不是让它们在代码库中传播数天或数周。」

3 月 27 日

回复了 GabrielGarcia 创建的主题 › Claude › Opus 4.6 模型不能用了

波动吧，现在好像又没事了。

3 月 27 日

回复了 gzk329 创建的主题 › Cursor › cursor 中集成的模型也是先区域的吗？我冲了 pro，一直开的 auto，我以为他会帮我选模型，结果今天有个难题，我手动切换成 opus4.6，结果提示我区域限制，无法访问，试了下 gemini 和 gpt5.4 也都是这样？

不是 Cursor 限制，是它的模型供应商限制。
需要让 Cursor 走代理，同时禁用一下 http2 。详细看这个帖子： https://v2ex.com/t/1145723

1 ... 3 4 5 6 7 8 9 10 11 12 ... 153

❮

❯