V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  sillydaddy  ›  全部回复第 7 页 / 共 153 页
回复总数  3059
1 ... 3  4  5  6  7  8  9  10  11  12 ... 153  
@Hermitist openclaw 本身就有记忆模块的。我理解的是包括单 agent 记忆隔离+所有 session 的记忆+记忆的 RAG 搜索。还可以定制 memory 模块。

所以,我准备用 openclaw 作为 agent 的外壳或者调度者,去调用 Claude Code 或者 Cursor 这样的编程 Agent 。

我看了,Claude Code ,它有一个 auto memory ,这个 auto 的意思是,它自己决定哪些是要记忆的,哪些可能未来会用到,所以它是个黑盒,这意味着,长程工作中,它可能不是那么有效。我更喜欢 openclaw 这种,带有记忆检索的。
目前我在探索 harness 编程。核心的注意力关注在:

一是怎么构建 human in loop:

1.我可以随时发布新需求,新想法,Agent 团队会自主消化这个需求,想法,有问题会提出,有矛盾会指出。
2.我可以随时请求 Agent 给我汇报最新的进展,且是高度验证过的进展。
3.Agent 以人类友好的形式,定时给我汇报功能进展,向我反馈关键的问题、请求。我打对勾,填写意见表即可。比如已实现的功能以方便人浏览的视频形式展示(类似 cursor 的 cloud agent )。
4.我只确认核心的决策、需求,Agent 团队保持较高的审美和架构水准。那些低端的验证、交互,Agent 团队可以自己搞定,不用麻烦我。


二是怎么异步长程工作:

1.我随时打断 Agent 向其提出需求,指出问题,不用担心之前的任务。
2.任务以队列形式被 Agent 团队消化吸收,自主安排优先级,自主意识到功能依赖关系和冲突关系。
3.Agent 团队可以自主消化设计、测试、调试,且保持较高的审美和水准,不用让这些烦扰我。也就是说能根据我比较抽象的原则和要求,调整其设计。比如「 UI 要非常方便交互」,减少交互步骤数量。Agent 团队能理解这个精神,并检查其中的交互问题,向给我报告其中疑问比较大的。
说 memory 非常重要,是因为长程(跨越几周或几个月)的工作,是依赖很多前面的对话的,讨论过哪些重点,踩过哪些坑,上次的 commit 为什么这么提交,等等等等。
这类工具看得眼花缭乱了。我有几个直接的问题:
1 是 memory 怎么解决的?没看到。想要真正把一个 agent 看作一个员工,那 memory 就是至关重要的。openclaw 起码有把 memory 当作一个核心组件,有默认的 memory ,也可以自定义 memory ,那我为什么不用 openclaw 作为 agent 呢?它相比于你的设计,就是少了一些前端 Agent 状态的展示吧,这并不难吧,因为后台的所有数据都在。

2 是你是在用 DRG 有向图来约束流程,并把这个作为一个核心卖点,但这似乎完全背离了「 Agent 是智能体」的预设。我为什么不用简单的几句提示词约束,来实现对 Agent 流程的约束呢?
3 月 30 日
回复了 bmpidev2019 创建的主题 分享创造 我是如何构建一个 AI 原生量化系统的
可视化编辑器似乎有改进空间,比如你设计的 greaterThan 这些组件,2 条连线汇入到一个节点,有些乱。试试给 node 加上 port 呢:
https://i.v2ex.co/2jiuJ30I.png

Origami Studio 在这方面设计的非常简洁美观,它用无线 node ,大大简化了 node-based 的乱糟糟毛线团:
https://blog.prototypr.io/a-cure-for-cable-clutter-in-origami-studio-f07e6a65264f?gi=0e8bfd9bb619

我已经亲自试过了,wireless 有奇效。
3 月 30 日
回复了 passive 创建的主题 生活 吐槽银行 app
何止银行,还有联通移动这些 App ,想清楚知道自己的套餐是什么,那叫一个难。点名联通,太垃圾。
是远程吗?
3 月 30 日
回复了 worss 创建的主题 随想 vibe coding 就像当初的高级语言
不一样,从信息转化的角度很不一样。编译器可以看作没有带来任何新的信息,没有丢失任何信息。但 vibe coding 不一样,它是是在求解,在填补信息,因为一个问题的解有无数个,当然会有不确定性,你让他生成一个网页,有 10000 种可能性,它填补了你没有提到的信息,它求得了一个解。
@beimenjun 对,假设 Agent 是个人助理,那它会将软件作为它的工具。可能是随主人喜好不断迭代,可能是从零开始迭代,也可能借助开源或者授权的二次开发。无论如何,软件作为工具,应该是不会消失的。
未来的程序员就像今天的厨师、司机,谁都可以做,但又不是谁都去做。属于没人在意的群体。

就酱,period 。
3 月 28 日
回复了 Hermitist 创建的主题 OpenClaw 有了 openclaw, app 会死吗?
几乎可以肯定不会。交互延时、计算效率、交互确定性,都决定了 App 不会消失: /t/1181856
但肯定是与 AI 深度融合的。
3 月 27 日
回复了 cairnechen 创建的主题 问与答 opus 的视觉能力是不是不如 gpt5.4?
其实 benchmark 分数可以证明,不过我还是喜欢这个帖子里的视觉测试:
/t/1192001

当时我测试了只有 codex 5.3 extra high 能解决。不知道最新的 5.4 能不能解决,起码 Opus 4.6 是不行的。
3 月 27 日
回复了 kenshinhu 创建的主题 ☕Vibe Coding🤖 关于 Vibe coding 的一点想法
这个只要看 OpenAI 做的就可以了: https://openai.com/zh-Hans-CN/index/harness-engineering/

首先是完全由 Agent 编码百万行代码:
「我们用了几周的时间来交付最终达到一百万行代码的项目。」
「每一行代码 — 从应用逻辑、测试、CI 配置、文档、可观察性到内部工具 — 全都是由 Codex 编写的。」

然后是针对架构漂移的处理:
「完全自主的智能体也引入了新的问题。Codex 会复现代码仓库中已存在的模式 — 甚至包括那些不均衡或不够理想的模式。随着时间的推移,这不可避免地导致漂移。」

「最初,人类是手动处理这个问题的。我们的团队过去每周五(占一周的 20%)都要花时间清理“AI 残渣”。不出所料,那并不具备可扩展性。」

「相反,我们开始将我们称为“黄金原则”的内容直接编码到代码仓库中,并建立了一个循环清理流程。这些原则是带有主观意见的机械规则,旨在保持代码库的可读性和一致性,以便将来运行智能体。例如:(1) 我们更倾向于使用共享的实用程序包,而不是手工编写的辅助工具,以便将不变式集中管理;(2) 我们不会使用“YOLO 式”探测数据 — 我们会验证边界,或依赖类型化的 SDK ,这样智能体就不会意外地基于猜测的结构进行构建。我们会定期运行一组后台 Codex 任务,扫描偏差、更新质量等级,并发起有针对性的重构 Pull Request 。其中大多数都可以在一分钟内完成审查并自动合并。」

「其功能类似于垃圾回收。技术债务就像一笔高息贷款:不断地以小额贷款的方式偿还债务,总比让债务不断累积,再痛苦地一次解决要好得多。人类的品味一旦被捕捉,就会持续应用于每一行代码。这也使我们能够每天发现并解决不良模式,而不是让它们在代码库中传播数天或数周。」
3 月 27 日
回复了 GabrielGarcia 创建的主题 Claude Opus 4.6 模型不能用了
波动吧,现在好像又没事了。
不是 Cursor 限制,是它的模型供应商限制。
需要让 Cursor 走代理,同时禁用一下 http2 。详细看这个帖子: https://v2ex.com/t/1145723
1 ... 3  4  5  6  7  8  9  10  11  12 ... 153  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   830 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 47ms · UTC 19:55 · PVG 03:55 · LAX 12:55 · JFK 15:55
♥ Do have faith in what you're doing.