来自 Anthropic 官方:
号称说只需要视觉能力。
不知道具体是怎么搭建的环境,用 Claude Cowork 指向一个模拟器窗口吗?
打算试试。
号称说只需要视觉能力。
不知道具体是怎么搭建的环境,用 Claude Cowork 指向一个模拟器窗口吗?
打算试试。
1
409164 1 day ago via iPhone
蹲一个
|
2
Ericcccccccc 1 day ago
我感觉现在 codex ( token 足够)要做到这个可能也是没问题的
|
3
CITRON_K 1 day ago
本质是回合制游戏。我觉得 gpt 现在的模型也行
|
4
supersf 19h 24m ago
不给查看了。
|
5
supersf 19h 18m ago
Claude Fable 5 beats Pokémon FireRed only using vision
Claude Fable 5 plays Factorio |
8
liuidetmks 18h 11m ago
对于麻将,围棋这类需要一点深度计算的游戏呢
|
9
www12222 17h 56m ago
👍
|
10
shineonme 17h 32m ago
看到他们也拿 Fable 跑了 Slay the Spire ,之前我用 gpt-5.4 也跑了 Slay the Spire 2 的通关,不过没有用到视觉相关的能力: https://www.v2ex.com/t/1205343
|
11
liuzimin 17h 24m ago
真希望有朝一日能跑双影奇境。
|
12
savingrun 16h 53m ago
有点意思🤔
|
13
devilte 15h 35m ago
|
14
thealert 15h 27m ago
@liuidetmks 那是上一代模型卷积解决的问题 ,alphazero 已解决
|
15
beimenjun PRO 这种本质上属于妥妥的商用,侵犯了任天堂和 Game Freak 的版权了吧?
|
16
solitude23456 15h 17m ago
@liuzimin 这样就可以自己一个人玩了是吧
|
17
grimbedroom 15h 4m ago
希望他们可以把工程放出来复现
|
18
cairnechen 14h 55m ago
之前看到过豆包的屏幕共享+实时视觉理解+语言互动的视频,是不是理论上也可以让豆包来玩这些游戏啊?
|
19
cairnechen 14h 45m ago
关于大模型的视觉能力,因为我之前做过 UI automation 相关的 skill ,我目前的感觉是语义理解没问题,但定位视觉元素和区域的能力很差,所以基于图像的 E2E 大模型并不擅长,像上面那位朋友依赖 MCP 来完成游戏内信息获取和执操作指令是更好的思路
不过我看到示例游戏有异星工厂,难道新模型视觉能力又上一层了? |