Livid
288.16D
532.7D
V2EX  ›  Claude

关于这个 Fable 5 通关 Pokémon FireRed 的视频

  •  
  •   Livid ·
    PRO
    · 1 day ago · 3842 views
    来自 Anthropic 官方:


    号称说只需要视觉能力。

    不知道具体是怎么搭建的环境,用 Claude Cowork 指向一个模拟器窗口吗?

    打算试试。
    19 replies    2026-06-10 12:17:24 +08:00
    409164
        1
    409164  
       1 day ago via iPhone
    蹲一个
    Ericcccccccc
        2
    Ericcccccccc  
       1 day ago
    我感觉现在 codex ( token 足够)要做到这个可能也是没问题的
    CITRON_K
        3
    CITRON_K  
       1 day ago
    本质是回合制游戏。我觉得 gpt 现在的模型也行
    supersf
        4
    supersf  
       19h 24m ago
    不给查看了。
    supersf
        5
    supersf  
       19h 18m ago
    Claude Fable 5 beats Pokémon FireRed only using vision

    Claude Fable 5 plays Factorio
    Livid
        6
    Livid  
    MOD
    OP
    PRO
       19h 17m ago
    @supersf 似乎他们又传了一个版本:

    supersf
        7
    supersf  
       19h 2m ago
    @Livid 是的,找官方号上找到了
    liuidetmks
        8
    liuidetmks  
       18h 11m ago
    对于麻将,围棋这类需要一点深度计算的游戏呢
    www12222
        9
    www12222  
       17h 56m ago
    👍
    shineonme
        10
    shineonme  
       17h 32m ago
    看到他们也拿 Fable 跑了 Slay the Spire ,之前我用 gpt-5.4 也跑了 Slay the Spire 2 的通关,不过没有用到视觉相关的能力: https://www.v2ex.com/t/1205343
    liuzimin
        11
    liuzimin  
       17h 24m ago
    真希望有朝一日能跑双影奇境。
    savingrun
        12
    savingrun  
       16h 53m ago
    有点意思🤔
    devilte
        13
    devilte  
       15h 35m ago
    如果 token 价格降下来,可以去梦幻西游做代练了吧
    thealert
        14
    thealert  
       15h 27m ago
    @liuidetmks 那是上一代模型卷积解决的问题 ,alphazero 已解决
    beimenjun
        15
    beimenjun  
    PRO
       15h 23m ago
    这种本质上属于妥妥的商用,侵犯了任天堂和 Game Freak 的版权了吧?
    solitude23456
        16
    solitude23456  
       15h 17m ago
    @liuzimin 这样就可以自己一个人玩了是吧
    grimbedroom
        17
    grimbedroom  
       15h 4m ago
    希望他们可以把工程放出来复现
    cairnechen
        18
    cairnechen  
       14h 55m ago
    之前看到过豆包的屏幕共享+实时视觉理解+语言互动的视频,是不是理论上也可以让豆包来玩这些游戏啊?
    cairnechen
        19
    cairnechen  
       14h 45m ago
    关于大模型的视觉能力,因为我之前做过 UI automation 相关的 skill ,我目前的感觉是语义理解没问题,但定位视觉元素和区域的能力很差,所以基于图像的 E2E 大模型并不擅长,像上面那位朋友依赖 MCP 来完成游戏内信息获取和执操作指令是更好的思路

    不过我看到示例游戏有异星工厂,难道新模型视觉能力又上一层了?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   986 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 62ms · UTC 19:02 · PVG 03:02 · LAX 12:02 · JFK 15:02
    ♥ Do have faith in what you're doing.