lanweizhujiao
V2EX  ›  问与答

『崩溃』 :肝了几天博文转视频的自动化流,卡在视觉表现和稳定性上,求老哥们指点架构思路!

  •  
  •   lanweizhujiao · Apr 15 · 927 views
    This topic created in 66 days ago, the information mentioned may be changed or developed.

    最近几天在捣鼓一个自动化项目,核心诉求就是把我手上攒的一批博文,全自动转成短视频发出去。

    我初步手搓了一个 MVP ,工作流大概是这样的: 博文 -> 提炼口语脚本 -> 切分镜 -> 视觉设计 -> AI 生成 Remotion 代码 -> 前端预览 -> 渲染成片

    目前主链路是跑通了,但是实际产出的效果简直没法看:

    画面太糙:AI 生成的视觉基本就是最简单的 Icon 拼凑加上硬切动画,毫无美感可言。

    排版灾难: 动不动就文字溢出。大模型脑子里根本没有屏幕尺寸和物理像素的概念,不知道换行。

    布局极不合理: 元素经常乱飞,因为从头到尾所有的内容都是 AI 自由生成的,毫无约束,导致极度不稳定。

    现在代码被 ai 搞的一塌糊涂, 我也懒得删除了,

    有没有成熟的方案,保证一下视频的下限

    另外附上我的技术栈: 前端: react + remotion 后端 fastapi + langchain/langgraph

    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2450 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 99ms · UTC 05:27 · PVG 13:27 · LAX 22:27 · JFK 01:27
    ♥ Do have faith in what you're doing.