如题,现有一需求是将视频按关键帧分段,比如视频从 0-240 帧是一个拍男主角的镜头,241-500 帧是一个拍女主角的镜头,希望得到的输出结果是 0-240,241-500 。需求上希望切割越准确越好,但可以容忍一定的错误,并不要求 100%准确。
正常来说直接从源视频里划分区间就可以,但是因为拿到的数据是裸流,没有任何帧的标识,且未经压缩体积特别大。想问一下论坛里有没有做过的朋友,这个处理传统编码器中应该有比较成熟的方案,不需要利用机器学习之类的方法就能得到比较良好的结果。
我观察了一下,默认使用 x265 压缩视频得到的区间划分就挺不错的,但是问题是 x265 转码一遍再提取出关键帧这太慢了啊