做了个 CLI 工具用 AI 来剪辑 vlog 效果意外地还不错 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
jybox

做了个 CLI 工具用 AI 来剪辑 vlog 效果意外地还不错

  •  1
     
  •   jybox
    jysperm 11 天前 1264 次点击

    它会用 Gemini 先把视频看一遍,从中提取故事线然后构造时间线,过程中它会添加字幕、转场、裁切、生成背景音乐,当然也可以根据你的指示进一步修改。最后可以用 Remotion 来预览,也可以导出到 Final Cut Pro 做进一步调整。

    最后导出的视频:https://www.youtube.com/watch?v=KcqQadtzAm8

    Gemini 是目前试下来视频支持比较好的模型,虽然内部其实也是在以 1 帧每秒的形式去读截图,但关键是它能够输出视频画面对应的精确时间戳,这样才能用于后续的剪辑。至于视频的 token 消耗其实比我想象得要低,每秒大概 300 token ,用 Gemini 3 Flash 分析一小时的视频也就 $0.5 。

    我的视频真的就是旅行的时候随手拍拍,没有脚本,也没有旁白,于是我这个工具就定位在了剪辑这种「无脚本」视频,只专注在剪辑上,并不会用 AI 生成任何的图像或解说(但背景音乐算个例外,是 AI 生成的)。

    其实我做这个项目一开始只是想自己用,不然也不会用命令行界面了,现在就有点犹豫后续是改成一个基于网页的界面(甚至可以做 SaaS ),还是直接开源。

    第 1 条附言    11 天前
    有类似(非专业随意拍摄的无脚本 vlog )剪辑需求的朋友可以联系我交流试用,V2EX 主页有 Telegram 或 Twitter 私信。
    第 2 条附言    7 天前
    10 条回复    2026-04-15 18:41:32 +08:00
    azhangbing
        1
    azhangbing  
       11 天前
    好像很不错 我也有一堆没有剪辑的视频躺在 NAS 里
    Aprdec
        2
    Aprdec  
       11 天前
    诶哟 不赖
    yuewolf
        3
    yuewolf  
       11 天前
    大佬,你肯定对比过 Gemini 3.1 Flash-Lite 和 Gemini 3 Flash 预览版 吧?

    就你实测,它们实际使用上的差别有哪些?

    为什么选择了 Gemini 3 Flash 。

    关于你的问题,我觉得你可以做一个 SaaS 版上线试一下,主要面向海外, 反正有 AI 写,很快的。
    dassh
        4
    dassh  
       11 天前
    没开声音,没细看,感觉没有足够的吸引力
    另外,我买的 insta go ultra 好像也有间隙录相,自动剪视频的能力(不过没试过)
    jybox
        5
    jybox  
    OP
       11 天前
    @yuewolf 实际上有两个环节:
    - 视频内容分析(从视频生成内容摘要),Flash 或 Lite 都可以,价格其实也只是差了一倍而已,所以直接用 Flash 了
    - 视频剪辑(编辑时间线),这个就需要模型有比较好的注意力管理和工具调用能力,至少需要 Flash ,要效果更好就需要 Pro


    @dassh 很正常,因为本来就是随手拍拍,更多还是自己留个回忆,然后把几十 G 的原始视频删掉。
    february2
        6
    february2  
       11 天前

    感觉以后随身运动相机这类设备会往这个方向发展,设备定时拍摄,然后软件一键式生成比较够看的 vlog ,觉得今年下半年应该就能实现了。
    现在 dji nano 影石 go 系列都有间隔拍摄功能,只是剪辑部分不太智能。而像 looki 这种影响部分太弱,最后生成图太轻了,这两者结合,再加上 AI 加持的剪辑,应该不错。
    yean
        7
    yean  
       11 天前
    有意思,发出来试试嘛
    jinxgogo
        8
    jinxgogo  
       11 天前
    这个其实我很久之前就试过了,加了卡点转场等等,实测效果比较一般。两个问题:1. AI 主要是不能抓住用户真正想要剪进去的东西。2. 转场效果比较素,好的方式依然是套模版。
    PC9528
        9
    PC9528  
       11 天前
    我也在做一个自动视频剪辑的 cli, 用的是开源的 Qwen3VL 本地跑 50 分钟视频大概要 25 分钟左右, 现在用来剪辑直播里面的舞蹈片段
    kokojack
        10
    kokojack  
       10 天前
    本人是剪辑师,看完我只能说,我剪辑行业还能活几年。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2901 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 51ms UTC 03:25 PVG 11:25 LAX 20:25 JFK 23:25
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86