
它会用 Gemini 先把视频看一遍,从中提取故事线然后构造时间线,过程中它会添加字幕、转场、裁切、生成背景音乐,当然也可以根据你的指示进一步修改。最后可以用 Remotion 来预览,也可以导出到 Final Cut Pro 做进一步调整。



最后导出的视频:https://www.youtube.com/watch?v=KcqQadtzAm8
Gemini 是目前试下来视频支持比较好的模型,虽然内部其实也是在以 1 帧每秒的形式去读截图,但关键是它能够输出视频画面对应的精确时间戳,这样才能用于后续的剪辑。至于视频的 token 消耗其实比我想象得要低,每秒大概 300 token ,用 Gemini 3 Flash 分析一小时的视频也就 $0.5 。
我的视频真的就是旅行的时候随手拍拍,没有脚本,也没有旁白,于是我这个工具就定位在了剪辑这种「无脚本」视频,只专注在剪辑上,并不会用 AI 生成任何的图像或解说(但背景音乐算个例外,是 AI 生成的)。
其实我做这个项目一开始只是想自己用,不然也不会用命令行界面了,现在就有点犹豫后续是改成一个基于网页的界面(甚至可以做 SaaS ),还是直接开源。
1 azhangbing 11 天前 好像很不错 我也有一堆没有剪辑的视频躺在 NAS 里 |
2 Aprdec 11 天前 诶哟 不赖 |
3 yuewolf 11 天前 大佬,你肯定对比过 Gemini 3.1 Flash-Lite 和 Gemini 3 Flash 预览版 吧? 就你实测,它们实际使用上的差别有哪些? 为什么选择了 Gemini 3 Flash 。 关于你的问题,我觉得你可以做一个 SaaS 版上线试一下,主要面向海外, 反正有 AI 写,很快的。 |
4 dassh 11 天前 没开声音,没细看,感觉没有足够的吸引力 另外,我买的 insta go ultra 好像也有间隙录相,自动剪视频的能力(不过没试过) |
5 jybox OP |
6 february2 11 天前 感觉以后随身运动相机这类设备会往这个方向发展,设备定时拍摄,然后软件一键式生成比较够看的 vlog ,觉得今年下半年应该就能实现了。 现在 dji nano 影石 go 系列都有间隔拍摄功能,只是剪辑部分不太智能。而像 looki 这种影响部分太弱,最后生成图太轻了,这两者结合,再加上 AI 加持的剪辑,应该不错。 |
7 yean 11 天前 有意思,发出来试试嘛 |
8 jinxgogo 11 天前 这个其实我很久之前就试过了,加了卡点转场等等,实测效果比较一般。两个问题:1. AI 主要是不能抓住用户真正想要剪进去的东西。2. 转场效果比较素,好的方式依然是套模版。 |
9 PC9528 11 天前 |
10 kokojack 10 天前 本人是剪辑师,看完我只能说,我剪辑行业还能活几年。 |