开源地址:https://github.com/disingn/cliptalk 支持:
- 抖音去水印
- 抖音视频转文本(使用 gemini-pro-vision )
- geminikey 随机调用(多个)
由于没啥时间,就没写 web 界面,后续有时间会完成 web 界面,以及兼容 gpt4v 和更多的视频平台
ps:本人菜鸡,水平有限,大佬勿喷!

开源地址:https://github.com/disingn/cliptalk 支持:
由于没啥时间,就没写 web 界面,后续有时间会完成 web 界面,以及兼容 gpt4v 和更多的视频平台
ps:本人菜鸡,水平有限,大佬勿喷!
1 taxue67marx Jan 11, 2024 不错啊,写个小程序调用你写的接口,有空试试 |
2 simo Jan 11, 2024 赞一个 不过,抖音接口那个,bogus 一直固定就行? |
3 tool2d Jan 11, 2024 看了源代码,表示脑洞很大。新知识又增加了。 |
4 xyy003 OP PRO @taxue67marx 好 写的比较水 |
7 unco020511 Jan 11, 2024 star 了.视频转文本是啥意思,是指总结视频内容吗,还是指视频中语音识别自动添加字幕 |
8 xinyana Jan 11, 2024 via Android @unco020511 看了源码,根据视频截图分析内容,非常好的思路! |
9 xyy003 OP PRO @unco020511 截取视频帧然后使用 gemini-pro-vision 进行识别分析内容,最后使用 gemini-pro 整理整个视频的内容 |
10 mjchow Jan 11, 2024 这个是截取了视频部分 jpeg 图片来进行分析,如果图片少的话是不是分析会不大准确? 不过确实是挺好的思路,厉害! |
12 kylebing Jan 11, 2024 你头像是个什么玩意,看着挺有意思的。 |
16 dada88xyxy Jan 12, 2024 我一直想搞一个,用 ai 来读短视频,然后做一个网页,把短视频里面的文字抽出来,放在网页上面,页面的底部就可以跳转到原视频。痛点是解决搜索问题,很多时候其实视频里面有谈到我想要的关键词,但是无奈视频搜不精确,如果把视频的文字都抽出来,应该可以 |
17 xyy003 OP PRO @dada88xyxy 把音频提取出来,然后转录。后面我写个对应的接口好了 |
18 Hozoy Jan 12, 2024 如果抽帧识别的话,感觉会不太准确,同类的通义听悟是先把视频转文字,再从文字提取信息总结。。我感觉两个结合起来效果会更好 |
21 fruitmonster Mar 19, 2024 现在失效了是么? |