小白依靠 GPT4 生成 PowerShell 按文件名筛选出国语影视种子 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
huntagain2008
V2EX    分享创造

小白依靠 GPT4 生成 PowerShell 按文件名筛选出国语影视种子

  •  
  •   huntagain2008 2024 年 7 月 11 日 1547 次点击
    这是一个创建于 573 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近常用的公共影视资源网站关闭,迁移到一个新网站,结果丢失了很多资源。我偶然发现有人发了十几个名为“老种子 xx”的帖子,上传了几十个 20 MiB 的 .rar 压缩文件(由于附件大小限制)。我一个个下载下来,虽然是老种子,但用网盘离线下载还是可行的。现在的问题是,我想找出国语音频的作品,该怎么筛选出国语音轨的种子列表。针对这个问题,我问了免费的 GPT4 。它直接帮我写 PowerShell 脚本:

    # 获取当前目录下的所有 .rar 文件 $rarFiles = Get-ChildItem -Path . -Filter *.rar # 存储符合条件的 .torrent 文件的信息 $matchingTorrents = @() # 正则表达式模式 $pattern = "Mandarin|CHS|CHINESE" # 遍历所有 .rar 文件 foreach ($rarFile in $rarFiles) { # 解压 .rar 文件并列出其内容 $cOntents= & 7z l $rarFile.FullName # 从内容中查找 .torrent 文件 $torrentFiles = $contents | Where-Object { $_ -match ".torrent" } # 查找文件名符合模式的 .torrent 文件 foreach ($line in $torrentFiles) { if ($line -match $pattern) { # 直接使用文件路径信息(原先 GPT4 给的-replace ".*(\d{2}-\d{2}).* ", "") $filePath = $line # 创建一个对象存储 .rar 文件名和 .torrent 文件路径 $torrentInfo = [PSCustomObject]@{ RarFile = $rarFile.FullName TorrentFile = $filePath } # 将对象添加到匹配列表中 $matchingTorrents += $torrentInfo } } } # 输出匹配的 .torrent 文件信息 $matchingTorrents | Format-Table -AutoSize 

    运行脚本

    将上述脚本保存为一个 PowerShell 文件,例如search_torrents_with_paths.ps1,然后在 PowerShell 中执行脚本:

    .\search_torrents_with_paths.ps1 

    (我的台式机 Windows10 默认禁止运行脚本,我是在交互式 PowerShell 直接粘贴代码运行的)

    后续列表有很多重复数据,为了去重,将文件改名为 .csv 文件并导入 Excel 。我用的是微软在线的免费 Excel ,通过数据功能进行文本拆分、筛选与去重。文件名包含年份,比如 2008 ,可以提取年份数字筛选出 2000 年以后的作品。

    关于怎么筛选出豆瓣评分 8 分以上的种子文件,我问过 GPT4 ,通过 Python 的 requests 和使用豆瓣的官方 API 获取数据。因为 GPT4 警告这样做有被封 IP 的风险,我就直接放弃了,只好人工查评分。

    第 1 条附言    2024 年 7 月 12 日

    补充

    用Excel 将文本拆分为列并不会一次就达到想要的效果。原因是文件名不规范,包含很多空格。 文件名有空格可以用批量文件改名软件如 FFRenamePro 将文件名中的空格去掉,然后得到 rarNames.csv 。 而 .rar文件内的 .torrent 文件名有空格,包含很多空格。用 awk 筛选文件名的字段得到 torrentNames.csv 。 最后用Excel打开这两个 .csv 文件放入一个 .csv 文件,A列-rar文件名、B列-相关种子文件名。 
    第 2 条附言    2024 年 7 月 13 日
    有时下载的影片与描述不符。比如,以为播的是戏曲《白蛇传情》,却是动画片《白蛇:缘起》。
    下载影片之前需在线预览确定一遍再下载。
    目前尚无回复
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     4433 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 35ms UTC 07:39 PVG 15:39 LAX 23:39 JFK 02:39
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86