需求如下:
1. 我有一个文件夹,里面有九千多张大小不一的图片,我需要对每张图进行相似度计算。
2. 我希望通过我给定一个阈值,计算哪些图的相似度大于此阈值,复制至 result 目录中以“基准图”文件名命名的文件夹中。
3. 高性能运行,多线程 /其他方案。要求计算一万张图片的耗时在一分钟左右。
4. 要求以 Python 实现
尝试了通过多线程计算哈希的方式来实现,效果还不错,但是一万张图的耗时在 3000 秒左右。求更高效的方案。
1. 我有一个文件夹,里面有九千多张大小不一的图片,我需要对每张图进行相似度计算。
2. 我希望通过我给定一个阈值,计算哪些图的相似度大于此阈值,复制至 result 目录中以“基准图”文件名命名的文件夹中。
3. 高性能运行,多线程 /其他方案。要求计算一万张图片的耗时在一分钟左右。
4. 要求以 Python 实现
尝试了通过多线程计算哈希的方式来实现,效果还不错,但是一万张图的耗时在 3000 秒左右。求更高效的方案。
