一直不太明白为什么每个文件经过算法都能生成唯一的一个16位(或32位)hash代码,如果说一串密码经过md5加密之后得到唯一的16位代码还可以理解,可是不同的文件之间哪怕只有1个0和1的差别都会导致截然不同的16位代码,虽然是16位的字母数字组合,毕竟还是一个有限的集合吧 (应该是每一位总字符数的16次方个吧)而不同的文件应该说是个无限集合,远远大于前者,请问它们怎么能够做到一一对应?

1 reus Jan 17, 2012 via Android 做不到一一对应的,会出现碰撞,也就是不同的输入得到相同的输出。不同的算法碰撞率不同,所以安全性也有强弱差异 |
2 ch_linghu Jan 17, 2012 hash算法本来就做不到一一对应。hash算法的安全性在于:1. 对原文的微弱改动会引起hash值的巨大变化。2. 难以找到与指定原文对应的另一份原文,他们的hash值相同。 3. 难以找到两份不同的原文,他们的hash值相同。 不过 陈小云 证明了对于MD5算法来说,第三点可以在有限时间内做到。所以MD5的安全性已经大大削弱了。 |
4 surf Jan 17, 2012 做不到一对一对应 MD5是有冲突的 但是可以表示的范围已经很大了 2^128次 足够大 |
5 clino Jan 17, 2012 没办法一一对应,但是越好的算法越难构造碰撞的情况吧 |
6 likuku Jan 17, 2012 王小云那个,据说适用范围其实很窄,实用价值不大。 |
7 loading Jan 17, 2012 via Android 如果是一一对应,数据压缩算法都靠边了。 |
8 virushuo Jan 17, 2012 要弄明白这个得看看数论。 |
9 jaylong OP 感谢楼上各位的讲解 原来不是一一对应的啊,这就可以理解了 不过据我使用各大md5破解查询网站反查Md5加密前原始数值时基本没遇到过多于一个的结果 |
11 Platinum Jan 18, 2012 @CoX 不太可能,首先你得明白 md5 的 16^32 是多大的范围 我倒一直很想知道有哪两串有意义的字符串能有相同的 md5(比如两张图片或者两句话的 md5 一样) 王小云的那个,理论上可以做到,在可承受的时间内、通过给一个图片的 exif 里填充大量特殊字符串的方式,让这图片跟另外一张图片的 md5 相同 |
12 CoX Jan 18, 2012 @Platinum 额,是我记错了,应该是脚本语言算法有问题,搜到51js上一个类似的情况: http://bbs.51js.com/thread-5538-1-1.html 不过想让两张图片md5一样,目前貌似容易做到,搜索一下 fastcoll 这个工具 |