
1 mikawudi 2013 年 6 月 30 日 和语言没啥关系,主要是看看图像处理方面的东西吧,验证码就不用做边缘检测了,简单的二值化处理下,然后分割一下,每个分割出来的数字(字母)的每个像素和标准的数字(字母)图像的每个像素点做异或运算,然后统计下和哪个标准数字(字母)图像的相似度最高,就是那个数字(字母)了....不过要考虑干扰噪点啊,干扰线啊什么的,然后如果生成验证码的时候用了旋转啊什么的那么就很难匹配了....我只用C#做过简单实验....不过思路大概就是这样的吧 |
3 andyhu 2013 年 7 月 2 日 也可以直接deathbycaptcha人力解决 |
5 ufo22940268 2013 年 7 月 3 日 |
6 justin1989 2013 年 7 月 3 日 验证码里如果有扭曲和重叠,程序就基本搞不定了 |
7 VYSE 2013 年 7 月 3 日 试过tesseract这类OCR,对验证码基本无解,除非针对某类特殊优化 |