基本没有噪点的图片,很纯净的数字.
1 zzj0311 2019-01-23 22:37:16 +08:00 via Android 那么规整 mask 套不就完了。。 |
2 nicevar 2019-01-23 22:38:40 +08:00 直接调用 tesseract 就行了,或者用百度的 ocr 也行,这种简单的数字一天能有 5w 次免费额度 |
3 lsvih 2019-01-23 22:38:42 +08:00 tesseract |
4 xiumie 2019-01-23 23:05:28 +08:00 tesseract py |
![]() | 5 codelover2016 OP |
![]() | 6 codelover2016 OP @zzj0311 mask 是哪个库? |
7 Geno1024 2019-01-23 23:41:51 +08:00 直接打字符像素点的匹配不就是了…… |
![]() | 8 Vegetable 2019-01-23 23:50:03 +08:00 via iPhone @codelover2016 这个绝对 tesseract 绝对可以的,甚至不需要训练。 注意一下参数,纯数字,单行,英语。具体参数不记得了。 |
9 nicevar 2019-01-23 23:58:24 +08:00 @codelover2016 这种纯数字太简单了,你需要 tessdata,python 用 pytesseract 库就行了 |
![]() | 10 tomczhen 2019-01-24 00:09:34 +08:00 这种程度的 tesseract 绝对可以了,之前弄着玩了一下,比这个复杂多了的也有 70%的正确率。 |
![]() | 11 ioven 2019-01-24 09:48:14 +08:00 百度、腾讯、搜狗的 ocr 都能识别 |
![]() | 12 liberize 2019-01-24 10:01:24 +08:00 tesseract 参数你没设对吧,这种 100%识别率吧 |
13 linap 2019-01-24 13:41:04 +08:00 via Android 分割成相同宽度,取 5 个特征点,搞定 |
![]() | 14 locoz 2019-01-24 23:01:42 +08:00 这种简单的纯数字可以切片好直接对比像素点,比 OCR 的效率还高 |
![]() | 15 codelover2016 OP @liberize 能不能伸手党要个代码... |
![]() | 16 codelover2016 OP @locoz 这个非常有道理... |
![]() | 17 liberize 2019-01-26 11:46:36 +08:00 @codelover2016 $ cat test.py import pytesseract from PIL import Image img = Image.open('test.jpg') print pytesseract.image_to_string(img, lang='eng', cOnfig='-psm 6 digits') $ cat digits tessedit_char_whitelist 0123456789 debug_file /dev/null $ python test.py 659208134 digits 文件放到 .py 相同目录(也许可以写到代码里,自己研究吧) |
![]() | 18 liberize 2019-01-26 11:48:42 +08:00 额,少复制了一个 7,实际结果是对的,你自己试试把 |
![]() | 19 liberize 2019-01-26 11:49:19 +08:00 模板匹配也可以,代码稍微多点,自己写吧 |
![]() | 20 Nick2VIPUser 2019-01-26 18:48:38 +08:00 |