众所周知,微信的 OCR 识别又快又准,于是就想提出来代替某某桨的识别
https://github.com/golangboy/wxocr
docker 拉取下来 直接 post 请求即可
docker pull golangboyme/wxocr
curl -X POST http://localhost:5000/ocr \ -H "Content-Type: application/json" \ -d '{"image": "BASE64_ENCODED_IMAGE_DATA"}'
![]() | 1 csx163 199 天前 nb ,不知道是不是和 win 版微信一个代码 |
![]() | 2 liuliuliuliu PRO 啊哈哈哈 牛逼 这个套路可以 |
![]() | 3 maocat 199 天前 via Android 你是真的牛 |
4 GetOctober 199 天前 哈哈哈 牛牛牛 赶快试试 |
![]() | 5 Numbcoder 199 天前 ,好奇怎么实现的,图片会发到微信服务器吗? |
6 x2ve 199 天前 需要联网吗 |
![]() | 7 xuangoer666 199 天前 via Android 南山必胜客警告 |
8 zgsi 199 天前 好家伙,不需要鉴权吗? |
9 someonesnone 199 天前 南山必胜客警告 +1 |
10 Blanke 199 天前 楼上的都不看看代码的吗,本地实现,用 ocr 模型这样实现的 |
12 ltmst 199 天前 |
![]() | 13 bybyte OP 各位可以进去看看 README 先,本地模型实现的 |
![]() | 14 cmsyh29 199 天前 |
15 GetOctober 199 天前 @bybyte 尝试了一下,返回结果是空: ``` {'result': {'errcode': 0, 'height': 190, 'imgpath': 'temp/ed9b119d-dc84-4a77-b3d2-8cd053e62fe5.png', 'ocr_response': [], 'width': 930}} ``` |
![]() | 16 ik 199 天前 via iPhone 大哥,哈啤酒 |
![]() | 17 bybyte OP @GetOctober 这返回错误码是正常只是没识别到文字吧,是不是你图片上没文字?换张图试试?我这边测过了 |
![]() | 18 wqsdfdddd 199 天前 图片翻译能提取出来不? 感觉它的翻译效果挺好的, 主要是能保持原有样式 |
![]() | 20 bybyte OP @xuangoer666 我只是把一个大佬的项目整合一下,应该不会吧,有先例吗,有我就删库了 |
21 keller 199 天前 666 下午试试 |
![]() | 22 sunfly 199 天前 牛逼趁着删库前赶紧 clone 下来 |
23 woshivu 199 天前 我去,我怎么感觉微信的 ocr 不如其他的识别精准呀 |
24 leyoumake1997 199 天前 牛娃 |
25 GetOctober 199 天前 |
26 bigtear 199 天前 via Android 不错的项目,starstar |
![]() | 27 bybyte OP @GetOctober 我测试返回:OCR 识别成功!结果如下: {'errcode': 0, 'height': 190, 'imgpath': 'temp/4ec69547-1144-42ec-9911-dc1c4c932d01.png', 'ocr_response': [{'bottom': 74.109375, 'left': 36.328125, 'rate': 0.9704948663711548, 'right': 714.9375, 'text': 'WeChat OCR API Docker 微信 OCR API Docker', 'top': 43.59375}, {'bottom': 124.96875, 'left': 36.328125, 'rate': 0.9854483604431152, 'right': 614.671875, 'text': "A Dockerized REST APl service for text recognition using WeChat's OCR engine.", 'top': 108.984375}, {'bottom': 158.390625, 'left': 37.78125, 'rate': 0.9666333198547363, 'right': 494.0625, 'text': '使用微信 OCR 引擎进行文本识别的 Dockerized REST API 服务。', 'top': 139.5}], 'width': 930} |
![]() | 28 maxwel1 199 天前 哈哈哈,腾讯出了个 linux 版本亏大了,还有薅腾讯羊毛的。不过微信不同客户端的代码实现不太一样,不知道跟移动端是不是一样效果 |
29 lovestudykid 199 天前 ![]() 微信的条码、二维码识别也是遥遥领先,试过很多 AppStore 里专门的条码扫描 APP ,都不如微信。要是能做成一个单独的 APP 就好了。 |
![]() | 30 bigtan 199 天前 我看似乎跟 https://modelscope.cn/models/iic/cv_convnextTiny_ocr-recognition-general_damo 这个项目很像。我在本地部署了一个验证码识别的服务,用的是 https://huggingface.co/xiaolv/ocr-captcha, 基于读光训练的。 |
31 dbit 199 天前 确实有的图片一个字也识别不出来 |
![]() | 32 sunnysab 199 天前 @lovestudykid #29 微信(手机版)的二维码识别貌似用云端的。记得看到过相关技术文章,而且实际也能感觉出来。 |
33 dbit 199 天前 @GetOctober #25 这个图片我试了也识别不出来 |
![]() | 34 MonkeyJon 199 天前 我刚准备执行,发现公司不让用 docker ,已经卸载了 |
![]() | 35 swat199538 199 天前 @sunnysab 求技术文章,最近在优化公司的条形码识别和二维码识别速度 |
![]() | 36 yulgang 199 天前 |
![]() | 37 letitbesqzr 199 天前 wxocr-master docker run -p 5000:5000 --name wechat-ocr-api golangboyme/wxocr OCR4: OCR not supported 不支持 linux 么? |
![]() | 38 lengrongec 199 天前 一键封神 |
![]() | 39 cheese 199 天前 @lovestudykid 真*遥遥领先,又快又准 |
![]() | 40 break2002 199 天前 感谢,不会代码的人也用上了. |
41 lovestudykid 199 天前 @sunnysab 应该不是云端的,你看一下这个 repo 基于的 repo 就知道了,二维码识别的接口也逆向出来了 |
![]() | 42 xuangoer666 199 天前 via Android @bybyte #20 不好意思哈,没细看,看标题以为你是逆向了微信 |
![]() | 43 v1 199 天前 @swat199538 别想了。只是提取了 OCR 模型出来用,模型本身是黑盒,你用到公司里准备吃官司 |
44 newbee2000 199 天前 怎么用呢,docker 部署完之后提示 OCR4: OCR not supported * Serving Flask app 'main' OCR4: OCR not supported |
![]() | 45 ik 199 天前 我用 Linux 也识别不出来 #25 这个图片 , 好奇怪 |
![]() | 46 bybyte OP @newbee2000 @letitbesqzr @GetOctober 我在本地 window+docker 测试的都能正常,在云服务器上测试也是错误码 0 但是结果空,我猜测可能是不是模型用到什么硬件相关的 future 但是主机没提供所以出现这个问题 |
![]() | 47 zqqian 199 天前 LZ 的项目确实有 bug ,好几个图片都是返回空,跟 15 楼的结果一样 |
![]() | 48 zggsong 199 天前 ![]() 我是做成了 C#库、里面带个 demo 挺好用 https://github.com/ZGGSONG/WeChatOcr |
![]() | 49 shoaly 199 天前 期待一个二维码的版本出来 |
![]() | 50 letitbesqzr 199 天前 ![]() |
![]() | 51 Tink PRO 没 arm64 的 image 吗 |
52 TheGreatSage 199 天前 老哥,方便给个 tar 包嘛,某些原因无法在服务器上科学上网 |
![]() | 53 SakuraYuki 199 天前 @GetOctober #25 这个没啥识别难度吧,我用苹果自带的离线 ocr 识别出来是:WeChat OCR API Docker 微信 OCR API Docker A Dockerized REST API service for text recognition using WeChat's OCR engine. 使用微信 OCR 引擎进行文本识别的 Dockerized REST AP ! 服务。 就最后那个 api 的 i 被下划线影响识别成感叹号了 |
54 yishibakaien 199 天前 老哥,我本地 mac 起了 docker 后,调用接口报错呀,提了 issue 帮忙看看 |
55 keller 199 天前 win11 wsl2 部署成功,测试了 2 张图都能识别, 很棒! |
56 paopjian 199 天前 微信的相比于 paddleocr 速度更快更精准,还可以部署到 linux 上? |
![]() | 57 bybyte OP @letitbesqzr @newbee2000 https://github.com/swigger/wechat-ocr/issues/36 看看你处理器支不支持 avx2 cat /proc/cpuinfo | grep -o avx2 | uniq |
58 Heng20 199 天前 牛逼! |
59 GetOctober 199 天前 @bybyte 支持 |
60 keller 199 天前 25 楼的图我测试也没啥问题 { "result": { "errcode": 0, "height": 190, "imgpath": "temp/751a6b59-dc79-485c-93e0-94e0bf4bf7ae.png", "ocr_response": [ { "bottom": 74.109375, "left": 36.328125, "rate": 0.9704948663711548, "right": 714.9375, "text": "WeChat OCR API Docker 微信 OCR API Docker", "top": 43.59375 }, { "bottom": 124.96875, "left": 36.328125, "rate": 0.9854483604431152, "right": 614.671875, "text": "A Dockerized REST APl service for text recognition using WeChat's OCR engine.", "top": 108.984375 }, { "bottom": 158.390625, "left": 37.78125, "rate": 0.9666333198547363, "right": 494.0625, "text": "使用微信 OCR 引擎进行文本识别的 Dockerized REST API 服务。", "top": 139.5 } ], "width": 930 } } |
![]() | 61 Goalonez 199 天前 微信截图后的翻译也挺好用的,直接在原图上翻译 |
62 yusf 199 天前 |
![]() | 63 asmoker 199 天前 我操,好使啊,还快,比 pd 啥 ocr 不知道高到哪里去了 |
![]() | 64 iorilu 199 天前 原始版本是怎么出来得 不可能逆向 wechat 得把 |
![]() | 65 Songxwn 199 天前 支持,给星星了 |
![]() | 66 BreezeConfirming 199 天前 呜呼谢谢楼主。从隔壁来的,之前就看到 issue 有说 linux ocr 实现了那不进一步 docker 。之前一直想做奈何没有技术力,现在真的造福社区了! |
![]() | 67 IssacTseng 199 天前 能否把微信的截图和 OCR 一起提出来做成一个独立软件,这样就完美了。。。 |
![]() | 68 A3m0n 199 天前 @letitbesqzr 和楼主合作下,把这个 U I 做进 Docker 里面。 |
![]() | 69 blushyes 199 天前 不能商用吗? |
![]() | 70 gwy15 199 天前 mark 一下,看看能不能对接到 mtphotos |
71 3499 199 天前 |
![]() | 72 TanKuku 199 天前 {"error":"400 Bad Request: The browser (or proxy) sent a request that this server could not understand."} |
73 Darley 199 天前 只是做识别放不进应用场景啊,我用的图片理解大模型,直接 json 输出想要的格式 |
74 sn0wdr1am 199 天前 没有开源协议,有侵权风险。 年轻人就是猛,抄起键盘就是干。 南山必胜客都不怕。 |
![]() | 76 gorira 199 天前 日文韩文效果怎么样?可以的话是个翻译本子的好利器( |
![]() | 77 daimaosix 199 天前 牛逼,非常好用!配上 czyt 大哥提供的前端爆了! |
![]() | 78 iorilu 199 天前 看这 docker 实现, 意思是可以在 linux 脱离安装微信 在 win 上能不能做到 意思就是只放必要得文件, 不一定安装微信, 这样可以独立做成一个软件包, 供 python, c 等其他语言直接调用 |
79 lloovve 199 天前 via iPhone Docker 下不了了 |
80 bzj 199 天前 楼主好人,微信那个软件基本上废了 |
![]() | 81 simo 199 天前 一直想做没做的事儿,你搞出来了,nb ! |
![]() | 82 yiqiao 199 天前 佩服楼上的行动力。 |
![]() | 83 superhuai 199 天前 mac !!! |
![]() | 84 paradoxs 199 天前 希望能增加一个功能:支持直接上传本地 pdf 文件(自带 pdf 转 base64 ) 这个功能非常重要。 不然要我们一张一张图片手动的去转 base64 ,很麻烦。 |
![]() | 85 conglovely 199 天前 楼上老哥的行动力是真强 |
![]() | 88 roding 199 天前 支持一下! |
![]() | 89 Liqiniu 199 天前 |
90 GetOctober 199 天前 @bybyte linux 不能执行问题解决了,应该是你编译的 wcorc 存在问题 |
91 V3geD4g 199 天前 使用 docker run -d -p 5000:5000 --name wechat-ocr-api golangboyme/wxocr 命令 启动失败,查看 log 报错 OCR4: OCR not supported 是咋回事呢 |
![]() | 92 Guidoo 199 天前 |
93 zjun5556 199 天前 我就逛 v 站能学到好东西 |
![]() | 94 unco020511 199 天前 这个在 windows 上能运行吗 |
![]() | 95 lizhenda 199 天前 真厉害,能不能搞成个库调用 |
![]() | 96 ko20 199 天前 OP 可以帮我看看为什么 OCR 失败了吗,如下图 https://image.940304.xyz/i/2025/03/25/67e26fd5b19b8.jpg 自部署了,但是返回如下 ``` {"result":{"errcode":6,"height":0,"imgpath":"temp/6ff6e294-115f-4cf2-b897-1e2143f50761.png","ocr_response":[],"width":0}} ``` 看了一下容器日志,如下 ``` xxx - - [25/Mar/2025 08:39:34] "POST /ocr HTTP/1.1" 200 - xxx - - [25/Mar/2025 08:41:44] "GET /ocr HTTP/1.1" 405 - xxx - - [25/Mar/2025 08:41:44] "GET / HTTP/1.1" 404 - xxx - - [25/Mar/2025 08:41:44] "GET / HTTP/1.1" 404 - xxx - - [25/Mar/2025 08:42:44] "GET /ocr HTTP/1.1" 405 - xxx - - [25/Mar/2025 08:44:36] "POST /ocr HTTP/1.1" 200 - ``` |
97 000sitereg 199 天前 star fork 一气呵成 |
![]() | 98 wq2016 199 天前 我想要语音识别 - - |
99 macaodoll 199 天前 人才...... |
![]() | 100 mywaiting 199 天前 这个想法我也有过,啧啧,这行动力简直爆炸! |