




1 Doraemontree Apr 1, 2025 是不是繁体的不好识别 |
2 ShenZhen Apr 1, 2025 综合哪个好用? |
4 docx Apr 1, 2025 via iPhone 如果是简体呢 |
6 ha1o Apr 1, 2025 想问下,假设识别率 100%,后续是要把原字幕完全替换一遍生成新字幕吗?那岂不是要输入加载原字幕的视频? |
7 SakuraYuki Apr 1, 2025 |
8 pxiphx891 OP @SakuraYuki 这是什么软件? |
10 BluePadge Apr 1, 2025 |
11 PRStarDust Apr 1, 2025 试了一下 RapidOCR-API ,直接跳过了繁体哈哈哈 ```json { "0": { "dt_boxes": [ [ 206, 354 ], [ 513, 355 ], [ 513, 392 ], [ 206, 390 ] ], "rec_txt": "那我无论如何", "score": "0.9971" }, "1": { "dt_boxes": [ [ 228, 394 ], [ 490, 394 ], [ 490, 430 ], [ 228, 430 ] ], "rec_txt": "都要试一下", "score": "0.9877" } } ``` |
12 rqYzyAced2NbD8fw Apr 2, 2025 要不是现在的 vision llm 无法返回每个字的坐标,传统 OCR 估计直接被淘汰了 因为就算是人眼,识别文字也要靠上下文。比方说有些人可能会把看成葡萄。但是如果我说,“我要用插你屁眼”,那这两个字是什么一眼就明白了 |
13 icemaple Apr 2, 2025 一直在用 abbyy |
14 SakuraYuki Apr 2, 2025 @pxiphx891 #8 bob ,调用自带的 ocr 接口 |
15 Mar5 Apr 2, 2025 现在 OCR 我都丢给 Gemini ,我儿子小学 5 年级,字很差的 400 字作文 OCR 就错了 3 个字 |
16 obeyatonce Apr 3, 2025 api 调用百度高精度 ocr 的识别结果:那麽我无论如何都要嘈试一下 |
17 zggsong Apr 3, 2025 |
可以尝试拆字后识别再重新合并,会有包不错的提升 |
20 zggsong Apr 6, 2025 via iPhone |