关于 OCR 识别截图问题 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
x1n04
V2EX    问与答

关于 OCR 识别截图问题

  •  
      x1n04 222 天前 1366 次点击
    这是一个创建于 222 天前的主题,其中的信息可能已经有所发展或是发生改变。

    看到市面上有很多上传基金页面截图,就能自动获取到买了哪些基金,收益率是多少。 想问下大佬们,这是通过 OCR 特定位置识别的嘛? 感觉实现起来很麻烦,有位置问题,字体问题,暗黑模式问题等等

    9 条回复    2025-03-11 08:55:55 +08:00
    Daimaogou
        1
    Daimaogou  
       222 天前 via Android
    上大模型
    x1n04
        2
    x1n04  
    OP
       222 天前
    大模型没有 OCR 便宜吧。主要是个人产品
    x1n04
        3
    x1n04  
    OP
       222 天前
    @Daimaogou #1 大模型没有 OCR 便宜吧。主要是个人产品
    Mithril
        4
    Mithril  
       222 天前
    单纯背景下,印刷体的数字识别率很高的。特别是你如果是固定布局,还能用相对位置进一步限定识别内容。

    基本的你找 Paddle 就可以了,大模型主要是能提高复杂背景,手写,或者多语言文本方面的识别率。
    fredsunme
        5
    fredsunme  
       222 天前
    如果你要从 0 开始 OCR ,考虑看看这个 base64: aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3RtYWNmcmFuay9hcnRpY2xlL2RldGFpbHMvMTM4NDEzMjg0

    原文我记得是 10 年前看的 也不确定是不是这个作者了
    而且现在都是 python 处理,你可以搜对应的 python 版本的,思路应该还是 opencv 做高斯模糊灰度二值膨胀分割那一套
    lower
        6
    lower  
       222 天前
    zhipu 的有个视觉模型 4v-flash 是免费的,白嫖吧
    datocp
        7
    datocp  
       221 天前 via Android
    之前看人家用 excel 做了一个 vba 抓取东方财富页面。后来不知道作者更新了什么,就出现了内存溢出问题。。。
    东方财富就是纯静态页面,用网页抓取软件应该很容易采集自己需要的数据。
    deacyn
        8
    deacyn  
       221 天前
    @x1n04 大模型很便宜,你这应该只是提取文字的需求吧
    Solace202
        9
    Solace202  
       221 天前
    碰巧公司有个业务碰到过类似场景,解决办法是分两步走:
    1. OCR 提取所有文字
    2. 将所有文字和你的要求组成 promot 喂给 gpt 或者 claude ,获得结果。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2666 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 32ms UTC 09:45 PVG 17:45 LAX 02:45 JFK 05:45
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86