血压计数值图片识别怎么实现? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题复制粘贴 AI 生成的内容
utodea
V2EX    程序员

血压计数值图片识别怎么实现?

  •  
  •   utodea 2024-01-02 15:49:23 +08:00 3558 次点击
    这是一个创建于 699 天前的主题,其中的信息可能已经有所发展或是发生改变。
    需求背景:想做个 App 方便我妈记录血压、心跳,老人家懂基础拍照,但打字这些玩不顺溜。因此想着让她每次量完血压后拍个照片,App 自动识别血压和心跳计数,上传到服务端。

    1.尝试了几个大模型的图片聊天,给了非常清晰的照片,一问血压计数就没一个能行的,全是乱猜的。心跳则完全识别不出来了。
    2.尝试了百度的 OCR 图片识别服务,识别度完全就不能用。


    是否有大佬可以推荐质量好的图片识别服务(针对血压计的),或者有没有大佬推荐其他方案可以快速自己训练一个针对血压计的算法?
    第 1 条附言    2024-01-03 21:13:39 +08:00

    折腾了一会儿,最后用了 @musi 提到的方式实现了一个小 Demo,百度云 OCR + GPT 的方式。 缺点是不太稳定,GPT 提取血压和心跳有时候提取不出来,自己提取可能比较麻烦。

    附上几张效果图

    大佬提到的其他办法,我去探索一下,再次感谢大家的指点!

    36 条回复    2024-01-04 10:09:44 +08:00
    mxT52CRuqR6o5
        1
    mxT52CRuqR6o5  
       2024-01-02 15:52:43 +08:00
    现在 chatgpt 的多模态就是简单的把不同能力的多个模型拼接起来,类似于训练出几个残疾人让他们协同干活
    google gemini 号称是原生多模态,相当于直接训练出一个健全人,不过 ultra 还没出,也不知道具体效果如何
    3IOhG7M0knRu5UlC
        2
    3IOhG7M0knRu5UlC  
       2024-01-02 15:53:54 +08:00 via Android   1
    如果是记录,买个中档不是自带功能吗
    utodea
        3
    utodea  
    OP
       2024-01-02 15:58:15 +08:00
    @GooMS 嗯,现在确实是有自动上传数据的血压计。但想到图片这种方式,看看有没有办法能实现出来。
    idle0init1
        4
    idle0init1  
       2024-01-02 16:00:53 +08:00 via iPhone
    买个带数据记录功能且支持手机的血压计就可以了。
    koto
        5
    koto  
       2024-01-02 16:03:09 +08:00
    买个高级的血压表就好了。
    hackerMu
        6
    hackerMu  
       2024-01-02 16:04:49 +08:00
    买那种支持蓝牙的,直接同步手机 app 。不然还要拍照多麻烦
    yolee599
        7
    yolee599  
       2024-01-02 16:09:30 +08:00
    很多血压计都可以自动发测量结果到子女微信了,直接买来用就行
    utodea
        8
    utodea  
    OP
       2024-01-02 16:13:59 +08:00
    统一回复:其实是想看看图片识别这种方式,有没有办法能实现出来。

    元旦回家碰到这个问题的时候,第一反应就是上京东搜有没有联网款的。
    3IOhG7M0knRu5UlC
        9
    3IOhG7M0knRu5UlC  
       2024-01-02 16:24:13 +08:00 via Android   2
    用 opencv 当成二维码识别去设计,字形也都是固定的
    3IOhG7M0knRu5UlC
        10
    3IOhG7M0knRu5UlC  
       2024-01-02 16:24:27 +08:00 via Android
    说错了,验证码
    elboble
        11
    elboble  
       2024-01-02 16:30:54 +08:00
    这个不用 ai 把,ocr 就行,你发张图来试试
    maomaosang
        12
    maomaosang  
       2024-01-02 16:34:47 +08:00   1
    led 屏的话,百度 paddleocr 有个专门针对此种字体的模型,如果效果仍然不佳,也可以拿一些图片自行训练 paddleocr
    mightybruce
        13
    mightybruce  
       2024-01-02 16:39:35 +08:00
    这个问题不需要大模型,大模型也不是用来解决这类计算机视觉的问题。
    ocr 一般是正面拍照的纸张上文字,在一些复杂环境下无法使用,这种其实是 scene text recognition,
    传统的 OCR 很多是机器学习的算法,在弱光、混合光线下非平整表面一些识别率不高,
    深度学习一些模型还可以。
    你发一个图片才能知道是什么样的场景。
    musi
        14
    musi  
       2024-01-02 16:39:53 +08:00 via iPhone
    你得给个图,拍照的方式,光线会直接影响到准确度
    asmoker
        15
    asmoker  
       2024-01-02 16:41:08 +08:00
    https://www.healthcapture.com.hk/

    感觉这个符合楼主需求啊
    lyxeno
        16
    lyxeno  
       2024-01-02 16:54:35 +08:00
    其实可以试试京东京造的 手腕式血压计,样子是一个很胖的手表。支持蓝牙连接手机,测完会自动上传数据到 app
    我给家里买了一个,只要测量时姿势正确,数据就和血压计测出来的一样

    图片识别方式感觉很吃拍照角度
    utodea
        17
    utodea  
    OP
       2024-01-02 16:54:42 +08:00
    @elboble @mightybruce @musi

    几张我测试用的图。感谢指点!




    utodea
        18
    utodea  
    OP
       2024-01-02 16:58:14 +08:00
    @GooMS @maomaosang 我去研究下,感谢指点。

    @asmoker ,我下个试试看。
    009694
        19
    009694  
       2024-01-02 17:00:02 +08:00 via iPhone
    那你不如买个小米新出的血压计 可以自动从蓝牙网关上传数据到云端 更稳定
    musi
        20
    musi  
       2024-01-02 17:22:17 +08:00   1
    用了第一张图使用了腾讯云的高精度 ocr ,返回的数据结果让 gpt 处理了一遍,得到以下结果:
    In summary:

    High Pressure: 120 mmHg
    Low Pressure: 75 mmHg
    Pulse: 86 beats per minute

    如果数字在图片中的位置差不多的话可以用程序筛选,就不用 gpt 了
    sadfQED2
        21
    sadfQED2  
       2024-01-02 17:25:19 +08:00 via Android   4
    你这种图片不能直接丢给 ocr ,你得先做预处理,把边缘没用的全部去掉。最新图片要白底黑字,只有你需要的信息。

    你这种图非常好处理,你看下 opencv 的阈值二值化方法,给个阈值先把边框啥的找出来,然后再裁剪。

    如果你啥都不想干,只想直接要结果的话,看看 yolo ,直接喂数据,只有 10 个数字,标注个两三万张图片估计就能拟合得很好了
    EdmondGUO
        22
    EdmondGUO  
       2024-01-02 17:37:50 +08:00   1
    对深度学习有了解的话,可以自己用 yolo 训练个模型,问题就是标注数据,通常需要上万的数据集标注
    https://github.com/ultralytics/yolov5
    vvxu
        23
    vvxu  
       2024-01-02 17:49:12 +08:00 via Android
    让老妈把照图片发给自己
    ticky1
        24
    ticky1  
       2024-01-02 18:13:47 +08:00
    有个小程序叫健康拍,可以试一试
    faninx
        25
    faninx  
       2024-01-02 18:13:53 +08:00
    这么精准的场景,要效果好不如自己训练一下
    dream7758522
        26
    dream7758522  
       2024-01-02 20:41:42 +08:00 via Android
    自己人肉识别得了。
    redocxz
        27
    redocxz  
       2024-01-02 20:59:10 +08:00
    多久量一次啊,你后台手动看下记录一下? 还能及时了解情况
    bluesenzhu
        28
    bluesenzhu  
       2024-01-02 21:01:26 +08:00 via Android
    这个我擅长,以前做过水表电表燃气表之类的 LED 读数识别,需要自己写算法。
    aiqinxuancai
        29
    aiqinxuancai  
       2024-01-02 22:50:10 +08:00
    这个问题不应该用技术解决
    aitianci
        30
    aitianci  
       2024-01-02 23:35:22 +08:00
    我直接丢给 Bing chat ,识别的很好啊
    elboble
        31
    elboble  
       2024-01-03 12:19:51 +08:00
    tangtang369
        32
    tangtang369  
       2024-01-03 14:54:09 +08:00
    开源的 ocr 大概率不行
    从你发的图片来看这个大于 100 以后 百位和十位和个位隔的太远了
    sampeng
        33
    sampeng  
       2024-01-03 17:00:22 +08:00
    折腾时间够买一个带云功能的血压计了。。
    utodea
        34
    utodea  
    OP
       2024-01-03 21:23:08 +08:00
    @vivcha #23 @dream7758522 #26 好办法(狗头)

    @bluesenzhu #28 大佬有代码可以学习一下不?

    @aitianci 我去试下看看

    @elboble 膜拜大佬
    Sricecake
        35
    Sricecake  
       2024-01-04 09:54:55 +08:00
    花 200 块钱找个大学生
    utodea
        36
    utodea  
    OP
       2024-01-04 10:09:44 +08:00
    @Sricecake 哈哈。以前我帮别人写大作业的时候可没这么贵的!
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3578 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 29ms UTC 10:33 PVG 18:33 LAX 02:33 JFK 05:33
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86