试用了几个国内的表格 OCR 功能,大厂并不优秀啊 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
smark
V2EX    程序员

试用了几个国内的表格 OCR 功能,大厂并不优秀啊

  •  
  •   smark 2022-10-11 17:40:02 +08:00 4888 次点击
    这是一个创建于 1100 天前的主题,其中的信息可能已经有所发展或是发生改变。
    • 阿里 宫识别为官,周一识别为司一
    • 腾讯 周一识别为司一
    • 华为 周一识别为司一
    • 百度 没找到试用入口

    还不如一个叫薪火科技的公司,起码在我这张表格图中是正常的。 大厂宣称的技术实力在哪里呢?感觉反而更多的细分领域的小公司实力更强一点呢?

    第 1 条附言    2022-10-12 09:03:35 +08:00
    这个算是无意间帮打了广告,但是这个公司跟我确实利益无关(没找到修改原贴的地方,想屏蔽掉名字)。之前压根不知道这个公司,只是由于这次的经历产生一点对大厂技术盲目信任的动摇的感想。大家关注点可以在大厂和垂直细分小厂的技术对比上,非常想听听大家的观点~
    26 条回复    2022-10-14 10:40:09 +08:00
    wuxiaoqing234
        1
    wuxiaoqing234  
       2022-10-11 17:42:42 +08:00   4
    这是广告吗..
    hidemyself
        2
    hidemyself  
       2022-10-11 17:44:01 +08:00   3
    广告太硬了
    pq2Q3XZidsTF906J
        3
    pq2Q3XZidsTF906J  
       2022-10-11 17:49:52 +08:00
    多少钱,拉我入群有饭一起恰
    kiroter
        4
    kiroter  
       2022-10-11 17:50:51 +08:00
    所以你那个小厂是这样识别的吗? result = result.replace("司一", "周一"); doge
    JustSong
        5
    JustSong  
       2022-10-11 17:52:11 +08:00 via Android
    你是懂推广的
    zhw2590582
        6
    zhw2590582  
       2022-10-11 18:30:31 +08:00
    有钱一起赚啊
    icySoda
        7
    icySoda  
       2022-10-11 18:33:37 +08:00 via iPhone
    请问这么好的产品,怎么访问呢?
    RangerWolf
        8
    RangerWolf  
       2022-10-11 19:19:41 +08:00
    我觉得楼主不一定是硬广~
    我确实也对比过几家的服务,确实是一个不知名小厂的服务秒杀其他大厂的。

    PS: 百度的没有在线试用,直接申请。脚本不难写~
    watzds
        9
    watzds  
       2022-10-11 20:58:36 +08:00   2
    对的,小公司是靠这功能吃饭的,大厂不过是丰富一下功能
    Maxwe11
        10
    Maxwe11  
       2022-10-11 21:24:24 +08:00
    业务端不敢苟同,但是在此类技术领域,相比这些资源企业,百度还是更靠谱点儿的。
    aaa5838769
        11
    aaa5838769  
       2022-10-11 22:55:25 +08:00
    我个人觉得楼主不一定是硬广,之前有 OCR 需要,他们都提过测试的入口,但是测试结果还不如一个白猫 OCR 强,但是白猫不支持 API 接口对接。其次百度感觉对开发者比较优化,有免费提供测试的 API 接口的次数。
    freedgw
        12
    freedgw  
       2022-10-11 23:41:45 +08:00 via Android
    在公式识别等特别细分的领域可能是成立的,比如 mathpix ,就最准确,反观百度和 bing 的公式识别准确度都很差
    smark
        13
    smark  
    OP
       2022-10-12 08:59:42 +08:00
    @wuxiaoqing234 。。额,确实算是无意间帮打广告了,不过确实在这个点上符合了我的需求预期。
    smark
        14
    smark  
    OP
       2022-10-12 09:20:31 +08:00
    @RangerWolf 卧槽,同样的感受。这个小厂我是在搜索结果中随便点的,还有几个没有看,顺手吧名字带上来了,确实不是为了给他们打广告。
    @watzds 这么说也对,其实之前换工作也考虑过类似小厂,后来总觉的大厂技术实力比较雄厚,市场竞争可能会被大厂拿钱砸死,后来还是放弃了,这次经历又让我对这个观点产生了动摇
    smark
        15
    smark  
    OP
       2022-10-12 09:24:42 +08:00
    @Maxwe11 个人觉得百度在 AI 领域投入巨大,应该会好一点,只是没有提供上传图片直接试用的入口,就没有测试到。
    由于我试用这个 ocr 功能的初衷是帮媳妇儿识别排班表然后设置闹钟这个小需求,要体验百度的 api 需要注册百度云服务的相关账号+实名认证+领取免费次数+写 demo 等等,暂时搁置了( doge
    RangerWolf
        16
    RangerWolf  
       2022-10-12 09:33:25 +08:00
    @smark 我也是感觉百度在 AI 领域各种硬广,确实也用过他们的文心大模型,但是被表格的精度打败了。。。
    buliugu
        17
    buliugu  
       2022-10-12 09:39:07 +08:00
    今年 7 月份用过百度表格 OCR ,用了一个当时 sdk 里都没有写的 table ocr api (新上线接口,sdk 似乎没及时更新),效果感觉还不错
    SanjinGG
        18
    SanjinGG  
       2022-10-12 09:41:04 +08:00
    用的免费还是付费的?
    smark
        19
    smark  
    OP
       2022-10-12 09:49:57 +08:00
    @SanjinGG 试用嘛,免费的
    unknow1
        20
    unknow1  
       2022-10-12 11:20:49 +08:00
    前段时间有个客户也有这个需求,也试过各大厂商的接口,均不行。
    后来改变了客户的需求,把识别图片表格改成了解析 excel
    smark
        21
    smark  
    OP
       2022-10-12 12:14:37 +08:00
    @unknow1 有一说一,PM 能力可以的
    watzds
        22
    watzds  
       2022-10-12 14:13:08 +08:00
    https://www.xinhuokj.com/ocr/commonh

    核心技术团队来自 BAT 及科大讯飞等头部 AI 企业
    watzds
        23
    watzds  
       2022-10-12 14:14:49 +08:00
    这还是国家高新技术企业呢,OCR 结合 AI 语境上下文,估计是更加准确
    Maxwe11
        24
    Maxwe11  
       2022-10-12 17:49:09 +08:00
    @smark 深表理解,我家里是我妈干活儿,总有各种要求的统计数据,我妈这个年纪搞不定,就都“外包”给我来帮她做,这些事业单位真是做了一笔好买卖,笃定了不管多麻烦,家里肯定有人给兜底,这么算,她们的薪资水平其实划算的很 /doge
    PopRain
        25
    PopRain  
       2022-10-12 18:14:35 +08:00
    底层百度 paddlepaddle ,上层做一些语意调整,完美。。。。
    SanjinGG
        26
    SanjinGG  
       2022-10-14 10:40:09 +08:00
    @smark 没试过表格 ocr ,但之前用百度的高精度,在我的需求里是 100%精准的,可以试试
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     875 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 20:58 PVG 04:58 LAX 13:58 JFK 16:58
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86