vkit,一个面向计算机视觉(特别是文档图像分析与识别方向)开发者的工具包 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
huntzhan
V2EX    分享创造

vkit,一个面向计算机视觉(特别是文档图像分析与识别方向)开发者的工具包

  •  2
     
  •   huntzhan
    huntzhan 2021-11-30 12:56:59 +08:00 2475 次点击
    这是一个创建于 1415 天前的主题,其中的信息可能已经有所发展或是发生改变。

    传送门: https://github.com/vkit-dev/vkit

    一图胜千言:

    camera_cubic_curve.gif
    gaussion_noise.gif

    项目简介

    vkit 是一个面向计算机视觉(特别是文档图像分析与识别方向)开发者的工具包,特性如下:

    • 丰富的数据增强策略支持
      • 支持常见的光度畸变策略,如各类色彩空间操作、各类噪音操作
      • 支持常见的几何畸变策略,如各类仿射变换、各类非线性变换(如 Similarity MLS ,基于相机模型的 3D 曲面、翻折效果等)
      • 支持在几何畸变过程中,图片与各种标注数据类型的一致变换。例如,在旋转图片的同时,vkit 也可以同时旋转关联标注的位置信息
    • 较为全面的数据类型封装与可视化支持
      • 图片类型(基于 PIL 的封装,支持各类图片的读写)
      • 标注类型:蒙板( mask )、评分图( score map )、框( box )、多边形( polygon ) 等
    • 工业级代码质量
      • 友好的代码自动补全与类型检查支持,为开发体验保驾护航
      • 成熟的包管理与依赖管理机制
      • 自动化风格检查(基于 flake8 )与静态类型分析(基于 pyright )

    注:

    • 表示施工中,未完全支持
    • 表示本项目的亮点(其他项目没有,或是做得不够好的地方)

    项目愿景

    作者作为一名 CV/NLP 算法工程师,希望可以通过 vkit 这个项目,从以下几个方面给大家提供便利:

    • 将开发者从繁琐的数据治细节中解放出来,将宝贵的时间放在更有价值的工作上,如数据治理策略、算法模型设计与调优等
    • 整合常见的数据增强策略,助力文档图像分析与识别方向的科研工作、构建工业级场景数据方案(即工业界算法落地所需的那点 "secret sauce")
    • 构建工业级开源文档图像分析与识别解决方案(如扭曲复原、超分辨率、OCR 、版面分析等)
    7 条回复    2022-07-04 00:20:57 +08:00
    huntzhan
        1
    huntzhan  
    OP
       2021-11-30 13:19:09 +08:00
    自己打破零回复
    hvsy
        2
    hvsy  
       2021-11-30 13:39:52 +08:00
    先 star 为敬
    huntzhan
        3
    huntzhan  
    OP
       2021-11-30 13:47:34 +08:00
    @hvsy 感谢支持
    code4you
        4
    code4you  
       2021-11-30 21:14:28 +08:00
    问个初学者问题
    移动端开发 杂用这个
    huntzhan
        5
    huntzhan  
    OP
       2021-11-30 21:42:05 +08:00
    @code4you 目前 vkit 的设计运行环境还是 Linux 与 macOS 。原理上 vkit 基于 OpenCV 与 Numpy ,如果移动端有类似的 CV 库与科学计算库,基于这些库也能实现同样的算法,达到相似的效果
    haidaotao
        6
    haidaotao  
       2022-07-03 23:42:24 +08:00
    项目没了?
    huntzhan
        7
    huntzhan  
    OP
       2022-07-04 00:20:57 +08:00
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2716 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 36ms UTC 15:05 PVG 23:05 LAX 08:05 JFK 11:05
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86