正在做简历解析引擎,请帮忙测试 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
xunyu
V2EX    分享创造

正在做简历解析引擎,请帮忙测试

  •  
  •   xunyu
    xunyuw 2015-09-02 10:04:59 +08:00 6563 次点击
    这是一个创建于 3696 天前的主题,其中的信息可能已经有所发展或是发生改变。
    正在做 word 和 pdf 格式的简历解析引擎,现阶段框架完成,但数据集不完善,可能无法正确识别公司名等特征,请大家帮忙测试下,地址在 61.153.100.42 ,谢谢
    31 条回复    2019-08-31 15:33:00 +08:00
    BikeMan
        1
    BikeMan  
       2015-09-02 10:50:23 +08:00   2
    现在的 HR 这么厉害了, 用这种方式骗简历了.
    xunyu
        2
    xunyu  
    OP
       2015-09-02 11:06:10 +08:00
    @BikeMan 我不是 hr ,只是在做 nlp 相关的工作,简历的隐私对我不重要,只想测试公司,职位还有相关信息能否正确识别,调整模型,谢谢
    c742435
        3
    c742435  
       2015-09-02 11:19:16 +08:00 via iPad   1
    看起来很。为何不抓简历呢
    codeforlife
        4
    codeforlife  
       2015-09-02 11:24:40 +08:00   1
    简历的隐私对你不重要人家也不可能就这么发给你啊
    xunyu
        5
    xunyu  
    OP
       2015-09-02 11:35:54 +08:00
    @c742435 抓简历没啥技术难度,有人在做,解析才是难点
    @codeforlife 很有道理的,这个好像无解,我可能只能找 hr 帮忙了
    est
        6
    est  
       2015-09-02 11:38:06 +08:00   1
    搞个 paper 解析引擎。把双栏 pdf 搞成自适应纯文本的。
    xunyu
        7
    xunyu  
    OP
       2015-09-02 11:39:52 +08:00
    @est 恩, pdf 是下一步的工作,模型好了这个解析应该类似
    ljbha007
        8
    ljbha007  
       2015-09-02 11:45:21 +08:00   1
    我的简历是用 txt 写的怎么办
    javaluo
        9
    javaluo  
       2015-09-02 11:51:19 +08:00 via Android   1
    公司内部的解析,简直牛爆
    xunyu
        10
    xunyu  
    OP
       2015-09-02 11:51:58 +08:00
    @ljbha007 没关系, txt 比 word 格式更好处理
    lvfujun
        11
    lvfujun  
       2015-09-02 12:10:15 +08:00   1
    准确率有待提升哈.
    llhh
        12
    llhh  
       2015-09-02 12:47:53 +08:00   1
    Server Error (500 )
    xunyu
        13
    xunyu  
    OP
       2015-09-02 12:50:02 +08:00 via Android
    @lvfujun 恩,之前是用猎头提供的模板开发的,现在想匹配更多样式

    @llhh 多谢,我研究下是哪的问题
    ToysMall
        14
    ToysMall  
       2015-09-02 12:58:07 +08:00
    Server Error (500 )
    ToysMall
        15
    ToysMall  
       2015-09-02 12:58:13 +08:00   1
    Server Error (500 )...
    qq723985066
        16
    qq723985066  
       2015-09-02 13:03:37 +08:00   1
    我的简历使用 LaTeX 制作的,你这个能不能解析……
    wangleineo
        17
    wangleineo  
       2015-09-02 13:10:40 +08:00   1
    @xunyu nlp 用的是什么框架?还是自己的轮子?
    xunyu
        18
    xunyu  
    OP
       2015-09-02 13:13:54 +08:00 via Android
    @ToysMall 稍等,我检查下

    @qq723985066 这个还不能

    @wangleineo 底层是用的 hanlp 加字典,上层是自己写的
    xuxu412
        19
    xuxu412  
       2015-09-02 23:51:57 +08:00   1
    taleo 不是已经做的很好了么,我在这边投简历都是上传 PDF 然后下一页基本信息就都出来了。非常的准……
    Tedko
        20
    Tedko  
       2015-09-05 11:06:25 +08:00   1
    @xunyu latex 不能支持为啥 PDF 能支持。。。
    xunyu
        21
    xunyu  
    OP
       2015-09-06 09:39:59 +08:00
    @Tedko latex 里面可以有很多公式,这个没法处理
    @xuxu412 主要要积累一些基本语料还有是为了学习目的做的
    xunyu
        22
    xunyu  
    OP
       2015-09-08 10:08:14 +08:00
    @BikeMan
    @c742435
    @codeforlife
    @est
    @ljbha007
    @javaluo
    @lvfujun
    @llhh
    @ToysMall
    @ToysMall
    @qq723985066
    @wangleineo
    @xuxu412
    @Tedko
    多谢各位,已经完成基本模型验证
    Tedko
        23
    Tedko  
       2015-09-08 11:56:29 +08:00
    @xunyu 有公测了么))
    Tedko
        24
    Tedko  
       2015-09-08 11:58:27 +08:00
    对了。。支持不支持英文
    xunyu
        25
    xunyu  
    OP
       2015-09-08 12:07:44 +08:00 via Android
    @Tedko 现在只是内部测试,还没公测,不支持英文,我没有英文的训练集来做这个
    Tedko
        26
    Tedko  
       2015-09-08 12:38:50 +08:00
    @xunyu 可以给你英文训练集你要不要啊
    xunyu
        27
    xunyu  
    OP
       2015-09-08 12:44:22 +08:00 via Android
    @Tedko 要啊,你是 hr?
    Tedko
        28
    Tedko  
       2015-09-08 13:03:54 +08:00
    @xunyu 不是。。。怎么给你
    Tedko
        29
    Tedko  
       2015-09-08 13:04:49 +08:00
    @xunyu 你微博私信我?「泰德子_Suji 」
    xunyu
        30
    xunyu  
    OP
       2015-09-08 13:07:16 +08:00 via Android
    @Tedko 好的,
    anthonyli
        31
    anthonyli  
       2019-08-31 15:33:00 +08:00
    老哥,能提供点思路?语法分析做好了 怎么提取 基本信息 完全找不到北,一个小前端
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1083 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 23:14 PVG 07:14 LAX 16:14 JFK 19:14
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86