怎么面试高级 Python 爬虫工程师 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
MarsOnly
V2EX    职场话题

怎么面试高级 Python 爬虫工程师

  •  
  •   MarsOnly 2024-08-25 09:36:43 +08:00 2772 次点击
    这是一个创建于 420 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我是做 java 的,好多年前用 java 做过爬虫。最近朋友让帮忙面几个高级 Python 爬虫工程师,主要是从 0 搭建数据采集系统,主要是抓取一些新闻时事、自媒体网站的数据。

    关于 Python ,我的水平仅限于能写一些简单的脚本和 flask 服务。了解了下现在 Python 爬虫这块儿主要是 scrapy ,打算趁着周末写几个小 demo 熟悉一下。

    针对面试点,我自己结合自己的经验,打算围绕分布式爬虫系统的搭建、核心模块、反爬机制的策略、监控和预警这些。Python 这块儿朋友这边负责面试。

    请教一下大家,除了我准备的这些点,还有哪些地方需要问一下的。或者说我准备的内容有不合适的地方也请大家指正一下。
    11 条回复    2024-08-27 18:58:30 +08:00
    vitovan
        1
    vitovan  
       2024-08-25 09:42:28 +08:00
    给他出个题,让他先爬个知乎看看。

    /t/1067570
    Cooky
        2
    Cooky  
       2024-08-25 09:45:16 +08:00
    爬虫就是个糟心的活,专门干这个职位不划算
    lucasj
        3
    lucasj  
       2024-08-25 10:13:58 +08:00
    问计算机基础、编程修养、软件开发流程之类的就可以。你 java 问什么 python 啊,现学现用,怕不是给人看笑话。
    lasuar
        4
    lasuar  
       2024-08-25 11:39:15 +08:00
    你一个 python 初级+爬虫初级,你说怎么面 python 高级爬虫?高级爬虫爬的也是 app 了,这些你也不懂,没法面。。
    naythefirst01
        5
    naythefirst01  
       2024-08-25 13:32:18 +08:00
    现在爬虫重点先是反爬吧 然后是分布式这些正向开发能力,基本上都是先问有没有 XX 厂的商业产品逆向分析经验,如果不是大厂的话可以直接问他们的业务方向,有电商、社交平台、金融、AI ,“投其所好”就差不多了
    yoyo12
        6
    yoyo12  
       2024-08-25 21:33:42 +08:00
    爬了哪些网站,用了什么技术,能不能自动化。
    chi1st
        7
    chi1st  
       2024-08-26 09:09:32 +08:00
    主要看岗位是主工程能力还是主逆向能力,工程能力就正常后端那些东西,逆向的话估计你也不太懂。。。
    ik
        8
    ik  
       2024-08-26 09:21:13 +08:00 via iPhone
    没进去过的都不行,让对方在简历中附上改造经历
    zcybupt2016
        9
    zcybupt2016  
       2024-08-26 09:42:55 +08:00
    爬虫主要问逆向吧,都高级了其它基础内容随便问问就好
    brianinzz
        10
    brianinzz  
       2024-08-26 11:21:04 +08:00
    说实话有点难而且你如果不懂很容易忽悠你
    核心需要问的就是逆向能力 基本包括 加密算法逆向+过验证码
    根据目标网站不同 加密算法也都不一样 验证码主流的也很多 顶象 极验 阿里 每个都有自己的特点
    你没有上手做过你很难知道他是真的做过还是看一些文章忽悠你。
    我觉得如果没有利益相关还是不要“帮”朋友做 找专业的人来吧
    或者 业务很确定的情况下 你自己取爬一下这几个目标网站 看看有什么问题 跟面试问题结合结合
    aisk
        11
    aisk  
       2024-08-27 18:58:30 +08:00
    问问有什么对抗反爬虫的经验
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2547 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 35ms UTC 02:20 PVG 10:20 LAX 19:20 JFK 22:20
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86