请问各位如何反反爬虫软件 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
quatix
V2EX    问与答

请问各位如何反反爬虫软件

  •  
      quatix 2018-02-18 23:40:11 +08:00 4107 次点击
    这是一个创建于 2821 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现在反爬虫基本可以反 ChromeDriver 了, 检查以下位点,市面上的爬虫基本扑街 window _Selenium_IDE_Recorder,_selenium,callSelenium document __driver_evaluate,__webdriver_evaluate,__selenium_evaluate,__fxdriver_evaluate,__driver_unwrapped,__webdriver_unwrapped,__selenium_unwrapped,__fxdriver_unwrapped,__webdriver_script_func,__webdriver_script_fn document.documentElement.getAttribute ["selenium", "webdriver", "driver"] window callPhantom,_phantom

    请问有没有老哥有办法解决这个问题

    13 条回复    2018-02-22 16:35:47 +08:00
    quatix
        1
    quatix  
    OP
       2018-02-18 23:59:32 +08:00
    补充一下,说的是在 ChromeDriver 的情况下
    locoz
        2
    locoz  
       2018-02-19 00:44:25 +08:00 via Android
    那就直接不走模拟浏览器这条路呗
    binux
        3
    binux  
       2018-02-19 01:29:08 +08:00 via Android
    Isolated context
    quatix
        4
    quatix  
    OP
       2018-02-19 14:09:04 +08:00
    @locoz 因为有 websocket 在,抓包工作量更大,所以没办法
    quatix
        5
    quatix  
    OP
       2018-02-19 14:09:23 +08:00
    @binux 老哥说的孤立上下文是指?
    binux
        6
    binux  
       2018-02-20 01:47:17 +08:00
    @quatix #5 Chrome 支持 isolated world 机制,可以分割 page context 和注入脚本的 context,这样页面脚本就不能读取到任何注入的变量,从而不能通过这些判断了。
    你需要一个支持 isolated context 机制的实现,例如 https://electronjs.org/docs/api/browser-window 的 contextIsolation 选项。
    quatix
        7
    quatix  
    OP
       2018-02-20 13:41:15 +08:00
    @binux 谢谢 我查一下
    ysc3839
        8
    ysc3839  
       2018-02-20 18:45:07 +08:00 via Android
    直接用 CEF 就好了,可以做出几乎和真的浏览器一样的环境。
    quatix
        9
    quatix  
    OP
       2018-02-21 01:10:19 +08:00
    @ysc3839 CEF 操作起来不是很方便的样子,交互只能靠 js 模拟
    ysc3839
        10
    ysc3839  
       2018-02-21 01:38:04 +08:00
    @quatix 可以直接模拟用户输入啊……
    2624687861
        11
    2624687861  
       2018-02-21 17:34:12 +08:00 via Android
    我刚看到个帖子,怎么反反反爬虫软件(逃)
    quatix
        12
    quatix  
    OP
       2018-02-22 16:35:31 +08:00
    @2624687861 哇 老哥有 link 吗
    quatix
        13
    quatix  
    OP
       2018-02-22 16:35:47 +08:00
    @ysc3839 老哥很稳健!
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2945 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 00:36 PVG 08:36 LAX 16:36 JFK 19:36
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86