
方案有两个:方案一是打开网站->读取源代码->匹配 SRC 内的 JS 地址(但是这样做的话实际上并没有完全抓取到) 方案二打开网站->监听浏览器 network->匹配内容存在.js 的地址(因为部分网站的 JS 后面还存在一串字符 test.js457244asd24 这样)
目前的问题是浏览器 network 怎么监听呢?
1 c4f36e5766583218 2019-06-12 13:49:40 +08:00 <script ></script> 这样吗? |
2 x66 2019-06-12 17:28:03 +08:00 如果你用 selenium 来爬的话,selenium-wire 是你想要的 |
3 Jirajine 2019-06-12 17:36:25 +08:00 via Android mitm 抓包不好吗? |