
1 Yc1992 2016-05-31 15:44:45 +08:00 抓包分析请求 |
2 wizardoz 2016-05-31 15:46:27 +08:00 表格里面的内容有可能是 ajax 或者 websocket 获取的,并不是在请求页面的时候就有。 |
4 wizardoz &nbs; 2016-05-31 15:47:58 +08:00 如果是 ajax 那好办,用浏览器的 F12 看看它请求了什么东西就可以了。 如果是 websocket 就难办了。 |
5 mrwangrj 2016-05-31 16:00:05 +08:00 phantomjs |
6 SlipStupig 2016-05-31 16:10:26 +08:00 @wizardoz iframe ajax 表单字段随机化,有没办法不开浏览器能直接跑通 |
7 twilight OP 感谢各位热心回复。 搜了搜,好像有用 PythonWebKit 或 PyQtWebKit 来做的。 |
8 wujunze 2016-05-31 16:49:17 +08:00 phantomjs +1 |
9 mingyuejingque 2016-05-31 17:24:13 +08:00 phantomjs + 2 , 配合 casperjs 可以搞很多小动作,嘿嘿嘿 |
10 tkpc 2016-05-31 17:32:57 +08:00 system("google-chrome") |
11 jiezhi 2016-05-31 17:35:16 +08:00 selenium + phantomjs 呢 |
12 xinali 2016-05-31 17:45:28 +08:00 有两种思路,一种是如果你想分析 js 处理后的网页源码可以使用 selenium+phantomjs ,但是有坑在携带 cookie ,修改 header 等方面。一种是用 requests 获取到网页未经 js 处理的代码,之后分析网页的 js 处理情况并结合 nodejs 对网页进行二次加工,这样而且可以极大的加快你的处理速度,具体的可以看我写的这个 http://xinali.github.io/2016/05/22/python%E5%A4%84%E7%90%86js%E7%BD%91%E9%A1%B5/ |