如题.
![]() | 1 Pastsong 2016-08-14 22:47:08 +08:00 直接抓 API 不就好了 |
2 seaify OP @Pastsong 恩,取 api 是一种考虑方式,就变成了,构造 api 的可能输入参数了。 而 scrapy ,只需要管正则表达式的形式,提取合适的路径就可以了,只是碰到 angular 这种,传统的方法失效,非得走 scrapy 的话,还得套个无头浏览器,感觉那样性能也慢了 |
![]() | 3 bdbai 2016-08-14 23:58:15 +08:00 via Android 为什么思路要局限在 Scrapy 上呢,直接抓网络请求的话能快速解决很多问题。 |
4 xujialiang 2016-08-15 08:39:09 +08:00 via iPhone 后端渲染的,只能解析 html ,前后端分离的,就抓 api ,抓 api ,比解析 html 省事啊~~~ |
5 seaify OP 恩,会去直接使用 api ,用 scrapy ,只是会把 api 的列表放进去,使用 scrapy 的并发,延时,中间件机制,比如放一个代理中间件, user agent 随机切换中间件,但是不会去解析 html 了,前后端分离后,页面上的数据,很多也不再是传统后端渲染时,有特定的 clas 或 id 了,不方便提取,另外前端变化可能会更快了,毕竟分离出来了 |