![]() | 1 ericls 2015-06-20 16:41:56 +08:00 既然都用了 Python3 了 如果真的是「爬虫」,也应该用aiohttp之类的异步吧 |
![]() | 2 n37r06u3 2015-06-20 18:05:43 +08:00 都是漫黄站啊 |
![]() | 3 binux 2015-06-20 18:27:27 +08:00 人家明明有 API,你非得解析页面 http://konachan.com/post.json |
11 wudaown OP @binux http://konachan.com/post.json?page=2&tags=yuuki_asuna 是第二页的json http://konachan.com/post.json?page=1&tags=yuuki_asuna 是第一页的json ... 分析完一页不是要分析第二页么.. |
![]() | 19 KyoHiroki 2015-06-21 01:26:46 +08:00 1.html页面如果有用js生成的动态内容,你是爬不到的,json没有这个问题; 2.渲染html页面对服务器的负担比json大; 3.html页面可能会经常修改,不易维护。 |