之前的主题都是文字性描述,可能不够直观。之前:t/411413
估计很多人没看明白,或者看不下去(体验不好。。。
刚做了几个动态图,用来演示爬山虎采集器的自动识别算法。
1.东方财富网的采集效果
2.新浪新闻的采集效果
3.v2 的效果
测试的都是列表页,爬山虎也能够深入到内容页去抓取(通过抓取链接的深入),也是非常简单。
目前来说,列表数据和分页的识别率都还可以。
相对于其他采集软件来说,优势就是稍微简单、方便点。
爬山虎采集器网站: http://www.51pashanhu.com/
(网站目前来说,做的很烂,准备优化一下 )
估计很多人没看明白,或者看不下去(体验不好。。。
刚做了几个动态图,用来演示爬山虎采集器的自动识别算法。
1.东方财富网的采集效果
2.新浪新闻的采集效果
3.v2 的效果
测试的都是列表页,爬山虎也能够深入到内容页去抓取(通过抓取链接的深入),也是非常简单。
目前来说,列表数据和分页的识别率都还可以。
相对于其他采集软件来说,优势就是稍微简单、方便点。
爬山虎采集器网站: http://www.51pashanhu.com/
(网站目前来说,做的很烂,准备优化一下 )
