搜来搜去用 nodejs 做爬虫的介绍,都是些很基础的,如果只为学习是够用了,但如果想用它来做点什么,还都得是从头写起。其实,解析这部分重头写没什么好说的,不同网站不同规则吗,但做为爬虫最基本的队列呀,去重呀等很共性的功能部分,没找到有什么 nodejs 的框架能拿来就用。 所以,所以(想介绍下自己的东西,还非得说一些是非铺垫,嗯,鄙视自己),说一个我写的很简单的框架吧。
Crawl-pet 养一只爬虫宠物吧,已上传 npm ,安装如下
npm install crawl-pet -g
已开源到 Github : https://github.com/wl879/Crawl-pet
还有一篇使用的介绍: http://www.jianshu.com/p/1b9be0df5236
就请大家给看一看吧,怎么得,这回浏览量也的过 100 啊!
