
1 freed 2013 年 6 月 23 日 XX小偷? 这类小偷程序应该可以吧.. |
2 shiweifu 2013 年 6 月 23 日 写个爬虫不就行了 |
3 twamix 2013 年 6 月 23 日 火车头 AND ET2 |
4 jjplay 2013 年 6 月 23 日 http://www.demo2.org/ 高端反向代理采集 |
8 xieren58 2013 年 6 月 23 日 http://www.17qingsong.com/ 全自动,无人值守 |
10 yaotian 2013 年 6 月 23 日 刚搞得,连域名都没有。 10秒抓一次。 http://zhengyaotian.com:9999 |
11 huip 2013 年 6 月 23 日 这个应该很容易实现吧,把抓取的数据存储到数据库,然后在写一个中间件就可以了。 |
13 lyklykkkkkkk 2013 年 6 月 23 日 许多据说『月入几万』的垃圾站就是这么干的,收集文章+挂广告 |
14 xieren58 2013 年 6 月 23 日 @lyklykkkkkkk 对呀,我的那小站,每个月也能赚点~学那么多,不能变现,那也是白学~谁让生在天朝呢。一套房子压死很多程序猿了~ |
17 akira 2013 年 6 月 23 日 肯定可以啊。。。不然你以为各种垃圾站怎么来的,还有各种采集软件,都是谁买的 |
19 yaotian 2013 年 6 月 23 日 上面介绍的那个临时的站大家就别访问了, 和域名连上了 http://sche.mobi/ |
23 huazhouji 2013 年 6 月 23 日 via iPhone 垃圾站不是很容易被搜索引擎降权之类的吗?需要采集后做什么处理吗?还是采集的渠道有讲究?望赐教 |
24 efi 2013 年 6 月 23 日 有没有可能自动抓取网上邮箱并自动向邮箱发送广告? |
25 lovejoy 2013 年 6 月 23 日 最讨厌这种网站,尤其是有些完全是关键字没有内容的网站 |
27 yaotian 2013 年 6 月 23 日 @xieren58 真没看出来,不错。 我们建友情链接吧? 目前 http://sche.mobi 已经搞得相对满意了。 |
28 timothyye 2013 年 6 月 23 日 这类的程序很多的 |
29 quake0day 2013 年 6 月 24 日 这个自己写都不难,Python基础的urllib,urllib2库就能搞定。至于定时,用Crontab控制就行了。 |
30 zlwens 2013 年 6 月 24 日 原来拉圾站是这么有搞头啊 |
31 PrideChung 2013 年 6 月 24 日 建议你不要做这种无耻的行为。 |
33 tarsier 2013 年 6 月 24 日 via Android 不是我自视清高,我觉得在这里讨论垃圾站采集站复制别人内容来赚钱的行为不好。 |
34 xiiing 2013 年 6 月 24 日 网上原创文章并不多,很多门户网站也是转来转去的。转的时候加上来源是不是好一些? |
35 zippera OP @PrideChung 想到这个问题时纯粹是从技术角度出发的,也想练练手。看到大家讨论才意识到有些垃圾站是这么来的。但是,美味阅读这样的网站不也是采集来的吗? |
40 yaotian 2013 年 6 月 24 日 |
42 PrideChung 2013 年 6 月 24 日 via iPhone @zippera 美味爱读的网摘是ugc,并非自动采集。不过我觉得这样还是有问题,因为无论网站还是用户都没有得到原文作者的授权。 按照著作权法,全文转载是需要经过作者首肯的,即使保留了署名也需要作者同意。 |