昨天无意中发现自己的某篇文章外链出现在一个英文网站上,一看这不是前阵子发表在 cnblogs 上的吗? 然后查了一下该网站的 google 收录有一百多万了。 然后顺藤摸瓜顺便看来一下自己网站外链,很多文章都被采集站采集了。还有网站直接用我网站的图片,链接都不带改的,这些图片可都是花钱放在七牛上的。
说一说一下最近的发现: 1.最近 google 英文搜索搜出很多采集站,很多采集站的版面设计都很像,就是一个导航栏,几个文章分类,然后列表,挂几个 google adsense 广告。 中文采集站和英文采集站都有,版面设计都差不多。 2.被中文采集站采集,然后流量还都比我高,并且有的采集站流量高的吓人,有的冲进 alexa 前几千。
最后,我特么也想搞采集站了。老铁们博客发出来让我看看,该采哪个好
![]() | 1 vus520 2020-11-09 20:51:34 +08:00 ![]() 什么,落伍者已经凉了? |
2 waytocode 2020-11-09 21:17:37 +08:00 采集站迟早是被打击的 |
3 leemon 2020-11-09 21:23:09 +08:00 什么样的采集站?发出来看看长什么样 |
![]() | 4 opengps 2020-11-09 21:27:45 +08:00 高质量文章的需求确实越来越难了,所以微信公众号这种圈地流量才火了一把 公开网络上找资源里,怕是只会越来越低 |
5 IllBeBack 2020-11-09 21:30:39 +08:00 这个思路不错啊。 采集 Stackoverflow 翻译成中文 采集中文站翻译成英文 内容比伪原创强多了。 |
6 jzyzcz 2020-11-09 21:45:24 +08:00 赚一波就跑路 |
![]() | 7 WinG 2020-11-09 21:45:39 +08:00 十年前经常混 im286 u8881 之类的 曾经也有几百个站群 |
![]() | 8 forestyuan 2020-11-09 21:54:28 +08:00 爬虫加机器翻译,是不是就能做到全自动了 |
![]() | 10 veike OP @forestyuan 对,现在 AI 正文提取 |
![]() | 12 veike OP @waytocode 每次都说打击,结果采集站越来越多,主要是自然语言越来越成熟了。并且搜索引擎也没有明确说要打击采集站,打击的是垃圾站。 |
![]() | 13 LnTrx 2020-11-09 22:04:17 +08:00 ![]() 论采集的话,kknews.cc 这种应该是其中的代表,有文章专门分析过了 有趣的是,这种严重侵犯识产权的行为,却也把很多私域的文章给散播给了搜索引擎,还保留了一些原站已经挂掉的文章 |
![]() | 14 manami 2020-11-09 22:06:22 +08:00 ![]() 垃圾站没前途,让它采集 |
![]() | 17 wangyzj 2020-11-09 22:23:22 +08:00 非常之快,几乎不到一天就会从一个地方爬取到另外一个地方 |
![]() | 20 esatcj 2020-11-10 00:52:50 +08:00 有个叫什么 hotbkey (记不清了)的采集站,巨讨厌,每次想看的关键内容都被这个网站引流了。 |
21 pigmen 2020-11-10 01:05:32 +08:00 出口转内销 |
![]() | 22 GuLuDaDuiZhang 2020-11-10 02:19:25 +08:00 最近印象比较深的是个叫热备咨询的玩意,它把谷歌中文搜索结果给雷普了 |
![]() | 23 beibeijia 2020-11-10 05:22:21 +08:00 kknews 和 hotbak,都是采集界的巨头,发家致富靠采集的典范。 |
24 t6attack 2020-11-10 09:05:39 +08:00 这是 2008 年站长圈子里的一个帖子 ![]() 万能的中国站长已经占领过世界了。就按 50 万站长 1%有开发能力计算,你算算中国站长私下搞出了多少全自动建站程序? 现在还能被搜到的,已经是打击之后的死而复生的。也就是说,已经有一定门槛了,不是只向网络里塞垃圾就能获得流量的。要有一些 SEO 手段加成。 |
26 waytocode 2020-11-13 11:50:15 +08:00 把采集站的内容再次采集会怎样 |