
1 SniperXu 2020-11-24 14:11:08 +08:00 你要习惯。。。 |
2 hoyixi 2020-11-24 14:13:20 +08:00 现在还写博客都是雷 F 写完还把链接发在大站点炫耀 or 企图引流的,那是爬虫们的衣食父母 |
3 natashahollyz 2020-11-24 14:14:11 +08:00 禁止一下右键,如果别人实在要强行扒,那也没办法 |
4 no1xsyzy 2020-11-24 14:21:35 +08:00 @natashahollyz 防不了爬虫…… |
5 Jooooooooo 2020-11-24 14:22:54 +08:00 网上写东西要有这种觉悟 |
6 lizeze 2020-11-24 14:28:15 +08:00 能被人转也是一种认可 |
7 natashahollyz 2020-11-24 14:28:34 +08:00 @no1xsyzy 加干扰码? |
8 dusays 2020-11-24 14:32:10 +08:00 正如一楼说的那样,要习惯啊!我可能比博主还惨,我算是一个写口水文的博主,博客是 dusays.com ~ 偶尔突发奇想,写了一些自以为的精文,没过两天,就发现百度有收录,不过收录的却不是我的网站,一看就是被转走了~ 博主没写原文地址,还声明是原创,接下来就是重头了! 联系这些博主,各个振振有词。又说是自己原创的,拒绝承认转载。又说是用户投稿的,平台不管真实作者。更有甚者,直说盗你文是看得起你~ 我前段时间还发帖询问,全静态的博客,有没有办法加密 html 文件,但不影响浏览器的解析,因为我经常被扒站! |
9 GetMoney 2020-11-24 14:39:01 +08:00 付费阅读 |
11 HelloWorld556 OP @dusays 看了一下那个人的博客,搜了几篇文章标题,别处都有,估计大部分都是爬虫来的,可能也有你的 |
12 xuanbg 2020-11-24 14:43:03 +08:00 随便了。但写好文,不问剽窃。 |
13 airplayxcom 2020-11-24 16:32:02 +08:00 CSDN 微微一笑~ |
14 bequt 2020-11-24 16:45:30 +08:00 即使被转载, 写得多精彩, 最后也会都停留在你的博客上 |
15 wvidc 2020-11-24 17:15:38 +08:00 习惯就好,我们开发的小功能被人开着公司倒卖,也一样只能习惯着 |
17 cs419 2020-11-24 17:29:20 +08:00 网上公开的东西,人家想盗,自然拦不住 可以适当提高对方的盗取成本 博文里多加配图+水印 文章里穿插点 超链接 加上博客链接 加点空格隐写术 |
18 toomlo 2020-11-24 17:33:02 +08:00 你这还算好的,见过那种抄袭了还来你博客下面评论他抄袭的吗... |
19 lovecy 2020-11-24 17:36:59 +08:00 确实,网上写东西要有觉悟。。 爬虫站 /爬虫号 /爬虫博+没有辨识能力的人很多,自己的东西变得不像自己的了很正常。。 |
20 Patrick95 2020-11-24 17:39:35 +08:00 等你洞察到网上采集站的规模之后 你就放宽心了 |
21 Lemeng 2020-11-24 17:52:29 +08:00 瞬间不开心了,哈哈哈,可爱 |
22 muzuiget 2020-11-24 18:21:29 +08:00 看开点算了,现在哪怕 Google 搜中文,前面结果也是各种内容农场的网站,本来通用搜索引擎就是垃圾了,你在怎么优化也是白搭,还不如用垂直搜索引擎好。 |
23 dustin2016 2020-11-24 18:29:38 +08:00 我之前的 wqordpress 博客也被人镜像了 用了十几种防止爬取和镜像的方法 目前,已放弃治疗 |
24 ob 2020-11-24 18:40:17 +08:00 via Android 把文字内容全部转成图片加水印,大家觉得怎么样?就不管爬虫了。。 |
25 fasionchan 2020-11-24 18:47:21 +08:00 @GetMoney 付费阅读也不能幸免…… 我去年在慕课网写了一个 Python 源码剖析专栏: https://www.imooc.com/read/76 刚发表不久就发现被某些公众号抄了,只字未改…… 好在,微信公众平台上可以投诉,官方处理也快,不然真拿这些孙子没办法…… |
26 ragnaroks 2020-11-24 18:55:17 +08:00 匿名用户前 30%内容直接展现,后面内容需要登录可见 |
27 wenzichel 2020-11-24 18:59:20 +08:00 https://www.xiabingbao.com/post/blog/blog-be-cloned.html 曾经我的博客也被人爬过,是整站的爬下来。然后我就想着去工信部投诉这个网站,不过后面他把他网站上的内容给删了。 后来我就在 js 里加了一个域名的判断,如果是非自己的域名就跳转。就是不知道管不管用。 |
28 aristolochic 2020-11-24 19:34:41 +08:00 @dusays 不在乎 CDN 开销的话...可以用邪恶的私有字体。就是得费点儿劲。 大致就是字体和编号随机一对一重新排列,生成的 HTML 中的文本部分也做此处理 这种...也就别想被搜索引擎收录了 (不太清楚现在的采集站能不能发现 |
29 VgV 2020-11-24 19:36:41 +08:00 这种事情要淡定,如果不在乎搜索引擎可以把内容转为图片加水印。 |
30 Tyuans 2020-11-24 20:22:38 +08:00 看了看上面的,以后部分内容文字部分文字图片,倒是没什么用,也就是恶心恶心。 |
31 sDG9xz87SqqCC3mN 2020-11-24 20:23:52 +08:00 via Android 淡定,碰到好一点的会评论说自己转载的,坏的情况就是直接爬过去 |
33 dusays 2020-11-25 15:24:49 +08:00 @HelloWorld556 确实如此,不仅扒了我的内容,还有别人的站,就是个采集站,看到好的就扒! |
35 dusays 2020-11-25 15:59:38 +08:00 @aristolochic 倒也不担心被采集,只是希望转载之后,可以保留版权,别伪原创~ |