今天搜自己的博客,发现了有一篇和自己一样的,还以为是被人转载了,还挺开心,结果看完发现作者和原链接都不是自己的,瞬间就不开心了 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
HelloWorld556
V2EX    Blogger

今天搜自己的博客,发现了有一篇和自己一样的,还以为是被人转载了,还挺开心,结果看完发现作者和原链接都不是自己的,瞬间就不开心了

  •  1
     
  •   HelloWorld556 2020-11-24 14:08:44 +08:00 5168 次点击
    这是一个创建于 1828 天前的主题,其中的信息可能已经有所发展或是发生改变。
    35 条回复    2020-11-25 15:59:38 +08:00
    SniperXu
        1
    SniperXu  
       2020-11-24 14:11:08 +08:00
    你要习惯。。。
    hoyixi
        2
    hoyixi  
       2020-11-24 14:13:20 +08:00
    现在还写博客都是雷 F
    写完还把链接发在大站点炫耀 or 企图引流的,那是爬虫们的衣食父母
    natashahollyz
        3
    natashahollyz  
       2020-11-24 14:14:11 +08:00
    禁止一下右键,如果别人实在要强行扒,那也没办法
    no1xsyzy
        4
    no1xsyzy  
       2020-11-24 14:21:35 +08:00
    @natashahollyz 防不了爬虫……
    Jooooooooo
        5
    Jooooooooo  
       2020-11-24 14:22:54 +08:00
    网上写东西要有这种觉悟
    lizeze
        6
    lizeze  
       2020-11-24 14:28:15 +08:00
    能被人转也是一种认可
    natashahollyz
        7
    natashahollyz  
       2020-11-24 14:28:34 +08:00
    @no1xsyzy 加干扰码?
    dusays
        8
    dusays  
       2020-11-24 14:32:10 +08:00
    正如一楼说的那样,要习惯啊!我可能比博主还惨,我算是一个写口水文的博主,博客是 dusays.com
    偶尔突发奇想,写了一些自以为的精文,没过两天,就发现百度有收录,不过收录的却不是我的网站,一看就是被转走了~
    博主没写原文地址,还声明是原创,接下来就是重头了!
    联系这些博主,各个振振有词。又说是自己原创的,拒绝承认转载。又说是用户投稿的,平台不管真实作者。更有甚者,直说盗你文是看得起你~
    我前段时间还发帖询问,全静态的博客,有没有办法加密 html 文件,但不影响浏览器的解析,因为我经常被扒站!
    GetMoney
        9
    GetMoney  
       2020-11-24 14:39:01 +08:00
    付费阅读
    myevery
        10
    myevery  
       2020-11-24 14:40:25 +08:00
    @dusays 这么惨啊。。。。
    HelloWorld556
        11
    HelloWorld556  
    OP
       2020-11-24 14:42:56 +08:00
    @dusays 看了一下那个人的博客,搜了几篇文章标题,别处都有,估计大部分都是爬虫来的,可能也有你的
    xuanbg
        12
    xuanbg  
       2020-11-24 14:43:03 +08:00
    随便了。但写好文,不问剽窃。
    airplayxcom
        13
    airplayxcom  
       2020-11-24 16:32:02 +08:00   1
    CSDN 微微一笑~
    bequt
        14
    bequt  
       2020-11-24 16:45:30 +08:00
    即使被转载, 写得多精彩, 最后也会都停留在你的博客上
    wvidc
        15
    wvidc  
       2020-11-24 17:15:38 +08:00
    习惯就好,我们开发的小功能被人开着公司倒卖,也一样只能习惯着
    tcp
        16
    tcp  
       2020-11-24 17:20:47 +08:00
    @dusays 后端文章数据加密,前段 js 解密?
    cs419
        17
    cs419  
       2020-11-24 17:29:20 +08:00
    网上公开的东西,人家想盗,自然拦不住
    可以适当提高对方的盗取成本

    博文里多加配图+水印
    文章里穿插点 超链接 加上博客链接
    加点空格隐写术
    toomlo
        18
    toomlo  
       2020-11-24 17:33:02 +08:00
    你这还算好的,见过那种抄袭了还来你博客下面评论他抄袭的吗...
    lovecy
        19
    lovecy  
       2020-11-24 17:36:59 +08:00
    确实,网上写东西要有觉悟。。
    爬虫站 /爬虫号 /爬虫博+没有辨识能力的人很多,自己的东西变得不像自己的了很正常。。
    Patrick95
        20
    Patrick95  
       2020-11-24 17:39:35 +08:00
    等你洞察到网上采集站的规模之后
    你就放宽心了
    Lemeng
        21
    Lemeng  
       2020-11-24 17:52:29 +08:00
    瞬间不开心了,哈哈哈,可爱
    muzuiget
        22
    muzuiget  
       2020-11-24 18:21:29 +08:00
    看开点算了,现在哪怕 Google 搜中文,前面结果也是各种内容农场的网站,本来通用搜索引擎就是垃圾了,你在怎么优化也是白搭,还不如用垂直搜索引擎好。
    dustin2016
        23
    dustin2016  
       2020-11-24 18:29:38 +08:00
    我之前的 wqordpress 博客也被人镜像了
    用了十几种防止爬取和镜像的方法

    目前,已放弃治疗
    ob
        24
    ob  
       2020-11-24 18:40:17 +08:00 via Android
    把文字内容全部转成图片加水印,大家觉得怎么样?就不管爬虫了。。
    fasionchan
        25
    fasionchan  
       2020-11-24 18:47:21 +08:00
    @GetMoney 付费阅读也不能幸免……

    我去年在慕课网写了一个 Python 源码剖析专栏: https://www.imooc.com/read/76
    刚发表不久就发现被某些公众号抄了,只字未改……
    好在,微信公众平台上可以投诉,官方处理也快,不然真拿这些孙子没办法……
    ragnaroks
        26
    ragnaroks  
       2020-11-24 18:55:17 +08:00
    匿名用户前 30%内容直接展现,后面内容需要登录可见
    wenzichel
        27
    wenzichel  
       2020-11-24 18:59:20 +08:00
    https://www.xiabingbao.com/post/blog/blog-be-cloned.html

    曾经我的博客也被人爬过,是整站的爬下来。然后我就想着去工信部投诉这个网站,不过后面他把他网站上的内容给删了。

    后来我就在 js 里加了一个域名的判断,如果是非自己的域名就跳转。就是不知道管不管用。
    aristolochic
        28
    aristolochic  
       2020-11-24 19:34:41 +08:00
    @dusays 不在乎 CDN 开销的话...可以用邪恶的私有字体。就是得费点儿劲。
    大致就是字体和编号随机一对一重新排列,生成的 HTML 中的文本部分也做此处理
    这种...也就别想被搜索引擎收录了
    (不太清楚现在的采集站能不能发现
    VgV
        29
    VgV  
       2020-11-24 19:36:41 +08:00
    这种事情要淡定,如果不在乎搜索引擎可以把内容转为图片加水印。
    Tyuans
        30
    Tyuans  
       2020-11-24 20:22:38 +08:00
    看了看上面的,以后部分内容文字部分文字图片,倒是没什么用,也就是恶心恶心。
    sDG9xz87SqqCC3mN
        31
    sDG9xz87SqqCC3mN  
       2020-11-24 20:23:52 +08:00 via Android
    淡定,碰到好一点的会评论说自己转载的,坏的情况就是直接爬过去
    dusays
        32
    dusays  
       2020-11-25 15:24:16 +08:00
    @myevery 我已经习惯了~
    dusays
        33
    dusays  
       2020-11-25 15:24:49 +08:00
    @HelloWorld556 确实如此,不仅扒了我的内容,还有别人的站,就是个采集站,看到好的就扒!
    dusays
        34
    dusays  
       2020-11-25 15:58:06 +08:00
    @tcp 没有后端,博客用的是 Hexo,直接生成 html 的页面~
    dusays
        35
    dusays  
       2020-11-25 15:59:38 +08:00
    @aristolochic 倒也不担心被采集,只是希望转载之后,可以保留版权,别伪原创~
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3503 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 30ms UTC 00:46 PVG 08:46 LAX 16:46 JFK 19:46
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86