V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
HelloWorld556
V2EX  ›  Blogger

今天搜自己的博客,发现了有一篇和自己一样的,还以为是被人转载了,还挺开心,结果看完发现作者和原链接都不是自己的,瞬间就不开心了

  •  1
     
  •   HelloWorld556 · 2020-11-24 14:08:44 +08:00 · 4636 次点击
    这是一个创建于 1451 天前的主题,其中的信息可能已经有所发展或是发生改变。
    35 条回复    2020-11-25 15:59:38 +08:00
    SniperXu
        1
    SniperXu  
       2020-11-24 14:11:08 +08:00
    你要习惯。。。
    hoyixi
        2
    hoyixi  
       2020-11-24 14:13:20 +08:00
    现在还写博客都是雷 F
    写完还把链接发在大站点炫耀 or 企图引流的,那是爬虫们的衣食父母
    natashahollyz
        3
    natashahollyz  
       2020-11-24 14:14:11 +08:00
    禁止一下右键,如果别人实在要强行扒,那也没办法
    no1xsyzy
        4
    no1xsyzy  
       2020-11-24 14:21:35 +08:00
    @natashahollyz 防不了爬虫……
    Jooooooooo
        5
    Jooooooooo  
       2020-11-24 14:22:54 +08:00
    网上写东西要有这种觉悟
    lizeze
        6
    lizeze  
       2020-11-24 14:28:15 +08:00
    能被人转也是一种认可
    natashahollyz
        7
    natashahollyz  
       2020-11-24 14:28:34 +08:00
    @no1xsyzy 加干扰码?
    dusays
        8
    dusays  
       2020-11-24 14:32:10 +08:00
    正如一楼说的那样,要习惯啊!我可能比博主还惨,我算是一个写口水文的博主,博客是 dusays.com
    偶尔突发奇想,写了一些自以为的精文,没过两天,就发现百度有收录,不过收录的却不是我的网站,一看就是被转走了~
    博主没写原文地址,还声明是原创,接下来就是重头了!
    联系这些博主,各个振振有词。又说是自己原创的,拒绝承认转载。又说是用户投稿的,平台不管真实作者。更有甚者,直说盗你文是看得起你~
    我前段时间还发帖询问,全静态的博客,有没有办法加密 html 文件,但不影响浏览器的解析,因为我经常被扒站!
    GetMoney
        9
    GetMoney  
       2020-11-24 14:39:01 +08:00
    付费阅读
    myevery
        10
    myevery  
       2020-11-24 14:40:25 +08:00
    @dusays 这么惨啊。。。。
    HelloWorld556
        11
    HelloWorld556  
    OP
       2020-11-24 14:42:56 +08:00
    @dusays 看了一下那个人的博客,搜了几篇文章标题,别处都有,估计大部分都是爬虫来的,可能也有你的
    xuanbg
        12
    xuanbg  
       2020-11-24 14:43:03 +08:00
    随便了。但写好文,不问剽窃。
    airplayxcom
        13
    airplayxcom  
       2020-11-24 16:32:02 +08:00   ❤️ 1
    CSDN 微微一笑~
    bequt
        14
    bequt  
       2020-11-24 16:45:30 +08:00
    即使被转载, 写得多精彩, 最后也会都停留在你的博客上
    wvidc
        15
    wvidc  
       2020-11-24 17:15:38 +08:00
    习惯就好,我们开发的小功能被人开着公司倒卖,也一样只能习惯着
    tcp
        16
    tcp  
       2020-11-24 17:20:47 +08:00
    @dusays 后端文章数据加密,前段 js 解密?
    cs419
        17
    cs419  
       2020-11-24 17:29:20 +08:00
    网上公开的东西,人家想盗,自然拦不住
    可以适当提高对方的盗取成本

    博文里多加配图+水印
    文章里穿插点 超链接 加上博客链接
    加点空格隐写术
    toomlo
        18
    toomlo  
       2020-11-24 17:33:02 +08:00
    你这还算好的,见过那种抄袭了还来你博客下面评论他抄袭的吗...
    lovecy
        19
    lovecy  
       2020-11-24 17:36:59 +08:00
    确实,网上写东西要有觉悟。。
    爬虫站 /爬虫号 /爬虫博+没有辨识能力的人很多,自己的东西变得不像自己的了很正常。。
    Patrick95
        20
    Patrick95  
       2020-11-24 17:39:35 +08:00
    等你洞察到网上采集站的规模之后
    你就放宽心了
    Lemeng
        21
    Lemeng  
       2020-11-24 17:52:29 +08:00
    瞬间不开心了,哈哈哈,可爱
    muzuiget
        22
    muzuiget  
       2020-11-24 18:21:29 +08:00
    看开点算了,现在哪怕 Google 搜中文,前面结果也是各种内容农场的网站,本来通用搜索引擎就是垃圾了,你在怎么优化也是白搭,还不如用垂直搜索引擎好。
    dustin2016
        23
    dustin2016  
       2020-11-24 18:29:38 +08:00
    我之前的 wqordpress 博客也被人镜像了
    用了十几种防止爬取和镜像的方法

    目前,已放弃治疗😂
    ob
        24
    ob  
       2020-11-24 18:40:17 +08:00 via Android
    把文字内容全部转成图片加水印,大家觉得怎么样?就不管爬虫了。。
    fasionchan
        25
    fasionchan  
       2020-11-24 18:47:21 +08:00
    @GetMoney 付费阅读也不能幸免……

    我去年在慕课网写了一个 Python 源码剖析专栏: https://www.imooc.com/read/76
    刚发表不久就发现被某些公众号抄了,只字未改……
    好在,微信公众平台上可以投诉,官方处理也快,不然真拿这些孙子没办法……
    ragnaroks
        26
    ragnaroks  
       2020-11-24 18:55:17 +08:00
    匿名用户前 30%内容直接展现,后面内容需要登录可见
    wenzichel
        27
    wenzichel  
       2020-11-24 18:59:20 +08:00
    https://www.xiabingbao.com/post/blog/blog-be-cloned.html

    曾经我的博客也被人爬过,是整站的爬下来。然后我就想着去工信部投诉这个网站,不过后面他把他网站上的内容给删了。

    后来我就在 js 里加了一个域名的判断,如果是非自己的域名就跳转。就是不知道管不管用。
    aristolochic
        28
    aristolochic  
       2020-11-24 19:34:41 +08:00
    @dusays 不在乎 CDN 开销的话...可以用邪恶的私有字体。就是得费点儿劲。
    大致就是字体和编号随机一对一重新排列,生成的 HTML 中的文本部分也做此处理
    这种...也就别想被搜索引擎收录了
    (不太清楚现在的采集站能不能发现
    VgV
        29
    VgV  
       2020-11-24 19:36:41 +08:00
    这种事情要淡定,如果不在乎搜索引擎可以把内容转为图片加水印。
    Tyuans
        30
    Tyuans  
       2020-11-24 20:22:38 +08:00
    看了看上面的,以后部分内容文字部分文字图片,倒是没什么用,也就是恶心恶心。
    LiuSha
        31
    LiuSha  
       2020-11-24 20:23:52 +08:00 via Android
    淡定,碰到好一点的会评论说自己转载的,坏的情况就是直接爬过去
    dusays
        32
    dusays  
       2020-11-25 15:24:16 +08:00
    @myevery 我已经习惯了~
    dusays
        33
    dusays  
       2020-11-25 15:24:49 +08:00
    @HelloWorld556 确实如此,不仅扒了我的内容,还有别人的站,就是个采集站,看到好的就扒!
    dusays
        34
    dusays  
       2020-11-25 15:58:06 +08:00
    @tcp 没有后端,博客用的是 Hexo,直接生成 html 的页面~
    dusays
        35
    dusays  
       2020-11-25 15:59:38 +08:00
    @aristolochic 倒也不担心被采集,只是希望转载之后,可以保留版权,别伪原创~
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5476 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 05:59 · PVG 13:59 · LAX 21:59 · JFK 00:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.