想把百度贴吧的记录删掉,写了个脚本 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
lc4t
V2EX    分享创造

想把百度贴吧的记录删掉,写了个脚本

  •  
  •   lc4t 2016-12-10 11:44:17 +08:00 5166 次点击
    这是一个创建于 3257 天前的主题,其中的信息可能已经有所发展或是发生改变。

    昨晚上想删 tieba 记录。。以免被爬(hei)被(li)社(shi)。。。

    https://github.com/lc4t/clean-baidutieba

    又一个 err_code 据说是 tbs 不对。。也不造为什么。。

    挂在 vps 上跑啊跑。。

    第 1 条附言    2016-12-10 20:01:37 +08:00
    加了个根据正则删 reply 的参数。。
    19 条回复    2016-12-23 21:07:51 +08:00
    shana
        1
    shana  
       2016-12-10 12:00:00 +08:00 via Android
    贴吧有两种 tbs ,不知道你获取对没有
    lc4t
        2
    lc4t  
    OP
       2016-12-10 12:13:37 +08:00 via iPhone
    @shana 我直接 re 了下.. 你说的两种指的是..?
    shana
        3
    shana  
       2016-12-10 13:00:59 +08:00
    @lc4t 一种是 26 位的,一种是 16 位的。
    26 位的可以在这网址获取 tieba.baidu.com/dc/common/tbs , 16 位的我忘了...
    lc4t
    nbsp;   4
    lc4t  
    OP
       2016-12-10 13:23:45 +08:00 via iPhone
    @shana 16 位就是我 re 匹配的.. 谢啦
    lc4t
        5
    lc4t  
    OP
       2016-12-10 15:24:33 +08:00
    @lc4t 纠正。。 re 页面源码找到的是 26 位的,偶尔出现 tbs 错误偶尔没有。。
    minamike
        6
    minamike  
       2016-12-10 16:24:55 +08:00
    之前我也辛苦地天天删 30 条黑历史 结果有一天由于我回复了一条帖子然而被度婊吞掉 于是我不停回复不停被吞 最终账号被永封了 所有黑历史都不见了
    lc4t
        7
    lc4t  
    OP
       2016-12-10 18:58:52 +08:00 via iPhone
    @minamike 真是一个好策略
    Tyler1989
        8
    Tyler1989  
       2016-12-10 19:18:21 +08:00 via Android
    能删指定内容吗例如邮箱
    lc4t
        9
    lc4t  
    OP
       2016-12-10 19:28:49 +08:00 via iPhone
    @Tyler1989 暂时没这个功能.. 你可以在 reply_content 设置个 filter ,根据 filter 加入待删除 list )
    lc4t
        10
    lc4t  
    OP
       2016-12-10 19:58:46 +08:00
    @Tyler1989 好了我加了个参数。。可以给个正则去删
    huang5587783
        11
    huang5587783  
       2016-12-11 12:35:56 +08:00 via iPhone
    好东西啊
    cio
        12
    cio  
       2016-12-12 15:57:31 +08:00
    挺好玩的。看了下源码,爬完了发帖 url 和回帖 url 放入列表 。然后删除的时候 往 哪个地址提交的呢。是提交的 post 吗。然后这些地址是你抓包抓的还是怎么或得到的呢= =就是你怎么知道是这个地址执行删除操作..
    lc4t
        13
    lc4t  
    OP
       2016-12-12 16:27:22 +08:00 via iPhone
    @cio del_reply del_tie 是删除函数. 具体 API 抓包就可以看到.
    XYxe
        14
    XYxe  
       2016-12-15 22:09:55 +08:00
    230308 的问题能解决吗?我这边所有的都提示这个错啊
    lc4t
        15
    lc4t  
    OP
       2016-12-15 23:01:56 +08:00
    @XYxe 我这里有一堆是这个问题。。后来把脚本运行间隔改成 4 小时了。。目前还不造这个问题怎么解决
    XYxe
        16
    XYxe  
       2016-12-15 23:05:56 +08:00
    @lc4t 是不是可以考虑对 APP 抓包啊?
    lc4t
        17
    lc4t  
    OP
       2016-12-16 03:23:27 +08:00
    @XYxe 嗯。。懒。。 有空我试下 app 和手机版吧。。 理论上写爬虫应该从简单的 API 下手的。。 hhh
    Sanko
        18
    Sanko  
       2016-12-23 20:01:37 +08:00
    @lc4t 能详细讲下吗 我现在也出现 230308 错误 纠结一下午了
    lc4t
        19
    lc4t  
    OP
       2016-12-23 21:07:51 +08:00
    @Sanko 230308 还没完全解决。。建议换个手机版 API 试试?
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     979 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 19:43 PVG 03:43 LAX 11:43 JFK 14:43
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86