google到底闹那样。敏词提示什么的。会让领导们很头疼的 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
zythum
V2EX    分享发现

google到底闹那样。敏词提示什么的。会让领导们很头疼的

  •  
  •   zythum 2012-06-01 10:35:18 +08:00 13040 次点击
    这是一个创建于 4926 天前的主题,其中的信息可能已经有所发展或是发生改变。
    68 条回复    1970-01-01 08:00:00 +08:00
    kaka
        1
    kaka  
       2012-06-01 10:38:56 +08:00
    Channing
        2
    Channing  
       2012-06-01 10:43:32 +08:00
    看看是不是藏哪个js里了
    sdjl
        3
    sdjl  
       2012-06-01 10:44:49 +08:00
    真好玩
    raptium
        4
    raptium  
       2012-06-01 10:45:32 +08:00
    应该加密或者编码过了吧 如果轻易能抓到包 那这个包本身就导致重置了
    Channing
        5
    Channing  
       2012-06-01 10:52:57 +08:00
    刚证实了下,词库是一次性加载到本地的,非动态验证。断网后依然可用。应该就是藏在某个js里了。
    Weakdancer
        6
    Weakdancer  
       2012-06-01 11:07:13 +08:00
    zythum
        7
    zythum  
    OP
       2012-06-01 11:16:44 +08:00
    @Weakdancer 这个是输入联想的提示。
    tuoxie007
        8
    tuoxie007  
       2012-06-01 11:18:17 +08:00
    啥我了,缺没下拉提示呢
    slawdan
        9
    slawdan  
       2012-06-01 11:19:25 +08:00   5
    关键词在这里:

    http://www.google.com.hk/xjs/_/js/s/s,st,anim,bbd,c,sb_cn,hv,wta,cr,cdos,sk,pj,tbpr,tbui,rsn,ob,mb,lc,du,ada,bihu,lu,m,shb,tng,hsm,j,pcc,csitl/rt=j/ver=WOt9jzUXUPg.en_US./d=1/rs=AItRSTPUO8p2SlQ687OXCiLKYWsmG122mA

    搜索 getEncodedBlacklist 可以看到二维数组,由charcode组成,应该就是关键词列表了。

    如果猜的没错,那么

    qa:function setup$$56(a){for(var b=_.L.NF(),c=b.eH(),b=b.getKey(),f=[],g=0,i;i=c[g++]{for(var t=[],p=0;p<i.length;++p)t.push(window.String.fromCharCode(i[p]^
    b));f.push(t.join(""))}G=(0,window.RegExp)(f.join("|"),"gi");c=v.gb;c(_.UX.Ll,j);c(_.UX.Gh,h);c(_.UX.Rf,h);c(_.UX.Lf,h);c(_.UX.Es,d);w&&c(_.UX.Fh,k);R=!!a.Ta[240];o();B=_.L.Animation();B.ey(n,218)}

    是核心decode算法

    我还有文档要写,各位再努力努力……
    Vernsu
        10
    Vernsu  
       2012-06-01 11:20:58 +08:00
    @tuoxie007
    还是要点 搜索 后才能出现提示的。
    slawdan
        11
    slawdan  
       2012-06-01 11:21:00 +08:00
    在这个附近做调试,应该可以得到整个明文数组
    romoo
        12
    romoo  
       2012-06-01 11:28:16 +08:00   1
    raptium
        13
    raptium  
       2012-06-01 11:29:52 +08:00   2
    用 python 解码,words = 那个列表 a
    for line in words:
    decoded = ''.join(map(lambda x:unichr(30303^x), line))
    print decoded


    https://gist.github.com/2848464
    slawdan
        14
    slawdan  
       2012-06-01 11:39:07 +08:00
    @raptium


    decoded = ''.join(map(lambda x:unichr(30303^int(x)), line))
    yuanyiz
        15
    yuanyiz  
       2012-06-01 11:41:45 +08:00   2
    Console执行:

    b=_.L.NF().getKey()
    c= _.L.NF().eH()
    f=[]
    for(g=0; g<c.length; g++) {
    i=c[g];
    t=[];
    for(var t=[],p=0;p<i.length;++p) t.push(window.String.fromCharCode(i[p]^b));
    f.push(t);
    }

    结果就在f里,自己看,就不贴了
    fangzhzh
        16
    fangzhzh  
       2012-06-01 11:45:28 +08:00
    你们都是淫才
    zythum
        17
    zythum  
    OP
       2012-06-01 12:04:25 +08:00
    @yuanyiz
    @raptium

    thx 辛苦
    zythum
        18
    zythum  
    OP
       2012-06-01 12:10:30 +08:00

    还有正则表达式...
    zythum
        19
    zythum  
    OP
       2012-06-01 12:26:41 +08:00   1
    对 @yuanyiz 的结果做了下格式化。直接可见结果了
    ---

    var b=_.L.NF().getKey(),c= _.L.NF().eH(),f=[];
    for(var g=0,l=c.length,t=[],i; i=c[g],g<l; f.push(t.join('')),g++)
    for(t=[],p=0;p<i.length;++p)
    t.push(window.String.fromCharCode(i[p]^b));

    console.log(f.join('\n')+'\n总数:'+f.length+'个');

    ---
    chenshaoju
        20
    chenshaoju  
       2012-06-01 12:43:46 +08:00
    @raptium 请教一下这个列表:目前已知“麦当劳”是敏词( http://www.cnbeta.com/articles/190248.htm ),但是这个列表里就没有“麦当劳”三个字中的任何一个字。是否还有另一份隐藏的列表的可能性?
    zythum
        21
    zythum  
    OP
       2012-06-01 12:46:54 +08:00   1
    @chenshaoju 麦当劳在列表中
    zythum
        22
    zythum  
    OP
       2012-06-01 12:48:30 +08:00   1
    @chenshaoju @raptium酱的是不全的。
    试着在console下执行

    ---

    var b=_.L.NF().getKey(),c= _.L.NF().eH(),f=[];
    for(var g=0,l=c.length,t=[],i; i=c[g],g<l; f.push(t.join('')),g++)
    for(t=[],p=0;p<i.length;++p)
    t.push(window.String.fromCharCode(i[p]^b));
    console.log(f.join('\n')+'\n总数:'+f.length+'个');

    ---
    zythum
        23
    zythum  
    OP
       2012-06-01 12:50:53 +08:00   4
    算了我贴出来好了

    https://gist.github.com/2848881
    chenshaoju
        24
    chenshaoju  
       2012-06-01 12:52:09 +08:00
    @raptium 呃,重新运行了脚本实际看了一下,的确有麦当劳。
    不过github上的那个的确不完整,谢谢。
    chenshaoju
        25
    chenshaoju  
       2012-06-01 12:52:31 +08:00
    @zythum 谢谢,后来重新运行了脚本,有了。
    whbell
        26
    whbell  
       2012-06-01 13:18:55 +08:00
    把党国那点蛋疼的东东都被你们挖出来了~
    mopig
        27
    mopig  
       2012-06-01 13:19:51 +08:00
    google.com 版的也有过滤么?
    zola
        28
    zola  
       2012-06-01 13:20:27 +08:00
    每个关键字背后都有故事
    raptium
        29
    raptium  
       2012-06-01 13:28:19 +08:00
    @chenshaoju
    @zythum

    嗯,我的 code 有点问题,所以没有输出全
    zythum
        30
    zythum  
    OP
       2012-06-01 13:31:46 +08:00
    @mopig 都有
    @zola 以后可以开个系列节目了
    regent
        31
    regent  
       2012-06-01 13:32:20 +08:00
    @zythum 多谢,这个列表有意思
    run2
        32
    run2  
       2012-06-01 13:33:01 +08:00
    那个[玩ps
    玩photoshop]有啥故事,还要那个[女保镖]呢?
    Benisme
        33
    Benisme  
       2012-06-01 13:33:22 +08:00
    这个列表信息量好大-__,-
    Rice
        34
    Rice  
       2012-06-01 13:35:11 +08:00
    你们知道的太多了!
    Mutoo
        35
    Mutoo  
       2012-06-01 13:47:13 +08:00
    搞一个我最喜爱的google敏感词评选大赛吧
    slawdan
        36
    slawdan  
       2012-06-01 14:02:25 +08:00
    @mutoo 我喜欢“麦当劳”
    ro00
        37
    ro00  
       2012-06-01 14:04:09 +08:00
    google其实是想让大家都知道
    bloggerao
        38
    bloggerao  
       2012-06-01 14:04:26 +08:00
    搞一个我最喜爱的google敏感词评选大赛吧



    +10086
    raptium
        39
    raptium  
       2012-06-01 14:08:16 +08:00
    其实我一直有个问题,假如哪天一不小心把 html css href doctype 之类的词给弄上关键字列表了,是不是全中国都上不了外国网了呢……
    fline
        40
    fline  
       2012-06-01 14:30:56 +08:00   1
    天线宝宝………看来局子里的人很清楚我们的黑话嘛………
    ksky
        41
    ksky  
       2012-06-01 14:53:57 +08:00
    给这些词写个WIKI吧。。。
    peizh2006
        42
    peizh2006  
       2012-06-01 14:56:05 +08:00
    表示很多都不知道阿。
    还有,把这事分享给同事,同事居然得出结论说,看来google和政府妥协了。
    ISSAY
        43
    ISSAY  
       2012-06-01 14:56:18 +08:00
    @ksky good idea
    erlang
        44
    erlang  
       2012-06-01 15:05:15 +08:00
    提纯版,可在Chrome console执行源码:http://geeksh.com/p/47
    boillerk
        45
    boillerk  
       2012-06-01 15:19:47 +08:00
    Google这是想把GFW的黑名单给列出来么!
    nonozone
        46
    nonozone  
       2012-06-01 15:27:36 +08:00
    呃,天线宝宝我都不知道是啥意思...
    bitinn
        47
    bitinn  
       2012-06-01 16:40:16 +08:00
    无聊了,缩写到142字符,相信还能再缩……谁来帮下忙?

    Javascript:document.write(_.L.NF().eH().map(function(a){return a.map(function(a){return String.fromCharCode(a^_.L.NF().getKey())}).join("")}))

    内容

    document.write(_.L.NF().eH().map(function(i){
    return i.map(function(j){
    return String.fromCharCode(j^_.L.NF().getKey());
    }).join('');
    }));
    Mutoo
        48
    Mutoo  
       2012-06-01 16:58:48 +08:00
    "玩photoshop" 是怎么回事
    FRHong
        49
    FRHong  
       2012-06-01 17:02:06 +08:00
    各位把CV贴上来吧,GFW的招聘部找你们找了很久了。
    chishagnjin
        50
    chishagnjin  
       2012-06-01 17:56:14 +08:00
    https://www.google.com/ 我访问这个域名,没有出现那种现象啊。
    shineG
        51
    shineG  
       2012-06-01 18:09:06 +08:00
    http://caiguanhao.wordpress.com/2012/06/01/google-gfw-blacklist 我就转个链接
    玩photoshop么,不是恶搞过官员视察么 -。-
    Joker_Qyou
        52
    Joker_Qyou  
       2012-06-01 19:30:31 +08:00
    https://gist.github.com/2850196
    我先看到了这个呃。
    redswallow
        53
    redswallow  
       2012-06-02 13:36:00 +08:00
    这个功能没了?
    csx163
        54
    csx163  
       2012-06-02 14:00:48 +08:00
    6月2日,这个功能没了
    dndx
        55
    dndx  
       2012-06-02 15:56:14 +08:00
    @csx163 @redswallow 昨天那个JS被GFW定点清除了,今天貌似谷歌也把功能下架了...
    lentrody
        56
    lentrody  
       2012-06-02 16:00:29 +08:00
    果然是儿童节礼物嘛
    9hills
        57
    9hills  
       2012-06-02 16:23:37 +08:00
    @dndx 没有吧,现在还在
    zythum
        58
    zythum  
    OP
       2012-06-02 16:23:50 +08:00
    真的没有了
    dndx
        59
    dndx  
       2012-06-02 16:37:20 +08:00
    @9hills 现在打开 http://www.google.com.hk/?esrch=SearchNotices::OptIn&q=%E9%95%BF%E6%B1%9F&hl=en 搜索也没有提示了(已翻墙)
    可见已经木有了。。。
    zx900930
        60
    zx900930  
       2012-06-02 17:00:52 +08:00
    这功能没了.果然很("□)
    fline
        61
    fline  
       2012-06-02 17:36:50 +08:00
    @nonozone wēn宝宝,说话语速慢,所以……
    9hills
        62
    9hills  
       2012-06-02 17:52:28 +08:00
    @dndx
    @zythum


    我这还有。。
    asousuo
        63
    asousuo  
       2012-06-02 18:06:38 +08:00
    @9hills 请问楼上怎么放图片进去的?
    csx163
        64
    csx163  
       2012-06-02 20:57:50 +08:00
    google的反击仅仅如此而已么,GG大神要给力啊
    zythum
        65
    zythum  
    OP
       2012-06-02 21:15:02 +08:00
    @asousuo 直接贴围脖图床的url就可以了。

    快捷的方法。 http://www.v2ex.com/t/36410#reply130
    90blog
        66
    90blog  
       2012-06-02 22:13:50 +08:00
    args
        67
    args  
       2012-06-02 22:46:30 +08:00
    @zythum 小心搞到github被墙。
    loddit
        68
    loddit  
       2012-06-14 14:32:41 +08:00
    google代码更新啦,压缩后变量名什么的就变了。

    大家只要看下js,里面一大坨数字的就是关键字列表。

    解码的方法就是 String.fromCharCode(keyword^30303); => keyword 就是列表里的关键字
    在console里遍历一遍就出来结果了。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     906 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 21:59 PVG 05:59 LAX 13:59 JFK 16:59
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86