这种乱码“§°×ó”是怎么产生的? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
say2old
V2EX    问与答

这种乱码“§°×ó”是怎么产生的?

  •  
  •   say2old 2016-08-31 22:13:56 +08:00 6964 次点击
    这是一个创建于 3335 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有人知道像网页 http://www.mafengwo.cn/i/3157416.html 上这种乱码,是什么编码误存成 utf-8 导致的吗?是否可以还原?

    32 条回复    2017-05-10 23:50:29 +08:00
    smithtel
        1
    smithtel  
       2016-08-31 22:25:59 +08:00
    还原就不要想了。。
    say2old
        2
    say2old  
    OP
       2016-08-31 22:36:03 +08:00
    为啥?感觉是一种编码被误当做另一种编码存储了,信息本身并没有任何丢失,应该可以还原吧?
    @smithtel
    publicID002
        3
    publicID002  
       2016-08-31 22:39:05 +08:00
    @say2old 映射应该不是一一对应的,所以信息应该有丢失
    SoloCompany
        4
    SoloCompany  
       2016-08-31 22:58:16 +08:00
    骚女人的白嫩大胸和黑丝
    SoloCompany
        5
    SoloCompany  
       2016-08-31 23:01:00 +08:00   31
    echo §°×ó | iconv -t latin1 | iconv -f GB18030
    ETiV
        6
    ETiV  
       2016-08-31 23:05:08 +08:00
    @SoloCompany 看了眼你头像, 心中默念了阿弥陀佛...
    andrewpsy
        7
    andrewpsy  
       2016-08-31 23:06:21 +08:00
    @SoloCompany 破帖服
    shoaly
        8
    shoaly  
       2016-08-31 23:08:59 +08:00
    @SoloCompany 完美的诠释了 talk is cheap, show them the code
    larry1594
        9
    larry1594  
       2016-08-31 23:11:39 +08:00
    @SoloCompany 你怎么识别这是 latin1 的?
    SoloCompany
        10
    SoloCompany  
       2016-08-31 23:13:10 +08:00 via iPhone
    @larry1594 因为 iso-8859-1 太长了输入困难
    larry1594
        11
    larry1594  
       2016-08-31 23:18:47 +08:00
    @SoloCompany 你是默认对方用的 latin1 还是猜的,还是经验。非常好奇,谢谢指教!
    SoloCompany
        12
    SoloCompany  
       2016-08-31 23:21:12 +08:00 via iPhone   2
    @larry1594 latin1 真的不用猜的,特征太明显了
    msg7086
        13
    msg7086  
       2016-08-31 23:22:53 +08:00   2
    @larry1594 除了 latin1 还有哪个乱码会被如此广泛使用的?
    liqingcan
        14
    liqingcan  
       2016-08-31 23:23:58 +08:00
    上头那个一眼看穿编码的,服!
    SoloCompany
        15
    SoloCompany  
       2016-08-31 23:27:02 +08:00 via iPhone
    @msg7086 严格来说 latin1 并不是编码,只是把 byte seq 还原出来而已
    msg7086
        16
    msg7086  
       2016-08-31 23:27:51 +08:00
    @SoloCompany 所以我说乱码 XD
    MySQL 的默认设定害死人。
    jsrc
        17
    jsrc  
       2016-09-01 00:05:03 +08:00
    强力围观
    panlilu
        18
    panlilu  
       2016-09-01 00:11:39 +08:00
    服气
    czb
        19
    czb  
       2016-09-01 05:49:06 +08:00 via Android
    服气
    ming2050
        20
    ming2050  
       2016-09-01 07:44:18 +08:00 via Android
    服!!!!
    jeffw
        21
    jeffw  
       2016-09-01 08:19:25 +08:00 via iPhone
    服!
    sunhr
        22
    sunhr  
       2016-09-01 08:49:46 +08:00
    服!
    say2old
        23
    say2old  
    OP
       2016-09-01 09:17:02 +08:00
    @SoloCompany 厉害!服!
    honk
        24
    honk  
       2016-09-01 09:23:44 +08:00 via Android
    Phariel
        25
    Phariel  
       2016-09-01 09:25:53 +08:00 via Android
    @SoloCompany 破站服!!!
    DJBird
        26
    DJBird  
       2016-09-01 09:28:40 +08:00
    @SoloCompany 大神果然老司机:thumbsup:
    lxy
        27
    lxy  
       2016-09-01 09:39:56 +08:00
    几年前还是学生的时候,在微博上关注了一个 80 后美女作家,有天她抱怨, futureme 给她发来的邮件变成了乱码,并且附了一段。后来我用 notepad++以及好像是 UE 十六进制编辑尝试了各种转码,最后解了出来,并发到她的评论区。半天后我再看,我的评论没了,于是反思了一下,大概是内容暴露了她几年前就已经有男朋友的事实……
    mgcnrx11
        28
    mgcnrx11  
       2016-09-01 09:50:52 +08:00 via iPhone
    @lxy 哈哈
    petelin
        29
    petelin  
       2016-09-01 10:58:20 +08:00
    之前一直在想 python 的编解码,,,所以 python 来一波,原因的话就是 gbk 编成的 bytes 用 iso-8859-1 解码了,可以看出来,每一个字符都不超过 255 ,
    ```
    In [71]: for c in '§°×ó':
    ...: print(ord(c),end=',')
    ...:
    201,167,197,174,200,203,181,196,176,215,196,219,180,243,208,216,186,205,186,218,203,191,
    ```
    左边 python3 右边脑残 python2
    ![]( )
    hicdn
        30
    hicdn  
       2016-09-01 12:39:17 +08:00
    文章利用的 cp1252 ,但是不能完全解出来
    SoloCompany
        31
    SoloCompany  
       2016-09-01 13:36:39 +08:00 via iPhone
    @hicdn 文章是 utf8-latin-utf8
    但转码过程中由于编码空间问题已经丢失了部分信息
    aleen42
        32
    aleen42  
       2017-05-10 23:50:29 +08:00
    跟帖服`
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2627 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 09:22 PVG 17:22 LAX 02:22 JFK 05:22
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86