环境:python版本3.4,IDE是自带的那个
一般来说编码问题的话,多试几个办法总能解决,但是这个怎么也读不出来。该网页响应头返回的是 charset=
code:
page = resp.read().decode('utf-8' )
print(page)
这样写的话用utf-8解不出来,换成其他的也解不出来。
如果在后面加上一句ignore的话,其他编码方式能解的出来了,但是出现乱码,而utf-8仍然解不出来,并且错误由第一行转移到了第二行,出现错误代码 [UnicodeEncodeError: 'UCS-2' codec can't encode characters in position 2528-2528: Non-BMP character not supported in Tk] ,由此可以推断使用utf-8是没错的。但是这个错误代码的解决方法找了半天也没找到。
有人知道怎么解决吗
一般来说编码问题的话,多试几个办法总能解决,但是这个怎么也读不出来。该网页响应头返回的是 charset=
code:
page = resp.read().decode('utf-8' )
print(page)
这样写的话用utf-8解不出来,换成其他的也解不出来。
如果在后面加上一句ignore的话,其他编码方式能解的出来了,但是出现乱码,而utf-8仍然解不出来,并且错误由第一行转移到了第二行,出现错误代码 [UnicodeEncodeError: 'UCS-2' codec can't encode characters in position 2528-2528: Non-BMP character not supported in Tk] ,由此可以推断使用utf-8是没错的。但是这个错误代码的解决方法找了半天也没找到。
有人知道怎么解决吗
