python UnicodeDecodeEorror,连我都用decode('utf-8')
python UnicodeDecodeEorror, even I use decode('utf-8')
我用python读了一些html,页面里有一些日文和汉字,
代码为:
response = urllib.urlopen(pageurl).read()
当我打印响应时,python 告诉我 DecodeError
然后我将代码更改为
response = urllib.urlopen(pageurl).read().decode("utf-8")
python 仍然告诉
UnicodeDecodeError: "utf8" code can't decode byte 0xd1 in position...
我该怎么办....
顺便说一下,html 图表集是 gb2312...
如果使用的是GB2312,不兼容UTF-8,但可以认为是GBK的子集,Python解码器支持。因此,您应该尝试 response = urllib.urlopen(pageurl).read().decode("gbk")
。
我用python读了一些html,页面里有一些日文和汉字,
代码为:
response = urllib.urlopen(pageurl).read()
当我打印响应时,python 告诉我 DecodeError
然后我将代码更改为
response = urllib.urlopen(pageurl).read().decode("utf-8")
python 仍然告诉
UnicodeDecodeError: "utf8" code can't decode byte 0xd1 in position...
我该怎么办....
顺便说一下,html 图表集是 gb2312...
如果使用的是GB2312,不兼容UTF-8,但可以认为是GBK的子集,Python解码器支持。因此,您应该尝试 response = urllib.urlopen(pageurl).read().decode("gbk")
。