python UnicodeDecodeEorror,连我都用decode('utf-8')

python UnicodeDecodeEorror, even I use decode('utf-8')

我用python读了一些html,页面里有一些日文和汉字,

代码为:

response = urllib.urlopen(pageurl).read()

当我打印响应时,python 告诉我 DecodeError

然后我将代码更改为

response = urllib.urlopen(pageurl).read().decode("utf-8")

python 仍然告诉

UnicodeDecodeError: "utf8" code can't decode byte 0xd1 in position...

我该怎么办....

顺便说一下,html 图表集是 gb2312...

如果使用的是GB2312,不兼容UTF-8,但可以认为是GBK的子集,Python解码器支持。因此,您应该尝试 response = urllib.urlopen(pageurl).read().decode("gbk")