尝试从 Python 中的 'google.com' 读取数据时出现 UnicodeDecodeError
UnicodeDecodeError when try to read data from 'google.com' in Python
我开始学习如何从网站读取数据。但是当我尝试从 google.com 读取数据时,我遇到了这个错误:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe0 in position 279: invalid continuation byte
下面是我的代码(摘自教学视频,只是不同的网站):
import urllib.request, urllib.parse, urllib.error
fhand=urllib.request.urlopen('https://www.google.com/')
for line in fhand:
print(line.decode().strip())
怎么了?提前致谢
指定编码和错误处理应该可以解决问题:
import urllib.request, urllib.parse, urllib.error
fhand=urllib.request.urlopen('https://www.google.com/')
for line in fhand:
print(line.decode(encoding="utf-8", errors="backslashreplace").strip())
当您学习使用 python 进行网络抓取时,您可能想看看 BeautifulSoup:https://www.crummy.com/software/BeautifulSoup/bs4/doc/
我开始学习如何从网站读取数据。但是当我尝试从 google.com 读取数据时,我遇到了这个错误:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe0 in position 279: invalid continuation byte
下面是我的代码(摘自教学视频,只是不同的网站):
import urllib.request, urllib.parse, urllib.error
fhand=urllib.request.urlopen('https://www.google.com/')
for line in fhand:
print(line.decode().strip())
怎么了?提前致谢
指定编码和错误处理应该可以解决问题:
import urllib.request, urllib.parse, urllib.error
fhand=urllib.request.urlopen('https://www.google.com/')
for line in fhand:
print(line.decode(encoding="utf-8", errors="backslashreplace").strip())
当您学习使用 python 进行网络抓取时,您可能想看看 BeautifulSoup:https://www.crummy.com/software/BeautifulSoup/bs4/doc/