UnicodeEncodeError: 'ascii' codec can't encode character u'\u2019' in position 6: ordinal not in range(128)

UnicodeEncodeError: 'ascii' codec can't encode character u'\u2019' in position 6: ordinal not in range(128)

我正在尝试从 TripAdvisor 获取阿姆斯特丹 500 家餐厅的列表;然而,在第 308 家餐厅之后,我收到以下错误:

Traceback (most recent call last):
  File "C:/Users/dtrinh/PycharmProjects/TripAdvisorData/LinkPull-HK.py", line 43, in <module>
    writer.writerow(rest_array)
UnicodeEncodeError: 'ascii' codec can't encode character u'\u2019' in position 6: ordinal not in range(128)

我尝试了一些在 Whosebug 上找到的东西,但目前没有任何效果。我想知道是否有人可以看一下我的代码,看看有什么潜在的解决方案会很棒。

        for item in soup2.findAll('div', attrs={'class', 'title'}):
            if 'Cuisine' in item.text:
                item.text.strip()
                content = item.findNext('div', attrs=('class', 'content'))
                cuisine_type = content.text.encode('utf8', 'ignore').strip().split(r'\xa0')
        rest_array = [account_name, rest_address, postcode, phonenumber, cuisine_type]
        #print rest_array
        with open('ListingsPull-Amsterdam.csv', 'a') as file:
                writer = csv.writer(file)
                writer.writerow(rest_array)
    break

您正在将非 ascii 字符写入 csv 输出文件。确保使用允许对字符进行编码的适当字符编码打开输出文件。一个安全的选择通常是 UTF-8。试试这个:

with open('ListingsPull-Amsterdam.csv', 'a', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerow(rest_array)

编辑 这是给 Python 3.x 的,抱歉。

rest_array 包含 unicode 字符串。当你使用 csv.writer 写行时,你需要序列化字节字符串(你在 Python 2.7)。

我建议你使用"utf8"编码:

with open('ListingsPull-Amsterdam.csv', mode='a') as fd:
    writer = csv.writer(fd)
    rest_array = [text.encode("utf8") for text in rest_array]
    writer.writerow(rest_array)

注意:请不要使用 file 作为变量,因为您隐藏了内置函数 file()open() 函数的别名)。

如果您想使用 Microsoft Excel 打开此 CSV 文件,您可以考虑使用其他编码,例如 "cp1252"(它允许 u"\u2019" 字符)。

在脚本开头添加这些行

import sys
reload(sys)
sys.setdefaultencoding('utf-8')