nltk UnicodeDecodeError - 连接到 ntpath.py 文件
nltk UnicodeDecodeError - connected with the ntpath.py file
Python 版本: 2.7
Windows 版本:Windows 7 64 位
系统语言:俄语
我有一个问题,网上还没有解决。
这是我的代码:
import textblob
text = "I love people"
text = TextBlob(text)
print text.sentiment
我收到以下与 nltk
方法相关的错误:
Traceback (most recent call last):
File "C:\Users\Александр\Desktop\TextBlob.py", line 1, in <module>
import textblob
File "C:\Python27\lib\site-packages\textblob\__init__.py", line 9, in <module>
from .blob import TextBlob, Word, Sentence, Blobber, WordList
File "C:\Python27\lib\site-packages\textblob\blob.py", line 28, in <module>
import nltk
File "C:\Python27\lib\site-packages\nltk\__init__.py", line 128, in <module>
from nltk.chunk import *
File "C:\Python27\lib\site-packages\nltk\chunk\__init__.py", line 155, in <module>
from nltk.data import load
File "C:\Python27\lib\site-packages\nltk\data.py", line 77, in <module>
if 'APPENGINE_RUNTIME' not in os.environ and os.path.expanduser('~/') != '~/':
File "C:\Python27\lib\ntpath.py", line 311, in expanduser
return userhome + path[i:]
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc0 in position 9: ordinal not in range(128)
据我从Google和Whosebug的回答了解到,这个问题与ntpath.py
的语言问题有关。
我尝试了以下问题,但没有成功:
使用sys.setdefaultencoding('utf8')
How to fix: "UnicodeDecodeError: 'ascii' codec can't decode byte"
用sys.setdefaultencoding('Cp1252')
就消除了错误。但是,我的程序的输出也消失了。
使用 import io
。 Python (nltk) - UnicodeDecodeError: 'ascii' codec can't decode byte
在 ntpath.py
中使用 unicode().decode()
(我不记得我在 link 哪里找到了这个解决方案)。
UPD:我找到了解决办法。
我试图将这部分插入 ntpath.py
:
reload(sys)
sys.setdefaultencoding('Cp1252')
因此,这是此文件中的部分代码:
import os
import sys
import stat
import genericpath
import warnings
#another way
reload(sys)
sys.setdefaultencoding('Cp1252')
它工作得很好。如果您的系统设置中有其他语言,请将 "play" 替换为 Cp1252
.
我找到了解决办法。
我试图将这部分插入 ntpath.py
:
reload(sys)
sys.setdefaultencoding('Cp1252')
因此,这是此文件中的部分代码:
import os
import sys
import stat
import genericpath
import warnings
#another way
reload(sys)
sys.setdefaultencoding('Cp1252')
效果很好。如果您的系统设置中有其他语言,请将 "play" 替换为 Cp1252
.
Python 版本: 2.7
Windows 版本:Windows 7 64 位
系统语言:俄语
我有一个问题,网上还没有解决。
这是我的代码:
import textblob
text = "I love people"
text = TextBlob(text)
print text.sentiment
我收到以下与 nltk
方法相关的错误:
Traceback (most recent call last):
File "C:\Users\Александр\Desktop\TextBlob.py", line 1, in <module>
import textblob
File "C:\Python27\lib\site-packages\textblob\__init__.py", line 9, in <module>
from .blob import TextBlob, Word, Sentence, Blobber, WordList
File "C:\Python27\lib\site-packages\textblob\blob.py", line 28, in <module>
import nltk
File "C:\Python27\lib\site-packages\nltk\__init__.py", line 128, in <module>
from nltk.chunk import *
File "C:\Python27\lib\site-packages\nltk\chunk\__init__.py", line 155, in <module>
from nltk.data import load
File "C:\Python27\lib\site-packages\nltk\data.py", line 77, in <module>
if 'APPENGINE_RUNTIME' not in os.environ and os.path.expanduser('~/') != '~/':
File "C:\Python27\lib\ntpath.py", line 311, in expanduser
return userhome + path[i:]
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc0 in position 9: ordinal not in range(128)
据我从Google和Whosebug的回答了解到,这个问题与ntpath.py
的语言问题有关。
我尝试了以下问题,但没有成功:
使用
sys.setdefaultencoding('utf8')
How to fix: "UnicodeDecodeError: 'ascii' codec can't decode byte"用
sys.setdefaultencoding('Cp1252')
就消除了错误。但是,我的程序的输出也消失了。使用
import io
。 Python (nltk) - UnicodeDecodeError: 'ascii' codec can't decode byte在
ntpath.py
中使用unicode().decode()
(我不记得我在 link 哪里找到了这个解决方案)。
UPD:我找到了解决办法。
我试图将这部分插入 ntpath.py
:
reload(sys)
sys.setdefaultencoding('Cp1252')
因此,这是此文件中的部分代码:
import os
import sys
import stat
import genericpath
import warnings
#another way
reload(sys)
sys.setdefaultencoding('Cp1252')
它工作得很好。如果您的系统设置中有其他语言,请将 "play" 替换为 Cp1252
.
我找到了解决办法。
我试图将这部分插入 ntpath.py
:
reload(sys)
sys.setdefaultencoding('Cp1252')
因此,这是此文件中的部分代码:
import os
import sys
import stat
import genericpath
import warnings
#another way
reload(sys)
sys.setdefaultencoding('Cp1252')
效果很好。如果您的系统设置中有其他语言,请将 "play" 替换为 Cp1252
.