从 Unicode 行而不是 Char 读取 Word

Read Word from a Unicode Line instead of Char

我有以下代码:

for line in contentText:
          print type(line), #-> o/p is unicode
          word = line.strip().split()
          print word, #-> o/p is <type 'list'>
          print type(word),

当我执行 line.strip().split() 时,会显示每个字符。

例如,如果我的行是“Read Word from a Unicode Line instead of Char”,那么 o/p 是: R 电子 一个 d

w o r d

一个 . . 等等

我想将其读作 'Read'、'word',从单词而不是字符进行进一步处理..

我怎样才能做到这一点?

另外,如何删除空格以进行进一步处理?

迭代字符串产生单字符字符串:

>>> text = 'Read word'
>>> for x in text:
...     print x
... 
R
e
a
d

w
o
r
d

先拆分得到单词列表,然后迭代列表:

>>> text.split()  # str.split remove space characters
['Read', 'word']

>>> for x in text.split():
...     print x
... 
Read
word