如何按空格拆分字符串并删除非 ASCII 字符?
How to split a string by spaces and remove non-ASCII characters?
当我得到一个像 "Ready[[[, steady, go!"
这样的字符串时,我想把它变成这样一个列表:[Ready, steady, go!]
。目前,我能做的最好的就是两个列表理解,但我想不出一种方法来组合它们。
text_list = [i for i in text.split()]
output: ['Ready[[[,', 'steady,', 'go!']
clean_list = [x for x in list(text) if x in string.ascii_letters]
output: ['R', 'e', 'a', 'd', 'y', 's', 't', 'e', 'a', 'd', 'y', 'g', 'o']
clean_list
确实成功地删除了非 ASCII 字母,但实际上将每个字符都变成了列表元素。 text_list
保持格式不变但不删除非 ASCII 字符。我如何结合这两种逻辑来得到我想要的输出?
这应该有效:
import re, string
# filter out all unwanted characters using regex
pattern = re.compile(f"[^{string.ascii_letters} !]")
filtered = pattern.sub('', "Ready[[[, steady, go!")
# split
result = filtered.split()
当我得到一个像 "Ready[[[, steady, go!"
这样的字符串时,我想把它变成这样一个列表:[Ready, steady, go!]
。目前,我能做的最好的就是两个列表理解,但我想不出一种方法来组合它们。
text_list = [i for i in text.split()]
output: ['Ready[[[,', 'steady,', 'go!']
clean_list = [x for x in list(text) if x in string.ascii_letters]
output: ['R', 'e', 'a', 'd', 'y', 's', 't', 'e', 'a', 'd', 'y', 'g', 'o']
clean_list
确实成功地删除了非 ASCII 字母,但实际上将每个字符都变成了列表元素。 text_list
保持格式不变但不删除非 ASCII 字符。我如何结合这两种逻辑来得到我想要的输出?
这应该有效:
import re, string
# filter out all unwanted characters using regex
pattern = re.compile(f"[^{string.ascii_letters} !]")
filtered = pattern.sub('', "Ready[[[, steady, go!")
# split
result = filtered.split()