为什么我的 python re 模式不适用于空格分割?
why is my python re pattern not working for splitting at spaces?
我正在尝试将所有标点符号的文本拆分为英语和俄语。这适用于空格。由于某种原因 \s 不工作。 allRussianWords 最终包含空格,但我不希望它包含空格。
allRussianWords = re.split("[—…();«»!?.:,%\s\n]",words)
这是我要拆分的字符串
words = "привет, моё имя Мэтт. Как ты?"
标点符号是俄语
似乎您需要在右方括号后加一个 + 来匹配连续的字符。其他答案之一也指出了这一点。
\n 也是多余的,因为 \s 包含行 return 字符。
我正在尝试将所有标点符号的文本拆分为英语和俄语。这适用于空格。由于某种原因 \s 不工作。 allRussianWords 最终包含空格,但我不希望它包含空格。
allRussianWords = re.split("[—…();«»!?.:,%\s\n]",words)
这是我要拆分的字符串
words = "привет, моё имя Мэтт. Как ты?"
标点符号是俄语
似乎您需要在右方括号后加一个 + 来匹配连续的字符。其他答案之一也指出了这一点。
\n 也是多余的,因为 \s 包含行 return 字符。