匹配连字符和换行符
Match hyphen in combination with new line character
import re
string = re.sub(r'-\n', '', string)
我想标记文本中的单词。问题是,所有位于一行末尾的单词都被错误地标记化了。所以我必须删除换行符前的连字符。
感谢您的帮助!
尝试使用前瞻来识别换行符,而不是将其包含在子操作的一部分中:
string = re.sub(r'-(?=\n)', '', string)
import re
string = re.sub(r'-\n', '', string)
我想标记文本中的单词。问题是,所有位于一行末尾的单词都被错误地标记化了。所以我必须删除换行符前的连字符。
感谢您的帮助!
尝试使用前瞻来识别换行符,而不是将其包含在子操作的一部分中:
string = re.sub(r'-(?=\n)', '', string)