标记删除模式时出错 re.findall
Error tokenizing remove pattern re.findall
我在清理文本时遇到这样的错误,我只是尝试按照来自网络的代码
def remove_pattern(text, pattern):
r = re.findall(pattern, text)
for i in r:
text = re.sub(i, '', text)
return text
df['remove_user'] = np.vectorize(remove_pattern)(df['Comment'], "@[\w]*")
我得到了这个错误:
这里使用str.replace
:
df["remove_user"] = df["Comment"].str.replace(r'\W+', '', regex=True)
我在清理文本时遇到这样的错误,我只是尝试按照来自网络的代码
def remove_pattern(text, pattern):
r = re.findall(pattern, text)
for i in r:
text = re.sub(i, '', text)
return text
df['remove_user'] = np.vectorize(remove_pattern)(df['Comment'], "@[\w]*")
我得到了这个错误:
这里使用str.replace
:
df["remove_user"] = df["Comment"].str.replace(r'\W+', '', regex=True)