使用Python需要去掉超过3的哈哈哈哈哈哈哈
Use Python need to remove the هههههههه that exceed 3 ه
如何去除单词中多余的'χ'?
单词最多3个'Ç'
شنو هل الغابة اوي عايشين بيها كلنا نختلف ههههههههههههه اي اي الايلينز تجين
由于 right-to-left 方向,这有点棘手,但这似乎对我有用:
import re
text = "شنو هل الغابة اوي عايشين بيها كلنا نختلف ههههههههههههه اي اي الايلينز تجين"
text = re.sub("ه{3,}", "ههه", text)
print(text)
> "شنو هل الغابة اوي عايشين بيها كلنا نختلف ههه اي اي الايلينز تجين"
但如果我理解 Google 译者正确,重复的部分只是在笑,所以不确定为 NLP 目的统一它有多少价值。
如何去除单词中多余的'χ'? 单词最多3个'Ç'
شنو هل الغابة اوي عايشين بيها كلنا نختلف ههههههههههههه اي اي الايلينز تجين
由于 right-to-left 方向,这有点棘手,但这似乎对我有用:
import re
text = "شنو هل الغابة اوي عايشين بيها كلنا نختلف ههههههههههههه اي اي الايلينز تجين"
text = re.sub("ه{3,}", "ههه", text)
print(text)
> "شنو هل الغابة اوي عايشين بيها كلنا نختلف ههه اي اي الايلينز تجين"
但如果我理解 Google 译者正确,重复的部分只是在笑,所以不确定为 NLP 目的统一它有多少价值。