使用Python需要去掉超过3的哈哈哈哈哈哈哈

Use Python need to remove the هههههههه that exceed 3 ه

如何去除单词中多余的'χ'? 单词最多3个'Ç'

شنو هل الغابة اوي عايشين بيها كلنا نختلف ههههههههههههه اي اي الايلينز تجين

由于 right-to-left 方向,这有点棘手,但这似乎对我有用:

import re

text = "شنو هل الغابة اوي عايشين بيها كلنا نختلف ههههههههههههه اي اي الايلينز تجين"
text = re.sub("ه{3,}", "ههه", text)
print(text)
> "شنو هل الغابة اوي عايشين بيها كلنا نختلف ههه اي اي الايلينز تجين"

但如果我理解 Google 译者正确,重复的部分只是在笑,所以不确定为 NLP 目的统一它有多少价值。