使用 python 的 re 删除字符串中的 URL

removing URL from string using python's re

使用它来尝试从字符串中删除 URL:

text = re.sub(r'https?:\/\/[A-Za-z0-9\.\/]+', '', text)

不幸的是,它适用于简单的 URL,但不适用于复杂的 URL。 因此 http://www.example.com/somestuff.html 之类的内容将被删除,但 http://www.example.com/somestuff.html?query=python 之类的内容将只留下尾随位。

我认为我的知识有限,因此非常感谢您的帮助。 谢谢

尝试:

r"https?:[^\s]+"