使用 python 的 re 删除字符串中的 URL
removing URL from string using python's re
使用它来尝试从字符串中删除 URL:
text = re.sub(r'https?:\/\/[A-Za-z0-9\.\/]+', '', text)
不幸的是,它适用于简单的 URL,但不适用于复杂的 URL。
因此 http://www.example.com/somestuff.html
之类的内容将被删除,但 http://www.example.com/somestuff.html?query=python
之类的内容将只留下尾随位。
我认为我的知识有限,因此非常感谢您的帮助。
谢谢
尝试:
r"https?:[^\s]+"
使用它来尝试从字符串中删除 URL:
text = re.sub(r'https?:\/\/[A-Za-z0-9\.\/]+', '', text)
不幸的是,它适用于简单的 URL,但不适用于复杂的 URL。
因此 http://www.example.com/somestuff.html
之类的内容将被删除,但 http://www.example.com/somestuff.html?query=python
之类的内容将只留下尾随位。
我认为我的知识有限,因此非常感谢您的帮助。 谢谢
尝试:
r"https?:[^\s]+"