删除 URL/Email 中的所有空格

Remove all whitespaces in URL/Email

我想删除网址/电子邮件地址中的所有空格。地址在 "normal" 字符串中,例如:"Today the weather is fine. Tomorrow, we'll see. More information: www.weather .com or info @weather.com"

我正在寻找一个好的正则表达式(使用 Python 的 re 模块),但我的版本无法处理所有情况

re.sub(u'(www)([ .])([a-zA-Z\-]+)([ .])([a-z]+)', '\1.\3.\5')

您对 url 的表达需要稍微修正一下。电子邮件的正则表达式也可以从 url 表达式继承。

>>> #EXPRESSIONS:
>>> url = "(www)+([ .])+([a-zA-Z\-]+)+([ .])+([a-z]+)"
>>> ema = "([a-zA-Z]+)+([ +@]+)+([a-zA-Z\-]+.com)"
>>> 
>>> #IMPORTINGS:
>>> import re
>>> 
>>> #YOUR DATA:
>>> string = "Today the weather is fine. Tomorrow, we'll see. More information: www.weather .com or info @weather.com"
>>> 
>>> #Scraping Data
>>> "".join(re.findall(url,string)[0])
'www.weather.com'
>>> "".join(re.findall(ema,string)[0]).replace(" ","")
'info@weather.com'
>>>