在 Python 3 中使用正则表达式删除电话号码
Remove Telephone numbers using Regular Expressions in Python 3
我正在尝试从使用 tika 解析的一堆文档中删除 telephone 号码,但我没有成功。
Here is a screenshot taken by regex101 validator。如您所见,phone 个数字被跳过。
文本格式的相同示例如下:
"Something here
and something here 9, but (I have something here as well), 123456, Hi guys!
+39.1234.325636 +39.321.1234567
sex male | date of birth 16/12/1927 | nationality italian
some stuff "
这是我的正则表达式(我不是这方面的专家):
(\(00\d{2}\)|\(\+\d{2}\)|00\d{2}|\+\d{2})[\. ]??3\d{2}[\. \-]??\d{2,4}[\. \-]??\d{2,4}$
注意+39(或0039)是固定的,第二个telephone号码的前3也是固定的。
你有什么建议吗?
非常感谢。
根据您的输入,这对我适用于 regex101 验证器:
(\+|00)39\.[0-9]+\.[0-9]+
这是另一个正则表达式 /((?:\+39)|(?:0039))+[0-9. ]+/gm
。这将有助于找到您的电话号码
我正在尝试从使用 tika 解析的一堆文档中删除 telephone 号码,但我没有成功。
Here is a screenshot taken by regex101 validator。如您所见,phone 个数字被跳过。
文本格式的相同示例如下:
"Something here
and something here 9, but (I have something here as well), 123456, Hi guys!
+39.1234.325636 +39.321.1234567
sex male | date of birth 16/12/1927 | nationality italian
some stuff "
这是我的正则表达式(我不是这方面的专家):
(\(00\d{2}\)|\(\+\d{2}\)|00\d{2}|\+\d{2})[\. ]??3\d{2}[\. \-]??\d{2,4}[\. \-]??\d{2,4}$
注意+39(或0039)是固定的,第二个telephone号码的前3也是固定的。
你有什么建议吗? 非常感谢。
根据您的输入,这对我适用于 regex101 验证器:
(\+|00)39\.[0-9]+\.[0-9]+
这是另一个正则表达式 /((?:\+39)|(?:0039))+[0-9. ]+/gm
。这将有助于找到您的电话号码