在 Python 3 中使用正则表达式删除电话号码

Remove Telephone numbers using Regular Expressions in Python 3

我正在尝试从使用 tika 解析的一堆文档中删除 telephone 号码,但我没有成功。

Here is a screenshot taken by regex101 validator。如您所见,phone 个数字被跳过。

文本格式的相同示例如下:

"Something here

and something here 9, but (I have something here as well), 123456, Hi guys!

+39.1234.325636 +39.321.1234567

sex male | date of birth 16/12/1927 | nationality italian

some stuff "

这是我的正则表达式(我不是这方面的专家):

(\(00\d{2}\)|\(\+\d{2}\)|00\d{2}|\+\d{2})[\. ]??3\d{2}[\. \-]??\d{2,4}[\. \-]??\d{2,4}$

注意+39(或0039)是固定的,第二个telephone号码的前3也是固定的。

你有什么建议吗? 非常感谢。

根据您的输入,这对我适用于 regex101 验证器: (\+|00)39\.[0-9]+\.[0-9]+

这是另一个正则表达式 /((?:\+39)|(?:0039))+[0-9. ]+/gm。这将有助于找到您的电话号码

Demo