如何删除|在 python 中使用 re.sub 从文本中签名

How to remove | sign from text using re.sub in python

我正在处理大量文本文件,任何人都可以告诉我如何删除 |使用 re.sub 签名,然后只想删除数字数据,如 1 和 0.6271 而不是 T123。我认为 T123 是 alpha numaric

page_data=1|0.6271|bacs|T123|Biologically Active Substance

 page_data =re.sub(r"|", '  ',page_data)

您必须转义 | 字符。

import re
page_data = '1|0.6271|bacs|T123|Biologically Active Substance'
re.sub(r"\|", " ", page_data)

打印:

1 0.6271 bacs T123 Biologically Active Substance

编辑:

要从字符串中获取“数字”,试试这个:

import re
page_data = '1|0.6271|bacs|T123|Biologically Active Substance'
[i for i in re.sub(r"\|", " ", page_data).split() if not i.isalpha()]

输出:

['1', '0.6271', 'T123']