如何删除|在 python 中使用 re.sub 从文本中签名
How to remove | sign from text using re.sub in python
我正在处理大量文本文件,任何人都可以告诉我如何删除 |使用 re.sub 签名,然后只想删除数字数据,如 1 和 0.6271 而不是 T123。我认为 T123 是 alpha numaric
page_data=1|0.6271|bacs|T123|Biologically Active Substance
page_data =re.sub(r"|", ' ',page_data)
您必须转义 |
字符。
import re
page_data = '1|0.6271|bacs|T123|Biologically Active Substance'
re.sub(r"\|", " ", page_data)
打印:
1 0.6271 bacs T123 Biologically Active Substance
编辑:
要从字符串中获取“数字”,试试这个:
import re
page_data = '1|0.6271|bacs|T123|Biologically Active Substance'
[i for i in re.sub(r"\|", " ", page_data).split() if not i.isalpha()]
输出:
['1', '0.6271', 'T123']
我正在处理大量文本文件,任何人都可以告诉我如何删除 |使用 re.sub 签名,然后只想删除数字数据,如 1 和 0.6271 而不是 T123。我认为 T123 是 alpha numaric
page_data=1|0.6271|bacs|T123|Biologically Active Substance
page_data =re.sub(r"|", ' ',page_data)
您必须转义 |
字符。
import re
page_data = '1|0.6271|bacs|T123|Biologically Active Substance'
re.sub(r"\|", " ", page_data)
打印:
1 0.6271 bacs T123 Biologically Active Substance
编辑:
要从字符串中获取“数字”,试试这个:
import re
page_data = '1|0.6271|bacs|T123|Biologically Active Substance'
[i for i in re.sub(r"\|", " ", page_data).split() if not i.isalpha()]
输出:
['1', '0.6271', 'T123']