读取文本文件时如何评估数据类型(即 str、int、double...等)
How to evaluate data type (i.e. str, int, double... etc.) when reading text file
我正在阅读从 pdf 中提取的文本文件中的信息,所以一切都是一团糟。
我尝试分离的一些示例变量(列)包括日期、操作类型和摘要。
对于日期,格式是DD/MM/YY,所以我知道第一个索引总是一个int。但是,每当我测试文件(使用类型(xyz))时,所有内容都被标记为 str.
如何 python 识别什么是,什么不是,str vs. int vs. double...等等?
简答:使用正则表达式并重写字符串部分。
长答案:因为所有这些都来自文本文件,所以所有内容 都是 字符串。日期 23/10/90 在 .txt 中不表示为数值,它是字符代码的集合。根据您要从该文件中获取的确切内容,最好的办法是用正则表达式输出您想要的数据,然后重新转换它。因此,对于日期,请尝试 int(dayString)
int(monthString)
等
我正在阅读从 pdf 中提取的文本文件中的信息,所以一切都是一团糟。
我尝试分离的一些示例变量(列)包括日期、操作类型和摘要。
对于日期,格式是DD/MM/YY,所以我知道第一个索引总是一个int。但是,每当我测试文件(使用类型(xyz))时,所有内容都被标记为 str.
如何 python 识别什么是,什么不是,str vs. int vs. double...等等?
简答:使用正则表达式并重写字符串部分。
长答案:因为所有这些都来自文本文件,所以所有内容 都是 字符串。日期 23/10/90 在 .txt 中不表示为数值,它是字符代码的集合。根据您要从该文件中获取的确切内容,最好的办法是用正则表达式输出您想要的数据,然后重新转换它。因此,对于日期,请尝试 int(dayString)
int(monthString)
等