读取文本文件时如何评估数据类型(即 str、int、double...等)

How to evaluate data type (i.e. str, int, double... etc.) when reading text file

我正在阅读从 pdf 中提取的文本文件中的信息,所以一切都是一团糟。

我尝试分离的一些示例变量(列)包括日期、操作类型和摘要。

对于日期,格式是DD/MM/YY,所以我知道第一个索引总是一个int。但是,每当我测试文件(使用类型(xyz))时,所有内容都被标记为 str.

如何 python 识别什么是,什么不是,str vs. int vs. double...等等?

简答:使用正则表达式并重写字符串部分。

长答案:因为所有这些都来自文本文件,所以所有内容 都是 字符串。日期 23/10/90 在 .txt 中不表示为数值,它是字符代码的集合。根据您要从该文件中获取的确切内容,最好的办法是用正则表达式输出您想要的数据,然后重新转换它。因此,对于日期,请尝试 int(dayString) int(monthString)