读取文本文件时如何评估数据类型（即 str、int、double...等）

How to evaluate data type (i.e. str, int, double... etc.) when reading text file

我正在阅读从 pdf 中提取的文本文件中的信息，所以一切都是一团糟。

我尝试分离的一些示例变量（列）包括日期、操作类型和摘要。

对于日期，格式是DD/MM/YY，所以我知道第一个索引总是一个int。但是，每当我测试文件（使用类型（xyz））时，所有内容都被标记为 str.

如何 python 识别什么是，什么不是，str vs. int vs. double...等等？

简答：使用正则表达式并重写字符串部分。

长答案：因为所有这些都来自文本文件，所以所有内容都是字符串。日期 23/10/90 在 .txt 中不表示为数值，它是字符代码的集合。根据您要从该文件中获取的确切内容，最好的办法是用正则表达式输出您想要的数据，然后重新转换它。因此，对于日期，请尝试 int(dayString) int(monthString) 等

读取文本文件时如何评估数据类型（即 str、int、double...等）

How to evaluate data type (i.e. str, int, double... etc.) when reading text file

python

pdf

parsing

text