Pandas 从 Excel 读取时将整数转换为实数

Question

我最近开始探索 python 以分析 excel 数据。我有一个包含两个工作表的 excel 文件，每个工作表都有一个矩阵（m = 1000 行和 n= 999 列）。两个矩阵的元素相互关联：其中一个矩阵涉及位移值和另一个矩阵涉及对应于每个位移的力值。位移和相应的力是从 m=1000 次数值模拟和 n=999 增量中获得的。是否可以识别仅对应于整数位移值的力值？或者，作为替代方案，是否可以将位移矩阵中的所有十进制数替换为 0？我试图将 excel 文件读入 Pandas 数据帧，但是位移矩阵中的所有值似乎都显示为“实数”（例如数字“1”、“2”、“3”、 excel 中的等用浮点数表示为“1.”、“2.”、“3.”（在 python 中）。感谢您的关注。

Answer 1

让我们做一个更小比例的例子(3 * 3)。

我准备了一个 Excel 文件，有 2 张纸并阅读了它们：

displ = pd.read_excel('Input_2.xlsx', 'Displ')
forces = pd.read_excel('Input_2.xlsx', 'Forces')

两个 DataFrame 包含：

displ                      forces
     C1    C2    C3              C1     C2     C3
0  10.0  12.1  11.3        0  120.1  130.2  140.3
1  12.5  13.0  13.5        1  150.4  160.5  170.6
2  12.6  13.6  13.8        2  180.7  190.8  200.9

识别 displ 中包含整数的元素（实际上，仍然是 float 数字，但带有小数零件 == 0.0), 你可以运行:

displ.mod(1.0) == 0.0

你会得到：

      C1     C2     C3
0   True  False  False
1  False   True  False
2  False  False  False

并得到相应的force值和NaN 对于其他值，您可以运行:

forces.where(displ.mod(1.0) == 0.0)

得到：

      C1     C2  C3
0  120.1    NaN NaN
1    NaN  160.5 NaN
2    NaN    NaN NaN

另一种选择是在 displ 中获取索引列表，其中对应元素的小数部分为零。实际上它是一个 Numpy 函数，所以它在底层 Numpy 数组和 returns integer (zero-based) 指数：

ind = np.nonzero((displ.mod(1.0) == 0.0).values)

结果是：

(array([0, 1], dtype=int64), array([0, 1], dtype=int64))

所以它是索引的 2 元组：

行索引，
列索引。

您还可以从 forces，实际上也来自底层的 Numpy 数组，运行宁：

forces.values[ind]

结果是：

array([120.1, 160.5])

要用零替换 displ 的“整数”元素，您可以运行:

displ.mask(displ.mod(1.0) == 0.0, 0, inplace=True)

现在 displ 包含：

     C1    C2    C3
0   0.0  12.1  11.3
1  12.5   0.0  13.5
2  12.6  13.6  13.8

请注意，“想要的”元素仍然是 float 零，但这是 Pandas 的一个特点，即每一列都有一个类型，适合此列中的所有元素（在本例中只是 float）。

Pandas 从 Excel 读取时将整数转换为实数

Pandas converts integer numbers to real numbers when reading from Excel

excel

integer

floating

pandas