具有 2 种不同数据类型的结构化 numpy 数组

Structured numpy array with 2 different data types

我将一个 csv 文件导入到一个 numpy 数组中,我需要将其转换为结构化数组,其中只有第一列为 dtype 字符串,所有其他 47 列为浮点数。 如何在单个操作中为其他 47 列定义数据类型?我必须逐列指定 dtype 吗?

提前致谢

您可以像阅读结构化数组一样阅读源文件。

假设您输入的文件包含:

  • 一个string字段,命名为Id,
  • 只是四个float个字段,命名为F1F2 依此类推

所以它的内容是:

ABCD,160.72,180.21,260.13,451.48
EFGH,252.42,132.21,150.11,612.56
IJKL,541.77,455.21,268.76,543.81

要读取这样的文件,您可以使用 np.loadtxt 方法,将 dtype 传递为 一个 structured 类型(定义列表),可以生成 例如在列表理解中:

nFloats = 4
a = np.loadtxt('Input.csv', delimiter=',',
    dtype=[('Id', 'U10')] + [( f'F{i+1}', '<f4' ) for i in range(nFloats)])

请注意,我传递了 U10 作为 Id 列的类型(10 个字符)。 如果需要,请设置此字段的其他大小。

结果是:

array([('ABCD', 160.72, 180.21, 260.13, 451.48),
       ('EFGH', 252.42, 132.21, 150.11, 612.56),
       ('IJKL', 541.77, 455.21, 268.76, 543.81)],
      dtype=[('Id', '<U10'), ('F1', '<f4'), ('F2', '<f4'), ('F3', '<f4'), ('F4', '<f4')])

当然,在你的目标版本代码中相应地增加nFloats (大概应该是47)。