具有 2 种不同数据类型的结构化 numpy 数组
Structured numpy array with 2 different data types
我将一个 csv 文件导入到一个 numpy 数组中,我需要将其转换为结构化数组,其中只有第一列为 dtype 字符串,所有其他 47 列为浮点数。
如何在单个操作中为其他 47 列定义数据类型?我必须逐列指定 dtype 吗?
提前致谢
您可以像阅读结构化数组一样阅读源文件。
假设您输入的文件包含:
- 一个string字段,命名为Id,
- 只是四个float个字段,命名为F1,F2 依此类推
所以它的内容是:
ABCD,160.72,180.21,260.13,451.48
EFGH,252.42,132.21,150.11,612.56
IJKL,541.77,455.21,268.76,543.81
要读取这样的文件,您可以使用 np.loadtxt 方法,将 dtype 传递为
一个 structured 类型(定义列表),可以生成
例如在列表理解中:
nFloats = 4
a = np.loadtxt('Input.csv', delimiter=',',
dtype=[('Id', 'U10')] + [( f'F{i+1}', '<f4' ) for i in range(nFloats)])
请注意,我传递了 U10 作为 Id 列的类型(10 个字符)。
如果需要,请设置此字段的其他大小。
结果是:
array([('ABCD', 160.72, 180.21, 260.13, 451.48),
('EFGH', 252.42, 132.21, 150.11, 612.56),
('IJKL', 541.77, 455.21, 268.76, 543.81)],
dtype=[('Id', '<U10'), ('F1', '<f4'), ('F2', '<f4'), ('F3', '<f4'), ('F4', '<f4')])
当然,在你的目标版本代码中相应地增加nFloats
(大概应该是47)。
我将一个 csv 文件导入到一个 numpy 数组中,我需要将其转换为结构化数组,其中只有第一列为 dtype 字符串,所有其他 47 列为浮点数。 如何在单个操作中为其他 47 列定义数据类型?我必须逐列指定 dtype 吗?
提前致谢
您可以像阅读结构化数组一样阅读源文件。
假设您输入的文件包含:
- 一个string字段,命名为Id,
- 只是四个float个字段,命名为F1,F2 依此类推
所以它的内容是:
ABCD,160.72,180.21,260.13,451.48
EFGH,252.42,132.21,150.11,612.56
IJKL,541.77,455.21,268.76,543.81
要读取这样的文件,您可以使用 np.loadtxt 方法,将 dtype 传递为 一个 structured 类型(定义列表),可以生成 例如在列表理解中:
nFloats = 4
a = np.loadtxt('Input.csv', delimiter=',',
dtype=[('Id', 'U10')] + [( f'F{i+1}', '<f4' ) for i in range(nFloats)])
请注意,我传递了 U10 作为 Id 列的类型(10 个字符)。 如果需要,请设置此字段的其他大小。
结果是:
array([('ABCD', 160.72, 180.21, 260.13, 451.48),
('EFGH', 252.42, 132.21, 150.11, 612.56),
('IJKL', 541.77, 455.21, 268.76, 543.81)],
dtype=[('Id', '<U10'), ('F1', '<f4'), ('F2', '<f4'), ('F3', '<f4'), ('F4', '<f4')])
当然,在你的目标版本代码中相应地增加nFloats (大概应该是47)。