python structured/recarray 类型转换行为

python structured/recarray type conversion behaviour

构造 structured/recarray 时,我对类型转换的行为感到困惑:

这个简单的示例采用数字字段,但将类型定义为字符串:

data = [(1.0, 2), (3.0, 4)]
np.array(data, dtype=[('x', str), ('y', int)])

产生:

array([('', 2), ('', 4)], dtype=[('x', 'S'), ('y', '<i8')])

所以这些值被转换为空字符串,这不是您所期望的:

str(1.0)

生成字符串 '1.0'。是什么导致了这种行为?

您需要指定字符串宽度,例如'a3':

>>> np.array([(1.0, 2),(3.0,4)],dtype=[('x','a3'),('y',int)])
array([('1.0', 2), ('3.0', 4)], 
      dtype=[('x', 'S3'), ('y', '<i4')])

仅使用 str 就意味着一个 0 字节的字符串字段——这当然太小而无法容纳 float 的字符串再现。