操作一个 numpy 数组
Manipulating a numpy array
我目前有一个大约有 350 行和 50 列的 csv 文件,我想访问其中的四列。使用 genfromtxt
,我可以做到这一点。然而,一旦我有了这些列,我想添加一个基于现有列的新列(即 newcol=abs(col1-col2)
)。但是,当我这样做时,出现错误:too many indices for array
.
这是我的代码:
import numpy as np
thedata = np.genfromtxt(
'match_roughgraphs.csv',
skip_header=0,
skip_footer=0,
delimiter=',',
usecols=(3,4,29,30),
names=['hubblera','hubbledec','sloanra','sloandec'])
for row in thedata:
print(row)
b=np.empty(350,1)
b=np.absolute(thedata[:,0]-thedata[:,1]) #returns too many indices error
print(thedata[0,0]) #also returns too many indices error
print(thedata[0]) #prints out first row
基于上面的最后两行,我尝试了一个测试,我假设 genfromtxt()
正在加载 csv 文件,以便所有数据都保存在一列中,用字符串逗号而不是分隔符逗号分隔.关于如何解决这个问题有什么建议吗?
我认为您的代码不起作用的原因是 numpy.genfromtxt return 是元组的一维数组或更具体结构化的 ndarray。读这个 numpy.genfromtxt produces array of what looks like tuples, not a 2D array—why?
因此,您可以修复参数或将这些元组转换为数组以获得 thedata
作为二维数组。
当你使用 name 参数时,它 return 是一个结构化的 ndarray,删除这个参数,它将 return 一个二维数组。
正如您在此处命名的列一样,您可以这样做
b=np.absolute(thedata['hubblera']-thedata['hubbledec'])
也thedata[0,0]
这个return是一个错误,因为没有二维数组尝试做thedata[0][0]
我目前有一个大约有 350 行和 50 列的 csv 文件,我想访问其中的四列。使用 genfromtxt
,我可以做到这一点。然而,一旦我有了这些列,我想添加一个基于现有列的新列(即 newcol=abs(col1-col2)
)。但是,当我这样做时,出现错误:too many indices for array
.
这是我的代码:
import numpy as np
thedata = np.genfromtxt(
'match_roughgraphs.csv',
skip_header=0,
skip_footer=0,
delimiter=',',
usecols=(3,4,29,30),
names=['hubblera','hubbledec','sloanra','sloandec'])
for row in thedata:
print(row)
b=np.empty(350,1)
b=np.absolute(thedata[:,0]-thedata[:,1]) #returns too many indices error
print(thedata[0,0]) #also returns too many indices error
print(thedata[0]) #prints out first row
基于上面的最后两行,我尝试了一个测试,我假设 genfromtxt()
正在加载 csv 文件,以便所有数据都保存在一列中,用字符串逗号而不是分隔符逗号分隔.关于如何解决这个问题有什么建议吗?
我认为您的代码不起作用的原因是 numpy.genfromtxt return 是元组的一维数组或更具体结构化的 ndarray。读这个 numpy.genfromtxt produces array of what looks like tuples, not a 2D array—why?
因此,您可以修复参数或将这些元组转换为数组以获得 thedata
作为二维数组。
当你使用 name 参数时,它 return 是一个结构化的 ndarray,删除这个参数,它将 return 一个二维数组。
正如您在此处命名的列一样,您可以这样做
b=np.absolute(thedata['hubblera']-thedata['hubbledec'])
也thedata[0,0]
这个return是一个错误,因为没有二维数组尝试做thedata[0][0]