从另一个 Python Pandas 数据框导入数据和列

Importing Data and Columns from Another Python Pandas Data Frame

我一直在尝试使用 Pandas Python 库 select 相关矩阵的一个子集。 例如,如果我有一个像

这样的矩阵
0 A B C  
A 1 2 3  
B 2 1 4  
C 3 4 1  

我可能想要 select 一个矩阵,其中原始矩阵中的一些变量与其他一些变量相关,例如:

0 A C  
A 1 3  
C 3 1

为此,我尝试使用以下代码使用列表中所需变量的名称对原始相关矩阵进行切片,转置相关矩阵,重新分配原始列名称,然后再次切片。

data = pd.read_csv("correlationmatrix.csv")
initial_vertical_axis = pd.DataFrame()
for x in var_list:
    a = data[x]
    initial_vertical_axis = initial_vertical_axis.append(a)
print initial_vertical_axis
initial_vertical_axis = pd.DataFrame(data=initial_vertical_axis, columns= var_list)
initial_matrix = pd.DataFrame()
for x in var_list:
    a = initial_vertical_axis[x]
    initial_matrix = initial_matrix.append(a)
print initial_matrix  

但是,这个 returns 是一个空的相关矩阵,带有正确的行和列标签,但没有像

这样的数据
0 A C  
A  
C  

我在我的代码中找不到导致此问题的错误。如果有更简单的方法来解决这个问题,我愿意接受建议。

假设 data 包含您的矩阵,

In [122]: data
Out[122]:
   A  B  C
0
A  1  2  3
B  2  1  4
C  3  4  1

In [123]: var_list = ['A','C']

In [124]: data.loc[var_list,var_list]
Out[124]:
   A  C
0
A  1  3
C  3  1