如何使用 pandas 到 select csv 文件中的某些列

Question

我才刚刚开始我的编码之旅，并且已经在 youtube 上观看了一堆教程，现在我正在尝试使用 jupyter 'import' 将 SPSS 中的数据集 python 。

到目前为止，我已经设法将 .sav 转换为 .csv 文件并使用下面的代码读取它。我想 select 我数据中的某些列并将它们存储在一个新的 csv 文件中，以便对它们进行一些分析并尝试构建一个脚本来预测某些事物和特征。问题是我有数百个数据列，并且只希望从 3 或 4 个开始。

我尝试使用 data.drop() 函数，但很快意识到必须有更好的方法来做到这一点？

对于我无法以更好的方式解释这一点，我提前表示歉意，因为这是我第一次post来到这里。

import pandas as pd
df = pd.read_csv('csvfile.csv')
df

Answer 1

您可以按名称 select 列。

import pandas as pd 
df = pd.read_csv('csvfile.csv')
final_df = df[['col1','col2','col3']]

或者您可以 select 按索引

final_df = df.iloc[:,[0,1,2]]

Answer 2

使用这个：

import pandas as pd
df = pd.read_csv('csvfile.csv' , usecols = ['col1','col2'])
df

代替 'col1' 和 'col2' 输入列名称。然后将它们写入另一个 csv ，这样做：

df.to_csv('csv_file_1.csv' , index = False)

How to use pandas to select certain columns in csv file