如何连接 pandas.DataFrame() 中的特定列?
How to concatenate a specific column from a pandas.DataFrame()?
我有一个文件列表,我想为我的所有文件合并其中的一个特定列,运行 一些累积分析。
import pandas as pd
import numpy as np
all_data_sets = pd.DataFrame([])
for file_name in file_list:
my_data = pd.DataFrame([])
my_data = pd.read_csv(file_name, delimiter=',', names=header_row)
my_data = my_data.reset_index()
all_data_sets.append(my_data['sales'])
#np.mean(all_data_sets['sales'])
np.mean(all_data_sets)
您可以使用 concat
连接 DataFrame 列表
df_list = [pd.read_csv(file_name, delimiter=',', names=header_row) for file_name in file_list] #opens your csv
df = pd.concat(df_list)
然后你通过
计算平均值
df.sales.mean()
一个小例子
a = pd.DataFrame({'sales' : [2,4,6] , 'other' : [1,2,1]})
b = pd.DataFrame({'sales' : [7,4,7] , 'other' : [9,2,1]})
df = pd.concat([a,b])
数据框是
other sales
0 1 2
1 2 4
2 1 6
0 9 7
1 2 4
2 1 7
和平均值
df.sales.mean()
5.0
我有一个文件列表,我想为我的所有文件合并其中的一个特定列,运行 一些累积分析。
import pandas as pd
import numpy as np
all_data_sets = pd.DataFrame([])
for file_name in file_list:
my_data = pd.DataFrame([])
my_data = pd.read_csv(file_name, delimiter=',', names=header_row)
my_data = my_data.reset_index()
all_data_sets.append(my_data['sales'])
#np.mean(all_data_sets['sales'])
np.mean(all_data_sets)
您可以使用 concat
连接 DataFrame 列表
df_list = [pd.read_csv(file_name, delimiter=',', names=header_row) for file_name in file_list] #opens your csv
df = pd.concat(df_list)
然后你通过
计算平均值 df.sales.mean()
一个小例子
a = pd.DataFrame({'sales' : [2,4,6] , 'other' : [1,2,1]})
b = pd.DataFrame({'sales' : [7,4,7] , 'other' : [9,2,1]})
df = pd.concat([a,b])
数据框是
other sales
0 1 2
1 2 4
2 1 6
0 9 7
1 2 4
2 1 7
和平均值
df.sales.mean()
5.0