pandas get_group 导致内存错误
pandas get_group causes memory error
我有一个这样创建的分组数据框:
my_gb = pandas.read_csv(filepath_or_buffer=my_file_path,
delimiter='\t').groupby(['col1', 'col2', 'col3', 'col4'])
然后我打电话给 get_group
:
my_row = my_gb.get_group((val1, val2, val3, val4))
并获得 MemoryError
.
IIUC,这只是 returns 一行的视图(在我的数据集中)——这怎么会导致内存错误?
无法让它工作所以我自己做了分组:
data = pandas.read_csv(filepath_or_buffer=my_file_path, delimiter='\t')
grouped = {}
for key, value in data.iterrows():
grouped[(value['col1'], value['col2'], value['col3'], value['col4'])] = value
我有一个这样创建的分组数据框:
my_gb = pandas.read_csv(filepath_or_buffer=my_file_path,
delimiter='\t').groupby(['col1', 'col2', 'col3', 'col4'])
然后我打电话给 get_group
:
my_row = my_gb.get_group((val1, val2, val3, val4))
并获得 MemoryError
.
IIUC,这只是 returns 一行的视图(在我的数据集中)——这怎么会导致内存错误?
无法让它工作所以我自己做了分组:
data = pandas.read_csv(filepath_or_buffer=my_file_path, delimiter='\t')
grouped = {}
for key, value in data.iterrows():
grouped[(value['col1'], value['col2'], value['col3'], value['col4'])] = value