Re-indexing 具有复合索引的 DataFrame
Re-indexing a DataFrame with a composite index
我不得不使用 'index_col=False' 选项从文本文件加载我的 DataFrame,以避免 headers 和记录之间的偏移。
现在DataFrame已经正确加载和清理,我需要根据由前4列组成的键重新索引。
问题 1:推荐选项:我应该使用复合键创建一个附加列还是有更有效的替代方法?
Q2:如果我需要根据复合键重新编制索引,是否有关于如何在 DataFrame 中执行此操作的提示?
您可以使用 set_index([col1,col2,col3,col4],inplace=True)
将 4 列简单地放入您的索引中。可以参考文档:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.set_index.html
如果要检查索引的唯一性,还可以添加选项 verify_integrity=True
。
我不得不使用 'index_col=False' 选项从文本文件加载我的 DataFrame,以避免 headers 和记录之间的偏移。
现在DataFrame已经正确加载和清理,我需要根据由前4列组成的键重新索引。
问题 1:推荐选项:我应该使用复合键创建一个附加列还是有更有效的替代方法? Q2:如果我需要根据复合键重新编制索引,是否有关于如何在 DataFrame 中执行此操作的提示?
您可以使用 set_index([col1,col2,col3,col4],inplace=True)
将 4 列简单地放入您的索引中。可以参考文档:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.set_index.html
如果要检查索引的唯一性,还可以添加选项 verify_integrity=True
。