在数据透视表中使用多列索引 table
Using more than one column for indexing in a pivot table
我想在旋转 pandas
dataframe
时合并两列作为索引。我正在使用以下代码来执行此操作:
ConceptTemp = Concept.pivot(index=['memberid','testscoreid'], columns='questionid', values='correct')
这给了我以下错误:
ValueError: Wrong number of items passed 1532, placement implies 2
1532 是我的 dataframe
中的行数。我不能仅在 memberid
或 testscoreid
上 pivot
,因为我会有重复的 questionid
值。索引列必须是 testscoreid
AND memberid
.
的组合
有人能指点一下如何完成这项工作吗?
我想你可以使用 pivot_table
:
ConceptTemp = Concept.pivot_table(index=['memberid','testscoreid'],
columns='questionid',
values='correct')
pivot_table
使用 aggfunc
,如果重复则默认为 aggfunc=np.mean
。更好的示例解释是 and in docs.
我想在旋转 pandas
dataframe
时合并两列作为索引。我正在使用以下代码来执行此操作:
ConceptTemp = Concept.pivot(index=['memberid','testscoreid'], columns='questionid', values='correct')
这给了我以下错误:
ValueError: Wrong number of items passed 1532, placement implies 2
1532 是我的 dataframe
中的行数。我不能仅在 memberid
或 testscoreid
上 pivot
,因为我会有重复的 questionid
值。索引列必须是 testscoreid
AND memberid
.
有人能指点一下如何完成这项工作吗?
我想你可以使用 pivot_table
:
ConceptTemp = Concept.pivot_table(index=['memberid','testscoreid'],
columns='questionid',
values='correct')
pivot_table
使用 aggfunc
,如果重复则默认为 aggfunc=np.mean
。更好的示例解释是