如何 select 来自 DataFrame 的数据列

How to select columns of data from a DataFrame

我正在通过其 API(远程控制)从 Lime Survey 检索调查结果:

并且我设法将其放入 DataFrame 中。但它每行只有 1 列:

数据是这样的

我想做的是按问题和类别获取数据的平均值。在下面的例子中,q10[wor1], q10[wor2], . . ., q10[wor7] 给出属于 q10 类别的 7 个问题。

如何首先 select wor1、wor2、...、wor7 的所有数据,分别,以便我可以对每个单独的问题进行统计。

那么我如何select q10* 的所有数据以便我可以对整个组进行统计?

即使不尝试将类别与问题分开,我也无法 select 所有 'q10[wor1]' 数据。

查看 jq - https://stedolan.github.io/jq/

您可以将 df ['responses'] json 传递给 jq 并提取所需字段并将其创建为单独的 df 列。

然后你可以从 df 中得到列的平均值。