从字典列表到 np 数组数组和 vice-versa

From list of dictionaries to np array of arrays and vice-versa

我正在尝试找到将字典列表转换为数组的 numpy 数组的最佳方法(用 NULL 填充缺失值)。我还需要相反的方法:将数组的 numpy 数组转换为字典列表(键为 header)。

问题: Python 字典没有排序。当处理大量行时,理解列表不是最佳选择。

示例:

listOfDicts = [{'key1': 10, 'key2': 15, 'key3': 19},
               {'key1': 20, 'key2': 25, 'key3': 29},
               {'key1': 30, 'key2': 35, 'key3': 39},
               {'key1': 40, 'key2': 45, 'key3': 49}]

预期输出:

[[10 15 19]
 [20 25 29]
 [30 35 39]
 [40 45 49]]

为什么我需要这个:我需要这个是因为我正在将一个 Python 脚本集成到 Splunk 搜索中。 Splunk 的输入是字典列表,由 splunk.Intersplunk.getOrganizedResults() 返回。要显示输出,我们需要调用 splunk.Intersplunk.outputResults(results),其中 results 也是字典列表

您可以使用 pandas 轻松做到这一点:

import pandas as pd
listOfDicts = [{"key1":10, "key3":19},
               {"key1":20, "key2":25, "key3":29},
               {"key1":30, "key2":35, "key3":39},
               {"key1":40, "key2":45, "key3":49}]

df = pd.DataFrame(listOfDicts)
vals = df.values
vals

array([[10, nan, 19],
       [20, 25,  29],
       [30, 35,  39],
       [40, 45,  49]])

要将 NumPy 数组转换为字典,您可以使用:

df2 = pd.DataFrame(vals, columns=df.columns)
df2.to_dict(orient='records')

[{'key1': 10.0, 'key2': nan, 'key3': 19.0},
 {'key1': 20.0, 'key2': 25.0, 'key3': 29.0},
 {'key1': 30.0, 'key2': 35.0, 'key3': 39.0},
 {'key1': 40.0, 'key2': 45.0, 'key3': 49.0}]