从 JSON 复制密钥和列表内容到 python
Copy keys and list contents from JSON in python
我正在尝试浏览一本包含不对称数据的字典并制作一个唯一标题列表。除了正常的 key:value 项目外,字典中的数据还包括其他字典、列表、字典列表、NoneTypes 等,贯穿始终。如果可能的话,我希望能够保留 keys/indexes 的层次结构。这将用于评估数据的范围及其可用性。数据来自 JSON 文件,其内容可能会发生变化。
我最近的尝试是通过函数内的一系列类型检查来做到这一点,skim()
,如下所示。
def skim(obj, header='', level=0):
if obj is None:
return
def skim_iterable(iterable):
lvl = level +1
if isinstance(iterable, (list, tuple)):
for value in iterable:
h = ':'.join([header, iterable.index(value)])
return skim(value, header=h, level=lvl)
elif isinstance(iterable, dict):
for key, value in iterable.items():
h = ':'.join([header, key])
return skim(value, header=h, level=lvl)
if isinstance(obj, (int, float, str, bool)):
return ':'.join([header, obj, level])
elif isinstance(obj, (list, dict, tuple)):
return skim_iterable(obj)
目的是对skim()
进行递归调用,直到传完最深层的键或列表索引位置,然后returned。 skim
有一个处理可迭代 object 的内部函数,它通过每个嵌套的可迭代 object 携带级别以及键值或列表索引位置向前。
下面的例子
test = {"level_0Item_1": {
"level_1Item_1": {
"level_2Item_1": "value",
"level_2Item_2": "value"
},
"level_1Item_2": {
"level_2Item_1": "value",
"level_2Item_2": {}
}},
"level_0Item_2": [
{
"level_1Item_1": "value",
"level_1Item_2": 569028742
}
],
"level_0Item_3": []
}
collection = [skim(test)]
现在,我在上面的代码中得到了 return 的 [None]
,并且希望获得有关如何最好地解决此问题的帮助或指导。我期待的是这样的:
['level_0Item_1:level_1Item_1:level_2Item_1',
'level_0Item_1:level_1Item_1:level_2Item_2',
'level_0Item_1:level_1Item_2:level_2Item_1',
'level_0Item_1:level_1Item_2:level_2Item_2',
'level_0Item_2:level_1Item_1',
'level_0Item_2:level_1Item_2',
'level_0Item_3]
在其他资源中,我最近遇到了这个问题 (python JSON complex objects (accounting for subclassing)),阅读它并包含参考资料。在这里全面披露,我最近才开始编码。
感谢您的帮助。
您可以尝试类似的方法:
def skim(obj, connector=':', level=0, builded_str= ''):
if isinstance(obj, dict):
for k, v in obj.items():
if isinstance(v, dict) and v:
yield from skim(v, connector, level + 1, builded_str + k + connector)
elif isinstance(v, list) and v:
yield from skim(v[0], connector, level + 1, builded_str + k + connector)
else:
yield builded_str + k
else:
yield builded_str
测试:
test = {"level_0Item_1": {
"level_1Item_1": {
"level_2Item_1": "value",
"level_2Item_2": "value"
},
"level_1Item_2": {
"level_2Item_1": "value",
"level_2Item_2": {}
}},
"level_0Item_2": [
{
"level_1Item_1": "value",
"level_1Item_2": 569028742
}
],
"level_0Item_3": []
}
lst = list(skim(test))
print(lst)
['level_0Item_1:level_1Item_2:level_2Item_1`',
'level_0Item_1:level_1Item_2:level_2Item_2',
'level_0Item_1:level_1Item_1:level_2Item_1',
'level_0Item_1:level_1Item_1:level_2Item_2',
'level_0Item_2:level_1Item_2',
'level_0Item_2:level_1Item_1',
'level_0Item_3']`
我正在尝试浏览一本包含不对称数据的字典并制作一个唯一标题列表。除了正常的 key:value 项目外,字典中的数据还包括其他字典、列表、字典列表、NoneTypes 等,贯穿始终。如果可能的话,我希望能够保留 keys/indexes 的层次结构。这将用于评估数据的范围及其可用性。数据来自 JSON 文件,其内容可能会发生变化。
我最近的尝试是通过函数内的一系列类型检查来做到这一点,skim()
,如下所示。
def skim(obj, header='', level=0):
if obj is None:
return
def skim_iterable(iterable):
lvl = level +1
if isinstance(iterable, (list, tuple)):
for value in iterable:
h = ':'.join([header, iterable.index(value)])
return skim(value, header=h, level=lvl)
elif isinstance(iterable, dict):
for key, value in iterable.items():
h = ':'.join([header, key])
return skim(value, header=h, level=lvl)
if isinstance(obj, (int, float, str, bool)):
return ':'.join([header, obj, level])
elif isinstance(obj, (list, dict, tuple)):
return skim_iterable(obj)
目的是对skim()
进行递归调用,直到传完最深层的键或列表索引位置,然后returned。 skim
有一个处理可迭代 object 的内部函数,它通过每个嵌套的可迭代 object 携带级别以及键值或列表索引位置向前。
下面的例子
test = {"level_0Item_1": {
"level_1Item_1": {
"level_2Item_1": "value",
"level_2Item_2": "value"
},
"level_1Item_2": {
"level_2Item_1": "value",
"level_2Item_2": {}
}},
"level_0Item_2": [
{
"level_1Item_1": "value",
"level_1Item_2": 569028742
}
],
"level_0Item_3": []
}
collection = [skim(test)]
现在,我在上面的代码中得到了 return 的 [None]
,并且希望获得有关如何最好地解决此问题的帮助或指导。我期待的是这样的:
['level_0Item_1:level_1Item_1:level_2Item_1',
'level_0Item_1:level_1Item_1:level_2Item_2',
'level_0Item_1:level_1Item_2:level_2Item_1',
'level_0Item_1:level_1Item_2:level_2Item_2',
'level_0Item_2:level_1Item_1',
'level_0Item_2:level_1Item_2',
'level_0Item_3]
在其他资源中,我最近遇到了这个问题 (python JSON complex objects (accounting for subclassing)),阅读它并包含参考资料。在这里全面披露,我最近才开始编码。
感谢您的帮助。
您可以尝试类似的方法:
def skim(obj, connector=':', level=0, builded_str= ''):
if isinstance(obj, dict):
for k, v in obj.items():
if isinstance(v, dict) and v:
yield from skim(v, connector, level + 1, builded_str + k + connector)
elif isinstance(v, list) and v:
yield from skim(v[0], connector, level + 1, builded_str + k + connector)
else:
yield builded_str + k
else:
yield builded_str
测试:
test = {"level_0Item_1": {
"level_1Item_1": {
"level_2Item_1": "value",
"level_2Item_2": "value"
},
"level_1Item_2": {
"level_2Item_1": "value",
"level_2Item_2": {}
}},
"level_0Item_2": [
{
"level_1Item_1": "value",
"level_1Item_2": 569028742
}
],
"level_0Item_3": []
}
lst = list(skim(test))
print(lst)
['level_0Item_1:level_1Item_2:level_2Item_1`',
'level_0Item_1:level_1Item_2:level_2Item_2',
'level_0Item_1:level_1Item_1:level_2Item_1',
'level_0Item_1:level_1Item_1:level_2Item_2',
'level_0Item_2:level_1Item_2',
'level_0Item_2:level_1Item_1',
'level_0Item_3']`