保持 OrderedDict 的顺序
Keeping the order of an OrderedDict
我有一个要传递给函数的 OrderedDict。在函数的某处它改变了顺序,虽然我不确定为什么并且正在尝试调试它。下面是函数以及函数和输出的示例:
def unnest_data(data):
path_prefix = ''
UNNESTED = OrderedDict()
list_of_subdata = [(data, ''),] # (data, prefix)
while list_of_subdata:
for subdata, path_prefix in list_of_subdata:
for key, value in subdata.items():
path = (path_prefix + '.' + key).lstrip('.').replace('.[', '[')
if not (isinstance(value, (list, dict))):
UNNESTED[path] = value
elif isinstance(value, dict):
list_of_subdata.append((value, path))
elif isinstance(value, list):
list_of_subdata.extend([(_, path) for _ in value])
list_of_subdata.remove((subdata, path_prefix))
if not list_of_subdata: break
return UNNESTED
那么,如果我调用它:
from collections import OrderedDict
data = OrderedDict([('Item', OrderedDict([('[@ID]', '288917'), ('Main', OrderedDict([('Platform', 'iTunes'), ('PlatformID', '353736518')])), ('Genres', OrderedDict([('Genre', [OrderedDict([('[@FacebookID]', '6003161475030'), ('Value', 'Comedy')]), OrderedDict([('[@FacebookID]', '6003172932634'), ('Value', 'TV-Show')])])]))]))])
unnest_data(data)
我得到的 OrderedDict 与我原来的顺序不匹配:
OrderedDict([('Item[@ID]', '288917'), ('Item.Genres.Genre[@FacebookID]', ['6003172932634', '6003161475030']), ('Item.Genres.Genre.Value', ['TV-Show', 'Comedy']), ('Item.Main.Platform', 'iTunes'), ('Item.Main.PlatformID', '353736518')])
注意在 "PlatformID" 之前有 "Genre",这不是它在原始字典中的排序方式。这似乎是我的错误,我该如何解决?
如果没有完整的工作示例,很难确切地说出哪里出了问题。但是根据您显示的代码,我怀疑您的问题根本不在于 OrderedDict
,而是您在迭代时修改 list_of_subdata
,这将导致项目意外跳过。
>>> a = [1, 2, 3, 4, 5, 6, 7]
>>> for x in a:
... print(x)
... a.remove(x)
...
1
3
5
7
鉴于您的用途,请考虑 deque
而不是列表。
我有一个要传递给函数的 OrderedDict。在函数的某处它改变了顺序,虽然我不确定为什么并且正在尝试调试它。下面是函数以及函数和输出的示例:
def unnest_data(data):
path_prefix = ''
UNNESTED = OrderedDict()
list_of_subdata = [(data, ''),] # (data, prefix)
while list_of_subdata:
for subdata, path_prefix in list_of_subdata:
for key, value in subdata.items():
path = (path_prefix + '.' + key).lstrip('.').replace('.[', '[')
if not (isinstance(value, (list, dict))):
UNNESTED[path] = value
elif isinstance(value, dict):
list_of_subdata.append((value, path))
elif isinstance(value, list):
list_of_subdata.extend([(_, path) for _ in value])
list_of_subdata.remove((subdata, path_prefix))
if not list_of_subdata: break
return UNNESTED
那么,如果我调用它:
from collections import OrderedDict
data = OrderedDict([('Item', OrderedDict([('[@ID]', '288917'), ('Main', OrderedDict([('Platform', 'iTunes'), ('PlatformID', '353736518')])), ('Genres', OrderedDict([('Genre', [OrderedDict([('[@FacebookID]', '6003161475030'), ('Value', 'Comedy')]), OrderedDict([('[@FacebookID]', '6003172932634'), ('Value', 'TV-Show')])])]))]))])
unnest_data(data)
我得到的 OrderedDict 与我原来的顺序不匹配:
OrderedDict([('Item[@ID]', '288917'), ('Item.Genres.Genre[@FacebookID]', ['6003172932634', '6003161475030']), ('Item.Genres.Genre.Value', ['TV-Show', 'Comedy']), ('Item.Main.Platform', 'iTunes'), ('Item.Main.PlatformID', '353736518')])
注意在 "PlatformID" 之前有 "Genre",这不是它在原始字典中的排序方式。这似乎是我的错误,我该如何解决?
如果没有完整的工作示例,很难确切地说出哪里出了问题。但是根据您显示的代码,我怀疑您的问题根本不在于 OrderedDict
,而是您在迭代时修改 list_of_subdata
,这将导致项目意外跳过。
>>> a = [1, 2, 3, 4, 5, 6, 7]
>>> for x in a:
... print(x)
... a.remove(x)
...
1
3
5
7
鉴于您的用途,请考虑 deque
而不是列表。