python - 将正确缩进的嵌套字典转储到 yaml

python - dumping a nested dict with correct indentation to yaml

我非常接近于自动转储一个 yml 文件,该文件是为自动化任务从数据框创建的。

我有一个结构如下的函数:

def get_all_values(nested_dictionary):
    for key,value in nested_dictionary.items():
        model = {
           "models": [
                {
            "name": key,
              "columns": None
                }
            ]
        }            
        yield(model)
        for key,value in value.items():
                table = [
                    {
                       "name": key,
                            "tests": [            
                                "not_null",
                                "unique"            
                            ]
                       }
                ]
                yield(table)
    nested_dictionary = d1
    get_all_values(nested_dictionary)
    data = get_all_values(nested_dictionary)
    with open('data.yml', 'w') as outfile:
        with redirect_stdout(outfile):
            for i in data:
                ruamel.yaml.round_trip_dump(i,outfile, indent=5, block_seq_indent=2)

它引用的字典作为生成器生成。字典结构是:

    {'models': [{'name': 'budgets_sales', 'columns': None}]}
[{'name': 'budget_amt', 'tests': ['not_null', 'unique']}]
[{'name': 'budget_group', 'tests': ['not_null', 'unique']}]
[{'name': 'budget_name', 'tests': ['not_null', 'unique']}]
[{'name': 'budget_pk', 'tests': ['not_null', 'unique']}]
        

这工作“很好”...但输出如下:

models:
  -  name: budgets_sales
     columns:
  -  name: budget_amt
     tests:
       -  not_null
       -  unique
  -  name: budget_group
     tests:
       -  not_null
       -  unique
  -  name: budget_name
     tests:
       -  not_null
       -  unique

我要求字典中键的所有值都有一个额外的缩进。我不知道如何使值相对于键缩进。

如果正确的话应该是这样的:

- name: budgets_sales
  columns:
      -  name: budget_amt
         tests:
            -  not_null
            -  unique
      -  name: budget_group
         tests:
            -  not_null
            -  unique
      -  name: budget_name
         tests:
            -  not_null
            -  unique
      -  name: budget_pk
         tests:
            -  not_null
            -  unique
      -  name: entry_type_code
         tests:
            -  not_null
            -  unique
      -  name: institution_fk
         tests:
            -  not_null
            -  unique

谁能提供一个方法?


感谢 Anthon,这就是我最终使用的:

def get_all_values(nested_dictionary):
    res = [{"version":2},{"models":None}]
    for key,value in nested_dictionary.items():
        seq = []
        res.append([{"name": key, "columns": seq}])
        # for key1, value1 in value.items():  # not using value1
        for key1 in value.keys():
            elem = {"name": key1, "tests": ["not_null", "unique"]}
            seq.append(elem)
    return res

nested_dictionary = d1

get_all_values(nested_dictionary)

data = get_all_values(nested_dictionary)

    
with open('data.yml', 'w') as outfile:
    
    with redirect_stdout(outfile):
        
        for i in data:  
            
            yaml = ruamel.yaml.YAML()
            yaml.indent(mapping=5, sequence=5, offset=4)            
            yml.dump(i,outfile)

在您需要的输出中,与键 columns 关联的值是一个序列。 如果你的 Python 数据结构是一个列表,你只会得到它,所以确保你 将您的个人 table 条目附加到某个变量。

根据您的“不正确”输出,我猜测 d1

import sys
import ruamel.yaml

d1 = dict(budgets_sales=dict(budget_amt=None, budget_group=None, budget_name=None, budget_pk=None))

def get_all_values(nested_dictionary):
    res = []
    for key,value in nested_dictionary.items():
        seq = []
        res.append({"name": key, "columns": seq})
        # for key1, value1 in value.items():  # not using value1
        for key1 in value.keys():
            elem = {"name": key, "tests": ["not_null", "unique"]}
            seq.append(elem)
    return res
    
data = get_all_values(d1)

yaml = ruamel.yaml.YAML()
yaml.indent(mapping=5, sequence=5, offset=3)
yaml.dump(data, sys.stdout)

给出:

   - name: budgets_sales
     columns:
        - name: budgets_sales
          tests:
             - not_null
             - unique
        - name: budgets_sales
          tests:
             - not_null
             - unique
        - name: budgets_sales
          tests:
             - not_null
             - unique
        - name: budgets_sales
          tests:
             - not_null
             - unique

有几件事您应该考虑(除了在 SO 上更好地格式化您的代码和数据之外):

  • round_trip_dump 函数已被弃用,请勿在新代码中使用它
  • 包含 YAML 文档的文件的推荐扩展名是 .yaml,至少从 2007 年 9 月开始
  • 不要分多个阶段编写 YAML 文件,创建一个完整的数据结构并转储它。如果你想在一个文件中包含多个 YAML 文档,请列出数据结构并使用 .dump_all() 方法。

如果所有其他方法都失败了,并且您有有效的手工制作的 YAML 要生成作为输出,请加载该 YAML(使用 YAML(typ='safe').load() 并检查您获得的 Python 中的数据结构。