使用 ruamel yaml 保存 YAML 的结构

Preserve structure of YAML with ruamel yaml

我一直在使用 ruamel yaml 编辑我的 YAML 文件并将它们转储回来。我需要帮助了解如何保持与原始文件相同的结构,因为我所做的就是复制它、编辑并重新编写它。

例如,这是原始文件:

    ElasticLoadBalancingV2Listener:
        Type: "AWS::ElasticLoadBalancingV2::Listener"
        Properties:
            LoadBalancerArn: !Ref ElasticLoadBalancingV2LoadBalancer
            Port: !FindInMap [NLBPorts, Port1, Port]
            Protocol: "TCP"
            DefaultActions:
              -
                Order: 1
                TargetGroupArn: !Ref ElasticLoadBalancingV2TargetGroup1
                Type: "forward"

新文件看起来不一样:

    ElasticLoadBalancingV2Listener:
        Type: "AWS::ElasticLoadBalancingV2::Listener"
        Properties:
            LoadBalancerArn: !Ref ElasticLoadBalancingV2LoadBalancer
            Port: !FindInMap [NLBPorts, Port1, Port]
            Protocol: "TCP"
            DefaultActions:
            -  Order: 1
               TargetGroupArn: !Ref ElasticLoadBalancingV2TargetGroup1
               Type: "forward"

最大的问题是我使用了 ruamel 必须解决的各种技巧,但每次 yaml 的不同部分都会中断。

这是我的功能:

def editEndpointServiceTemplate(endpoint_service_template_path):
    yaml = YAML()
    yaml.preserve_quotes = True
    # yaml.compact(seq_seq=False, seq_map=False)
    # yaml.indent(mapping=4, sequence=3, offset=0)

    #Load yaml file
    with open(endpoint_service_template_path) as fp:
        data = yaml.load(fp)
    
    #Edit the yaml
    data['Description'] = "CloudFormation"

    #Write new yaml file
    with open(endpoint_service_template_path, 'w') as fp:
        yaml.dump(data, fp)

正如您在注释命令中看到的那样,我修改了设置但找不到最佳点。

在这种情况下,很明显您的函数没有产生您提供的输出 (不同的缩进,缺少单词“CloudFormation”),但总的来说你应该小心 在问题中这是相同的,并且您的程序是完整的,因此结果可以 更容易被复制。

ruamel.yaml 没有针对各种罕见格式的内置函数,但是你的 相对接近使用方法 .indent(mapping=4, sequence=4, offset=2) 和 通过逐行检查进行转换。

因为使用字符串标量不太可能有一个序列指示符后跟三个 spaces ("- ") (另外还必须包装成一行中的第一个非space),你最好做 .indent(mapping=4, sequence=4, offset=0) 转换:

import sys
import ruamel.yaml

yaml_str = """\
ElasticLoadBalancingV2Listener:
    Type: "AWS::ElasticLoadBalancingV2::Listener"
    Properties:
        LoadBalancerArn: !Ref ElasticLoadBalancingV2LoadBalancer
        Port: !FindInMap [NLBPorts, Port1, Port]
        Protocol: "TCP"
        DefaultActions:
            -
            Order: 1
            TargetGroupArn: !Ref ElasticLoadBalancingV2TargetGroup1
            Type: "forward"
"""

yaml = ruamel.yaml.YAML()
yaml.indent(mapping=4, sequence=4, offset=0)
yaml.preserve_quotes = True
data = yaml.load(yaml_str)
data['Description'] = "CloudFormation"

def break_seq(s):
    result = []
    PAT = '-   '
    for line in s.splitlines():
        ls_line = line.lstrip()
        if ls_line.startswith(PAT):
            line = line.replace(PAT, '  - \n' + ' ' * (line.index(PAT) + 4))
        result.append(line)
    return '\n'.join(result)

yaml.dump(data, sys.stdout, transform=break_seq)

给出:

ElasticLoadBalancingV2Listener:
    Type: "AWS::ElasticLoadBalancingV2::Listener"
    Properties:
        LoadBalancerArn: !Ref ElasticLoadBalancingV2LoadBalancer
        Port: !FindInMap [NLBPorts, Port1, Port]
        Protocol: "TCP"
        DefaultActions:
          - 
            Order: 1
            TargetGroupArn: !Ref ElasticLoadBalancingV2TargetGroup1
            Type: "forward"
Description: CloudFormation

以上可以通过“破解”序列化为序列的例程来完成,但是 只转换输出通常更容易,尽管效率不高 time/space 用法。

除非使用此输出的程序使用不完整的 YAML 解析器,否则 加载的实际数据结构不会改变,只是人们的可读性较差 不习惯这种不常见的格式。