解析 yaml 文件时出错：发现无法启动任何标记的字符“%”

Question

我正在尝试从具有类似于 jinaj2 模板语法的一些表达式的 yaml 文件中解析数据，目标是删除或向文件添加一些项目。

AddCodesList.yaml

AddCodesList:
  body:
    list:
    {% for elt in customer %}
      - code: {{ elt.code }}
        name: {{ elt.name }}
        country: {{ elt.country }}
    {% endfor %}   
  result:
    json:
      responseCode: {{ responseCode }}
      responseMsg: {{ responseMsg }}
      responseData: {{ responseData }}

parseFile.py

import ruamel.yaml
from ruamel.yaml.util import load_yaml_guess_indent

data,indent,block_seq_indent=load_yaml_guess_indent(open('AddCodesList.yaml'), preserve_quotes=True)

#delete item
del data['body']['list']['code']
#add new item
data['parameters'].insert(2, 'ssl_password','xxxxxx')#create new file
ruamel.yaml.round_trip_dump(data, open('missingCode.yaml', 'w'), explicit_start=True)

执行parseFile.py脚本时出现以下错误：

    Traceback (most recent call last):
      File "d:/workspace/TEST/manageItem.py", line 4, in <module>
        data, indent, block_seq_indent = load_yaml_guess_indent(open('AddCodesList.
...
        if self.check_token(ValueToken):
      File "C:\Python34\lib\site-packages\ruamel\yaml\scanner.py", line 1534, in ch
        self.fetch_more_tokens()
      File "C:\Python34\lib\site-packages\ruamel\yaml\scanner.py", line 269, in fet
        % utf8(ch), self.get_mark())
    ruamel.yaml.scanner.ScannerError: while scanning for the next token
    found character '%' that cannot start any token
      in "<unicode string>", line 4, column 6:
            {% for elt in customer %}
             ^ (line: 4)

Answer 1

在 YAML 中，“{”开始一个流式映射，因此 (%) 将成为该映射的第一个键的开始，并且该字符不允许作为第一个字符。

通常您会先处理文件的模板，然后再应用 YAML。您无法轻易逆转该过程，因为 list 的值必须是有效的 YAML 构造。

使其可解析的解决方案之一是将 list 的值更改为有效的 YAML，例如：

list:
  - {% for elt in customer %}
  - code: {{ elt.code }}
    name: {{ elt.name }}
    country: {{ elt.country }}
  - {% endfor %}

或：

list: |
    {% for elt in customer %}
      - code: {{ elt.code }}
        name: {{ elt.name }}
        country: {{ elt.country }}
    {% endfor %}

这将不再使它成为可模板化的 bij jinja2。

您可以从 {% 更改 jinja2 中的启动顺序，但这对您没有帮助（即您仍然无法获得有效的 YAML）。我目前看到的唯一真正的解决方案是完全放弃 jinja2 并使用 Python 中的对象列表（在访问时扩展）实现 for 循环。

如果允许在应用jinja2之前总是进行预处理，您可以将文件更改为：

AddCodesList:
  body:
    list:
    # {% for elt in customer %}
      - code: '{{ elt.code }}'
        name: '{{ elt.name }}'
        country: '{{ elt.country }}'
    # {% endfor %}

因为它会加载，但您可能需要在运行模板引擎之前将 # b{ 更改为 {。

引用 单引号 因为只有单引号具有特殊含义。使用双引号，您更经常会得到 pre-processor 插入的内容，这会使 YAML 不正确（例如 DOS/Windows 样式 full-file-paths：'C:\yaml\abc.yaml' 是正确的，但 "c:\yaml\abc.yaml" 将在 YAML 解析期间给你一个错误。

Answer 2

问题已通过以下结构解决：

AddCodesList:
  body:
    list:
    # {% for elt in customer %}
      - code: "{{ elt.code }}"
        name: "{{ elt.name }}"
        country: "{{ elt.country }}"
    # {% endfor %}

解析 yaml 文件时出错：发现无法启动任何标记的字符“%”

Error when parsing yaml file : found character '%' that cannot start any token

yaml

ruamel.yaml