我怎样才能找到这个声明中的模式来找到二氧化碳排放量
How can I find a pattern in this statement to find the CO2 emissions
在 Python 报告中,我可以使用哪种模式来识别此段落或仅使用 spacy 的相关句子?
“我们的范围 1 和范围 2 温室气体总量
2019 年的排放量为 260 万吨,导致
温室气体强度因子为 0.014 公吨二氧化碳当量
百万立方英尺当量产量。
我尝试使用一个模式,它使用了这个,但它似乎不起作用:
pattern = [
{'IS_DIGIT': True},
{'LOWER': '(million metric tons)'},
]
对于您在此处给出的模式,模式中的每个字典都必须对应一个标记,但 (million metric tons)
不会是一个标记,因此它永远不会匹配任何内容。
你可以做的是使用一个短语模式,它使用文字文本,给 (million metric tons)
一个像 UNIT
这样的实体标签,然后在之后使用不同的实体标尺组件来匹配数字令牌后跟 UNIT
实体。
我建议您花时间通读 spaCy 文档中的全部 rule-based matching section,这将解释标记和短语模式之间的区别。
在 Python 报告中,我可以使用哪种模式来识别此段落或仅使用 spacy 的相关句子?
“我们的范围 1 和范围 2 温室气体总量 2019 年的排放量为 260 万吨,导致 温室气体强度因子为 0.014 公吨二氧化碳当量 百万立方英尺当量产量。
我尝试使用一个模式,它使用了这个,但它似乎不起作用:
pattern = [
{'IS_DIGIT': True},
{'LOWER': '(million metric tons)'},
]
对于您在此处给出的模式,模式中的每个字典都必须对应一个标记,但 (million metric tons)
不会是一个标记,因此它永远不会匹配任何内容。
你可以做的是使用一个短语模式,它使用文字文本,给 (million metric tons)
一个像 UNIT
这样的实体标签,然后在之后使用不同的实体标尺组件来匹配数字令牌后跟 UNIT
实体。
我建议您花时间通读 spaCy 文档中的全部 rule-based matching section,这将解释标记和短语模式之间的区别。