SpaCy NER 区分数字或实体

SpaCy NER differentiating numbers or entities

我目前正在玩 SpaCy NER,想知道 SpaCy NER 是否可以做这两件事:

案例一

假设我们有 2 个句子要用于 NER:

  1. 他体内的糖分在增加。
  2. 他的整体健康状况在提高。

我们能否将第一句中的 "increasing" 标记为 "symptoms" 实体,并将第二句中的 "increasing" 标记为 "good outcome" 实体? NER 会看到这 2 "increasing" 个单词的区别吗?

案例二

我们还有2个不同的句子:

  1. 我的工资是每月 8000 美元
  2. 我的支出是每月 5000 美元

NER能否将第一句中的数字视为"income"实体,将第二句中的数字视为"spending"?

谢谢

这些任务超出了您期望 NER 模型能够以多种方式完成的任务。 Spacy 的 NER 算法可用于查找实体类型,例如 MONEY(这是其英语模型中的实体类型)或类似 SYMPTOM 的实体类型,但它不会查看非常大的上下文detect/classify 个实体,因此它无法区分相关上下文相距很远的这些情况。

您可能希望将 NER(或其他类型的相关跨度检测,也可以是基于规则的)与另一种更侧重于上下文的分析相结合。这可能是某种文本分类,您可以检查依赖解析等。

这是 spacy 文档中的一个简单示例,内容是使用 NER(以查找 MONEY)提取实体关系,然后检查依赖项解析以尝试找出 money 元素可能指的是什么:

https://spacy.io/usage/examples#entity-relations