SpaCy NER 区分数字或实体
SpaCy NER differentiating numbers or entities
我目前正在玩 SpaCy NER,想知道 SpaCy NER 是否可以做这两件事:
案例一
假设我们有 2 个句子要用于 NER:
- 他体内的糖分在增加。
- 他的整体健康状况在提高。
我们能否将第一句中的 "increasing" 标记为 "symptoms" 实体,并将第二句中的 "increasing" 标记为 "good outcome" 实体? NER 会看到这 2 "increasing" 个单词的区别吗?
案例二
我们还有2个不同的句子:
- 我的工资是每月 8000 美元
- 我的支出是每月 5000 美元
NER能否将第一句中的数字视为"income"实体,将第二句中的数字视为"spending"?
谢谢
这些任务超出了您期望 NER 模型能够以多种方式完成的任务。 Spacy 的 NER 算法可用于查找实体类型,例如 MONEY
(这是其英语模型中的实体类型)或类似 SYMPTOM
的实体类型,但它不会查看非常大的上下文detect/classify 个实体,因此它无法区分相关上下文相距很远的这些情况。
您可能希望将 NER(或其他类型的相关跨度检测,也可以是基于规则的)与另一种更侧重于上下文的分析相结合。这可能是某种文本分类,您可以检查依赖解析等。
这是 spacy 文档中的一个简单示例,内容是使用 NER(以查找 MONEY
)提取实体关系,然后检查依赖项解析以尝试找出 money 元素可能指的是什么:
我目前正在玩 SpaCy NER,想知道 SpaCy NER 是否可以做这两件事:
案例一
假设我们有 2 个句子要用于 NER:
- 他体内的糖分在增加。
- 他的整体健康状况在提高。
我们能否将第一句中的 "increasing" 标记为 "symptoms" 实体,并将第二句中的 "increasing" 标记为 "good outcome" 实体? NER 会看到这 2 "increasing" 个单词的区别吗?
案例二
我们还有2个不同的句子:
- 我的工资是每月 8000 美元
- 我的支出是每月 5000 美元
NER能否将第一句中的数字视为"income"实体,将第二句中的数字视为"spending"?
谢谢
这些任务超出了您期望 NER 模型能够以多种方式完成的任务。 Spacy 的 NER 算法可用于查找实体类型,例如 MONEY
(这是其英语模型中的实体类型)或类似 SYMPTOM
的实体类型,但它不会查看非常大的上下文detect/classify 个实体,因此它无法区分相关上下文相距很远的这些情况。
您可能希望将 NER(或其他类型的相关跨度检测,也可以是基于规则的)与另一种更侧重于上下文的分析相结合。这可能是某种文本分类,您可以检查依赖解析等。
这是 spacy 文档中的一个简单示例,内容是使用 NER(以查找 MONEY
)提取实体关系,然后检查依赖项解析以尝试找出 money 元素可能指的是什么: