创建远程监督训练数据时,当存在多个关系时,如何确定两个实体之间的关系?
How to determine relationship between two entities when there is more than one relation while creating distant supervision training data?
我得到了远程监督的概念。据我理解,创建训练数据的过程是这样的;
- 从句子中提取命名实体
- 从每个句子中找出名为 "e1" 和 "e2" 的两个实体。
- 在知识库(freebase 等)中搜索这两个实体以查找它们之间的关系
我在这一步搞糊涂了。如果这两个实体(e1 和 e2)之间存在不止一种关系怎么办?如果是这样,我应该 select?
这取决于您训练的模型。
您正在学习一种关系的模型并进行引导吗?然后只关注那一种关系并从您的数据库中删除其他关系。
您是否正在尝试了解一堆关系?然后将每一项的存在与否用作模型中的特征。这就是 Universals Schemas 的工作原理。
这是 Universal Schema 论文中的特征矩阵图像:
我得到了远程监督的概念。据我理解,创建训练数据的过程是这样的;
- 从句子中提取命名实体
- 从每个句子中找出名为 "e1" 和 "e2" 的两个实体。
- 在知识库(freebase 等)中搜索这两个实体以查找它们之间的关系
我在这一步搞糊涂了。如果这两个实体(e1 和 e2)之间存在不止一种关系怎么办?如果是这样,我应该 select?
这取决于您训练的模型。
您正在学习一种关系的模型并进行引导吗?然后只关注那一种关系并从您的数据库中删除其他关系。
您是否正在尝试了解一堆关系?然后将每一项的存在与否用作模型中的特征。这就是 Universals Schemas 的工作原理。
这是 Universal Schema 论文中的特征矩阵图像: