创建远程监督训练数据时,当存在多个关系时,如何确定两个实体之间的关系?

How to determine relationship between two entities when there is more than one relation while creating distant supervision training data?

我得到了远程监督的概念。据我理解,创建训练数据的过程是这样的;

我在这一步搞糊涂了。如果这两个实体(e1 和 e2)之间存在不止一种关系怎么办?如果是这样,我应该 select?

这取决于您训练的模型。

您正在学习一种关系的模型并进行引导吗?然后只关注那一种关系并从您的数据库中删除其他关系。

您是否正在尝试了解一堆关系?然后将每一项的存在与否用作模型中的特征。这就是 Universals Schemas 的工作原理。

这是 Universal Schema 论文中的特征矩阵图像: