自动将维基数据 URI 分配给名称列表

Automatically assign Wikidata URIs to a list of names

我在 XML 中列出了各种语言的植物名称(植物名称;英语、德语和这两种语言的大量历史变体)(但是,将其转换为任何序列化都不会一个问题)。这是现在的样子:

<ingredients>
  <ingredient>
    <lemma>Rosmarinus officinalis L.</lemma>
    <syn lang="deu">Rosmarin</syn>
    <syn lang="ang">boþen</syn>
    <syn lang="ang">feldmædere</syn>
    <syn lang="ang">lauendie</syn>
    <syn lang="eng">rosemary</syn>
    <syn lang="ang">sundēaw</syn>
  </ingredient>
  <ingredient>
    ...
</ingredients>

现在我想知道是否有办法将 Wikidata and/or 受控词汇表中的其他 URI 自动分配给此列表。当然,考虑到不匹配 100% 的字符串的可控错误率。可以使用哪些方法获得:

 <ingredient wikidata="Q122679">
    <lemma>Rosmarinus officinalis L.</lemma>
    ...

感谢任何想法!

只想说 OpenRefine 正是我所需要的!