从 OpenRefine 中的记录(而不是行)创建维基数据项?

Create wikidata items from records in OpenRefine (and not rows)?

我读到 OpenRefine Wikidata 插件 always operates in row mode

我在记录模式下有数据的情况:记录是 serial/magazine,并且该记录中的行是相同 serial/magazine 的各种格式(通常是纸质和电子版)。每行都有一个唯一的 ISSN identifier.Wikidata 认为 serial/magazine(我的记录)只有一个项目,但每种格式(我的行)没有单独的项目。

将数据与维基数据进行核对时,同一记录的所有行通常会匹配相同的维基数据项,或者 none 行会匹配,或者有时只有一行记录会匹配(例如,如果在维基数据中只有一种格式的 ISSN——比如纸质格式——是已知的,但其他的不是。

我想做的是在 Wikidata 中为每个 记录 创建项目,但没有找到协调结果(iow,没有匹配的行),而不是每个。而且,在创建此项目时,我想添加此记录中所有行的 ISSN。

我想知道是否可以这样做?以及如何?

谢谢

是的,这是可能的。您需要对第一列执行对帐操作。

  • 如文档所述,对定义记录的第一列使用 向下填充 操作;
  • 将列与 Wikidata 协调;
  • 然后,为相似单元格创建一个新项目 操作(在 Reconcile -> A​​ctions 菜单)
  • 创建一个架构,其中第一列用作主题 ID。

假设第一列中的值最初是不同的(在您的示例中就是这种情况),这将为每条记录创建一个项目。

在您的示例中,因为您的第一列包含 ISSN 而不是标题,所以我将首先创建一个包含标题的根列(在上述过程之前)。在行模式下,通过在第一列中选​​择 non-blank 值来保留每条记录的第一行,然后复制带有标题的列,并将此新列移动到第一个位置。这应该确保对帐选择现有项目。请注意,如果多个期刊使用相同的标题,这将为它们创建一个项目,除非您在协调配置中添加其他属性(例如 ISSN)。