openrefine/googlerefine - 协调两个数据集

openrefine/googlerefine - reconcile two datasets

我有两个 json 文件:文件 A 包含不同的数据,其中一个包含数字 ID。文件 B 包含所有可能的数字 ID link 与增值税 number.In rdf 最终文件我想替换第一个文件的 ID 列或添加具有相关增值税编号的另一列。欢迎任何建议,谢谢

编辑:文件一个结构(它是一个像这样结构的数据数组)。字段 'suppliers' 始终包含一个值,即我之前提到的 id 参数

{
    "coupon_number": 25422,
    "url": "xxx",
    "title": "Lorem ipsum dolor sit amet, duo ei accusam aliquando rationibus, sed id dolor sensibus delicatissimi.",
    "suppliers": [
        3043
    ],
}

文件B结构(另一个数组)

{
    "id": 3043,
    "vatNumber": "03918590401",
}

我需要link 'suppliers' 增值税号或替换为增值税号

基本上,您必须基于 Json 文件创建两个项目,然后在它们之间执行一种 Vlookup

您提到了一篇博客 post,它解释了如何使用 cell.cross() 函数在 OpenRefine 中进行连接,但是这种方法已经不再使用了。大多数用户都下载了 Vib-Bit plugin(第一个可以从此页面下载的),让您可以直观地加入他们。

只需将插件解压到 OpenRefine 目录的 webapps\extensions 文件夹中,重新启动 OpenRefine,然后选中“编辑列”->“从另一个项目添加列”。

重要细节:在进行联接之前,将包含数字(绿色)的公共列转换为字符串(黑色)。

以下截屏视频显示了这些操作。