openrefine/googlerefine - 协调两个数据集
openrefine/googlerefine - reconcile two datasets
我有两个 json 文件:文件 A 包含不同的数据,其中一个包含数字 ID。文件 B 包含所有可能的数字 ID link 与增值税 number.In rdf 最终文件我想替换第一个文件的 ID 列或添加具有相关增值税编号的另一列。欢迎任何建议,谢谢
编辑:文件一个结构(它是一个像这样结构的数据数组)。字段 'suppliers' 始终包含一个值,即我之前提到的 id 参数
{
"coupon_number": 25422,
"url": "xxx",
"title": "Lorem ipsum dolor sit amet, duo ei accusam aliquando rationibus, sed id dolor sensibus delicatissimi.",
"suppliers": [
3043
],
}
文件B结构(另一个数组)
{
"id": 3043,
"vatNumber": "03918590401",
}
我需要link 'suppliers' 增值税号或替换为增值税号
基本上,您必须基于 Json 文件创建两个项目,然后在它们之间执行一种 Vlookup
。
您提到了一篇博客 post,它解释了如何使用 cell.cross()
函数在 OpenRefine 中进行连接,但是这种方法已经不再使用了。大多数用户都下载了 Vib-Bit plugin(第一个可以从此页面下载的),让您可以直观地加入他们。
只需将插件解压到 OpenRefine 目录的 webapps\extensions 文件夹中,重新启动 OpenRefine,然后选中“编辑列”->“从另一个项目添加列”。
重要细节:在进行联接之前,将包含数字(绿色)的公共列转换为字符串(黑色)。
以下截屏视频显示了这些操作。
我有两个 json 文件:文件 A 包含不同的数据,其中一个包含数字 ID。文件 B 包含所有可能的数字 ID link 与增值税 number.In rdf 最终文件我想替换第一个文件的 ID 列或添加具有相关增值税编号的另一列。欢迎任何建议,谢谢
编辑:文件一个结构(它是一个像这样结构的数据数组)。字段 'suppliers' 始终包含一个值,即我之前提到的 id 参数
{
"coupon_number": 25422,
"url": "xxx",
"title": "Lorem ipsum dolor sit amet, duo ei accusam aliquando rationibus, sed id dolor sensibus delicatissimi.",
"suppliers": [
3043
],
}
文件B结构(另一个数组)
{
"id": 3043,
"vatNumber": "03918590401",
}
我需要link 'suppliers' 增值税号或替换为增值税号
基本上,您必须基于 Json 文件创建两个项目,然后在它们之间执行一种 Vlookup
。
您提到了一篇博客 post,它解释了如何使用 cell.cross()
函数在 OpenRefine 中进行连接,但是这种方法已经不再使用了。大多数用户都下载了 Vib-Bit plugin(第一个可以从此页面下载的),让您可以直观地加入他们。
只需将插件解压到 OpenRefine 目录的 webapps\extensions 文件夹中,重新启动 OpenRefine,然后选中“编辑列”->“从另一个项目添加列”。
重要细节:在进行联接之前,将包含数字(绿色)的公共列转换为字符串(黑色)。
以下截屏视频显示了这些操作。