当个人有多个地址时,如何为 Dedupe 创建地名词典?

How do you make a gazetteer for Dedupe when individuals have multiple addresses?

根据 datamade Dedupe documentation,地名词典似乎需要干净、不同的个人级别数据。

如果这个人多次搬家、换工作等,你会怎么做?包括每个人的多个观察结果并智能填充空白?

如果你知道一个人有多个地址,我会像这样创建一个 'gazetteer'。

Address                Name      Person_ID
123 Main St.           John Doe  1
100 High St.           John Doe  1
1600 Pennsylvania Ave  John Doe  1

当你与此匹配时,你将有第二个解决步骤,你可以通过 Person_ID

合并