在映射产品中找到逻辑

Find A Logic In Mapping Products

我有一个逻辑问题,我实际上不知道如何克服它。我遇到了几个产品提要,这些提要内部有不同的字段,并且在所有数据提要中都没有标准化:upc、mpn、品牌名称、标题、描述。 目前我正在通过 upc 映射产品,因为它独特且非常简单。问题是只有少数产品有这个字段,所以我正在考虑另一种组合来映射品牌名称和 mpn。我用它来避免被不同品牌的 mpn 映射,实际上是不同的产品。 现在困难的部分来了: 一种产品,例如一双鞋具有:相同的 mpn 和品牌,即使它有不同的颜色。在这些情况下,我通常没有 upc,所以我不得不依赖 mpn 和品牌名称。颜色不是一个字段,所以我不能用它来进一步过滤。有图就知道颜色了

产品看起来像:

Merchant1,Product1,MPN1,Brand1(绿色) Merchant1,Product2,MPN1,Brand1(红色) Merchant2,Product3,MPN1,Brand1(绿色) Merchant2、Product4、MPN1、Brand1(红色)

我知道我可以拒绝同一商家的映射,这样我就可以避免混合来自同一商家的绿色和红色,但是我该怎么做才能将商家 1 的绿色与商家 2 的绿色相匹配。要说的文本字段没有绿色或红色,那是我在图片中看到的。

我不确定如何在这一切中找到逻辑,以便我可以相应地进行映射。

当您有 2 个产品时 Merchant1,Product1,MPN1,Brand1(绿色) Merchant1,Product2,MPN1,Brand1(红色) 你知道图像文件名吗??因为如果你知道你可以读取这个文件名连接所有信息,如 Merchant1,Product1,MPN1,Brand1+imageFileName 然后使用 md5 函数生成一个代码......你与每个产品一起存储......这样当你必须存储一个新的,你可以检查你的数据库中是否已经有那个 md5 代码