如何将粗略描述与指南数据集相匹配并在 sas 中提取 ID
how to match a crude description to a guide dataset and extract ID's in sas
我有一个 excel sheet,上面有一些电子产品的描述。例如:moto g 第一代 xt8001 等。
我有另一个产品数据集(指南列表),product_ID我想将产品从粗略描述与指南列表相匹配,并得出最适合我的描述的产品 ID。
感谢任何帮助。对 sas 真的很陌生
示例:
指南列表有
product_ID Product Description make model year variant
er345c 2012 xata xt 1 juicer handheld xata xt1 2012 handheld
gh454f 1991 corona 112 400W heater corona 112 1991 heater
ty445g 1999 blizzard 200W trimmer blizzard - 1999 trimmer
er367c 2014 xata xt 2 juicer handheld xata xt2 2014 handheld
和粗略的描述
xata 手持式榨汁机
我希望输出如下:
description match1 match2
xata handheld juicer er367c er345c
我们需要采用粗略的描述并将其与指南相匹配。
我已经尽可能清理了数据
根据粗略描述中的内容,您或许可以简化以下内容:
1)先取粗略描述中的每个词
2)然后使用like函数,按行查看是否在引导列表中
3) 跟踪指南列表每行中匹配的单词数
4) select 匹配最高计数
我有一个 excel sheet,上面有一些电子产品的描述。例如:moto g 第一代 xt8001 等。
我有另一个产品数据集(指南列表),product_ID我想将产品从粗略描述与指南列表相匹配,并得出最适合我的描述的产品 ID。
感谢任何帮助。对 sas 真的很陌生
示例:
指南列表有
product_ID Product Description make model year variant
er345c 2012 xata xt 1 juicer handheld xata xt1 2012 handheld
gh454f 1991 corona 112 400W heater corona 112 1991 heater
ty445g 1999 blizzard 200W trimmer blizzard - 1999 trimmer
er367c 2014 xata xt 2 juicer handheld xata xt2 2014 handheld
和粗略的描述
xata 手持式榨汁机
我希望输出如下:
description match1 match2
xata handheld juicer er367c er345c
我们需要采用粗略的描述并将其与指南相匹配。 我已经尽可能清理了数据
根据粗略描述中的内容,您或许可以简化以下内容:
1)先取粗略描述中的每个词
2)然后使用like函数,按行查看是否在引导列表中
3) 跟踪指南列表每行中匹配的单词数
4) select 匹配最高计数