混合类型数据类型的距离函数类型是什么?
What is the distance function type for mixed type data types?
亲爱的,
在聚类中,距离函数的选择我认为取决于数据的类型。如果我们有混合类型的数据类型,如 (continuous) 和 categorical(nominal and/or ordinal) scale 和 二进制标称变量?
在这种情况下,是否有针对特定距离函数类型的指南?
如果不是,我想二元名义变量的合适选择是什么?
谢谢,
正商
Kaufman 和 Rousseeuw 的书 "Finding Groups in Data" 涵盖了适用于不同类型数据的各种算法,并对如何处理混合变量类型给出了一些解释。它们包括有关二进制变量的信息。
https://onlinelibrary.wiley.com/doi/book/10.1002/9780470316801
亲爱的,
在聚类中,距离函数的选择我认为取决于数据的类型。如果我们有混合类型的数据类型,如 (continuous) 和 categorical(nominal and/or ordinal) scale 和 二进制标称变量? 在这种情况下,是否有针对特定距离函数类型的指南? 如果不是,我想二元名义变量的合适选择是什么?
谢谢, 正商
Kaufman 和 Rousseeuw 的书 "Finding Groups in Data" 涵盖了适用于不同类型数据的各种算法,并对如何处理混合变量类型给出了一些解释。它们包括有关二进制变量的信息。
https://onlinelibrary.wiley.com/doi/book/10.1002/9780470316801