多分类变量和连续变量之间的相关性度量

correlation measures between multi categorical variables and continuous variables

我的数据集 targetenter image description here 有 6 种类型 (0,1,2,3,4,5,6) 。我是否需要将目标列虚拟成六列才能找到目标和输入之间的相关性?

您可以尝试一种热编码,如 here 并为 7 的每个类别创建一个虚拟变量。