相关矩阵离散连续变量R
Correlation matrix discrete continuous variables R
我有一个具有这些特征的数据集:Duration-connect、IP、Duration-LogIn。
Duration-connect 和 Duration-LogIn 是连续变量,但 IP 是一个包含计算机 IP 地址的符号变量。
我想为这些特征创建一个相关矩阵。但我不确定 cor() 是否会作为非连续变量与 IP 功能一起使用。
关于这个问题的任何想法。
谢谢
不行;试试看
> cor(iris)
Error in cor(iris) : 'x' must be numeric
您可以将您的 IP 地址转换为数字数据(例如,使用与因子水平关联的数值作为数值),但这样做的问题是计算 IP 的 (Pearsson) 相关性没有多大意义- 地址。例如。一组IP地址的意思是什么? (即它是一个没有距离度量的无序集。)
根据你想做什么,我会从相关计算中关闭 IP 地址(并且可能根据一些逻辑设置 IP 地址集的层次结构并比较这些)或将连续变量和看看这对 IP 地址意味着什么。同样,这取决于您的目标,但我认为这不仅仅是 R 机制的问题。
我有一个具有这些特征的数据集:Duration-connect、IP、Duration-LogIn。
Duration-connect 和 Duration-LogIn 是连续变量,但 IP 是一个包含计算机 IP 地址的符号变量。
我想为这些特征创建一个相关矩阵。但我不确定 cor() 是否会作为非连续变量与 IP 功能一起使用。
关于这个问题的任何想法。
谢谢
不行;试试看
> cor(iris)
Error in cor(iris) : 'x' must be numeric
您可以将您的 IP 地址转换为数字数据(例如,使用与因子水平关联的数值作为数值),但这样做的问题是计算 IP 的 (Pearsson) 相关性没有多大意义- 地址。例如。一组IP地址的意思是什么? (即它是一个没有距离度量的无序集。)
根据你想做什么,我会从相关计算中关闭 IP 地址(并且可能根据一些逻辑设置 IP 地址集的层次结构并比较这些)或将连续变量和看看这对 IP 地址意味着什么。同样,这取决于您的目标,但我认为这不仅仅是 R 机制的问题。