将变量(具有许多接近最大值和最小值的数据点)转换为均匀分布?
Transforming a variable (with many data points close to the max and min) into uniform distribution?
我需要在 R 中制作一些模型,但我的一些预测器遇到了一些问题。它们分布在 0 和 1 之间,它们给出了土地覆盖类型的百分比。例如。 0.3 表示 30% 的面积被森林覆盖。
这是其中一个的直方图和密度图:
histogram
density plot
我想将这些预测变量转换为 R 中的均匀分布(不一定是完美的)。我不知道使用什么转换,因为有很多数据点接近它们的最大值和最小值。
感谢任何帮助,谢谢!
我不清楚您为什么需要这样做 - 大多数统计方法不要求预测变量的分布 - 但是
rank(x)/(length(x)+1)
将为您提供一个在 0 和 1 之间均匀分布的新变量(并且永远不会正好是 0 或 1)
我需要在 R 中制作一些模型,但我的一些预测器遇到了一些问题。它们分布在 0 和 1 之间,它们给出了土地覆盖类型的百分比。例如。 0.3 表示 30% 的面积被森林覆盖。
这是其中一个的直方图和密度图:
histogram density plot
我想将这些预测变量转换为 R 中的均匀分布(不一定是完美的)。我不知道使用什么转换,因为有很多数据点接近它们的最大值和最小值。
感谢任何帮助,谢谢!
我不清楚您为什么需要这样做 - 大多数统计方法不要求预测变量的分布 - 但是
rank(x)/(length(x)+1)
将为您提供一个在 0 和 1 之间均匀分布的新变量(并且永远不会正好是 0 或 1)