R Hmisc 描述函数失真值总结
R Hmisc describe function distorted value summary
在 Hmisc(版本 4.0-3)中使用 describe() 函数时,我一直在尝试解决一个问题。值摘要中的唯一值似乎已被更改或误解,因为它们与基础 R.table() 函数的结果不匹配。
library(Hmisc)
test <- data.frame(
'j6033' = c(0, 0, 0, 0, 2053, 2098, 0, 2053, 2098, 2, 5, 0, 0, 0,
5, 13, 13, 0, 2053, 2098)
)
describe(test$j6033)
table(test$j6033)
我看到的结果是:
> describe(test$j6033)
test$j6033
n missing distinct Info Mean Gmd
20 0 6 0.902 624.5 920.6
Value 0 5 15 2055 2100
Frequency 10 2 2 3 3
Proportion 0.50 0.10 0.10 0.15 0.15
> table(test$j6033)
0 2 5 13 2053 2098
9 1 2 2 3 3
2053的值被解释为2055,2的单个值被解释为0,2098被解释为2100,13被解释为15。有谁知道为什么这里有差异以及如何得到纠正?
注:Hmisc库调用加载的支持包版本如下:lattice(0.20-35),survival(2.41-3),Formula(1.2-2),ggplot2(2.2.1)。
在某些情况下,当有 <= 20 个不同的值时,函数会四舍五入这些值。如果有 <= 20 个值,我已修复代码以不执行此分箱。这将在下一个版本中。 Linux用户如有需要可提前获取新版本
在 Hmisc(版本 4.0-3)中使用 describe() 函数时,我一直在尝试解决一个问题。值摘要中的唯一值似乎已被更改或误解,因为它们与基础 R.table() 函数的结果不匹配。
library(Hmisc)
test <- data.frame(
'j6033' = c(0, 0, 0, 0, 2053, 2098, 0, 2053, 2098, 2, 5, 0, 0, 0,
5, 13, 13, 0, 2053, 2098)
)
describe(test$j6033)
table(test$j6033)
我看到的结果是:
> describe(test$j6033)
test$j6033
n missing distinct Info Mean Gmd
20 0 6 0.902 624.5 920.6
Value 0 5 15 2055 2100
Frequency 10 2 2 3 3
Proportion 0.50 0.10 0.10 0.15 0.15
> table(test$j6033)
0 2 5 13 2053 2098
9 1 2 2 3 3
2053的值被解释为2055,2的单个值被解释为0,2098被解释为2100,13被解释为15。有谁知道为什么这里有差异以及如何得到纠正?
注:Hmisc库调用加载的支持包版本如下:lattice(0.20-35),survival(2.41-3),Formula(1.2-2),ggplot2(2.2.1)。
在某些情况下,当有 <= 20 个不同的值时,函数会四舍五入这些值。如果有 <= 20 个值,我已修复代码以不执行此分箱。这将在下一个版本中。 Linux用户如有需要可提前获取新版本