R Hmisc 描述函数失真值总结

R Hmisc describe function distorted value summary

在 Hmisc(版本 4.0-3)中使用 describe() 函数时,我一直在尝试解决一个问题。值摘要中的唯一值似乎已被更改或误解,因为它们与基础 R.table() 函数的结果不匹配。

library(Hmisc)

test <- data.frame(
        'j6033' = c(0, 0, 0, 0, 2053, 2098, 0, 2053, 2098, 2, 5, 0, 0, 0, 
                    5, 13, 13, 0, 2053, 2098)
        )

describe(test$j6033)
table(test$j6033)

我看到的结果是:

> describe(test$j6033)
test$j6033 
       n  missing distinct     Info     Mean      Gmd 
      20        0        6    0.902    624.5    920.6 

Value         0    5   15 2055 2100
Frequency    10    2    2    3    3
Proportion 0.50 0.10 0.10 0.15 0.15
> table(test$j6033)

   0    2    5   13 2053 2098 
   9    1    2    2    3    3 

2053的值被解释为2055,2的单个值被解释为0,2098被解释为2100,13被解释为15。有谁知道为什么这里有差异以及如何得到纠正?

注:Hmisc库调用加载的支持包版本如下:lattice(0.20-35),survival(2.41-3),Formula(1.2-2),ggplot2(2.2.1)。

在某些情况下,当有 <= 20 个不同的值时,函数会四舍五入这些值。如果有 <= 20 个值,我已修复代码以不执行此分箱。这将在下一个版本中。 Linux用户如有需要可提前获取新版本