R - complete.cases 并非所有参数都具有相同的长度
R - complete.cases not all arguments have the same length
我对 R complete.cases() 函数有疑问。
我正在使用 Electric power consumption data,我想使用 complete.cases() 函数检查我的子集中是否有任何 NA。
我希望获得完整案例的数量,但我却收到一条错误消息,指出 "not all arguments have the same legnth"。
我只给complete.cases()一个参数,就是数据框。 df 中的所有列都具有相同的长度。当然,我可以使用 sum(is.na()) 函数检查每一列中的 NA,但我很好奇为什么 complete.cases() 不起作用。
此外,当我生成 3 列由随机数填充的数据框时,complete.cases() 起作用了。
这是我的代码,您可以重现错误:
### READING DATA
# reading full file
data <- read.table("household_power_consumption.txt", header=1, sep=";", na.strings="?")
# changing Date and Time columns to R classes
data$Time = strptime(paste(data$Date, data$Time),"%d/%m/%Y %H:%M:%OS")
data$Date = as.Date(data$Date, format="%d/%m/%Y")
# filtering to needed days
data = subset(data, Date == '2007-02-01' | Date == '2007-02-02')
# checking if there are any NAs in data
dim(data)
sum(complete.cases(data))
complete.cases 和处理日期存在一些问题,这里提到:
R apply error - error in as.matrix.data.frame()
您的数据框包含日期,因此它应该与日期相关。我检查过 na.omit 是否适用于您的数据集,因此您可以改用它。
我对 R complete.cases() 函数有疑问。
我正在使用 Electric power consumption data,我想使用 complete.cases() 函数检查我的子集中是否有任何 NA。
我希望获得完整案例的数量,但我却收到一条错误消息,指出 "not all arguments have the same legnth"。
我只给complete.cases()一个参数,就是数据框。 df 中的所有列都具有相同的长度。当然,我可以使用 sum(is.na()) 函数检查每一列中的 NA,但我很好奇为什么 complete.cases() 不起作用。
此外,当我生成 3 列由随机数填充的数据框时,complete.cases() 起作用了。
这是我的代码,您可以重现错误:
### READING DATA
# reading full file
data <- read.table("household_power_consumption.txt", header=1, sep=";", na.strings="?")
# changing Date and Time columns to R classes
data$Time = strptime(paste(data$Date, data$Time),"%d/%m/%Y %H:%M:%OS")
data$Date = as.Date(data$Date, format="%d/%m/%Y")
# filtering to needed days
data = subset(data, Date == '2007-02-01' | Date == '2007-02-02')
# checking if there are any NAs in data
dim(data)
sum(complete.cases(data))
complete.cases 和处理日期存在一些问题,这里提到:
R apply error - error in as.matrix.data.frame()
您的数据框包含日期,因此它应该与日期相关。我检查过 na.omit 是否适用于您的数据集,因此您可以改用它。