如何修改R中列中的单元格
How to modify the cells in a column in R
我正在处理来自 Kaggle 的数据集,这里是数据集的一些部分
所以我想删除 "Date" 列中的时间,这样只会显示“15-05-13”而不是“15-05-13 17:00”。我想知道如何编码?
我觉得应该是这样的:
train$Dates <- sub("15-05-13 17:00", "15-05-13", train$Dates)
但是这样的话,我会花很长时间,因为数据集很大...
我将“日期”列一分为二,使用“ ”作为分隔符
train <- data.frame(date = c("15-05-13 17:00", "15-05-13 16:00", "15-05-13 15:00"))
train
# date
# 1 15-05-13 17:00
# 2 15-05-13 16:00
# 3 15-05-13 15:00
train <- data.frame(date=c("15-05-13 17:00", "15-05-13 16:00", "15-05-13 15:00"))
within(train, date<-data.frame(do.call('rbind', strsplit(as.character(date), ' ', fixed=TRUE))))
train
# date.X1 date.X2
# 1 15-05-13 17:00
# 2 15-05-13 16:00
# 3 15-05-13 15:00
并删除了时间列
train$time <- NULL
现在如果你叫火车:
# date.X1
# 1 15-05-13
# 2 15-05-13
# 3 15-05-13
wendy,你只需要:
train$date <- format(as.Date(train$date,'%y-%m-%d'),'%y-%m-%d’)
> train
date
1 15-05-13
2 15-05-13
3 15-05-13
我正在处理来自 Kaggle 的数据集,这里是数据集的一些部分
所以我想删除 "Date" 列中的时间,这样只会显示“15-05-13”而不是“15-05-13 17:00”。我想知道如何编码?
我觉得应该是这样的:
train$Dates <- sub("15-05-13 17:00", "15-05-13", train$Dates)
但是这样的话,我会花很长时间,因为数据集很大...
我将“日期”列一分为二,使用“ ”作为分隔符
train <- data.frame(date = c("15-05-13 17:00", "15-05-13 16:00", "15-05-13 15:00"))
train
# date
# 1 15-05-13 17:00
# 2 15-05-13 16:00
# 3 15-05-13 15:00
train <- data.frame(date=c("15-05-13 17:00", "15-05-13 16:00", "15-05-13 15:00"))
within(train, date<-data.frame(do.call('rbind', strsplit(as.character(date), ' ', fixed=TRUE))))
train
# date.X1 date.X2
# 1 15-05-13 17:00
# 2 15-05-13 16:00
# 3 15-05-13 15:00
并删除了时间列
train$time <- NULL
现在如果你叫火车:
# date.X1
# 1 15-05-13
# 2 15-05-13
# 3 15-05-13
wendy,你只需要:
train$date <- format(as.Date(train$date,'%y-%m-%d'),'%y-%m-%d’)
> train
date
1 15-05-13
2 15-05-13
3 15-05-13