在 R 中处理同一文件中的不同数字格式
dealing with different numeric formats within the same file in R
我正在使用依赖于用户输入的文件。当然这个输入是不一致的,我不确定处理这个问题的最好方法是什么?我正在处理数字,这些数字是我读入的字符:
mydata$output1
[1] "PP150" NA "50,376.45\r\n" "40096.21" "43721.59" NA NA "27282272.16" NA
"50,376.45\r\n"
实际上在预览中显示为一个简单的数字,我(以我有限的经验)从未见过任何类似的东西。我如何从中创建一个数值向量?
我想得到:
[1] "PP150" NA "50376.45" "40096.21" "43721.59" NA NA "27282272.16" NA
您可以使用 gsub
删除不需要的字符:
x <- c("PP150",NA, "50,376.45\r\n","40096.21","43721.59",NA,NA,"27282272.16", NA)
gsub('[,\r\n]', '', x)
#[1] "PP150" NA "50376.45" "40096.21" "43721.59" NA NA "27282272.16" NA
最终输出仍然是一个字符串,因为“PP150”不是数字。
我正在使用依赖于用户输入的文件。当然这个输入是不一致的,我不确定处理这个问题的最好方法是什么?我正在处理数字,这些数字是我读入的字符:
mydata$output1
[1] "PP150" NA "50,376.45\r\n" "40096.21" "43721.59" NA NA "27282272.16" NA
"50,376.45\r\n"
实际上在预览中显示为一个简单的数字,我(以我有限的经验)从未见过任何类似的东西。我如何从中创建一个数值向量?
我想得到:
[1] "PP150" NA "50376.45" "40096.21" "43721.59" NA NA "27282272.16" NA
您可以使用 gsub
删除不需要的字符:
x <- c("PP150",NA, "50,376.45\r\n","40096.21","43721.59",NA,NA,"27282272.16", NA)
gsub('[,\r\n]', '', x)
#[1] "PP150" NA "50376.45" "40096.21" "43721.59" NA NA "27282272.16" NA
最终输出仍然是一个字符串,因为“PP150”不是数字。