在 R 中处理同一文件中的不同数字格式

dealing with different numeric formats within the same file in R

我正在使用依赖于用户输入的文件。当然这个输入是不一致的,我不确定处理这个问题的最好方法是什么?我正在处理数字,这些数字是我读入的字符:

mydata$output1
    [1] "PP150" NA "50,376.45\r\n" "40096.21" "43721.59" NA NA "27282272.16" NA  

"50,376.45\r\n" 实际上在预览中显示为一个简单的数字,我(以我有限的经验)从未见过任何类似的东西。我如何从中创建一个数值向量?

我想得到:

[1] "PP150" NA "50376.45" "40096.21" "43721.59" NA NA "27282272.16" NA

您可以使用 gsub 删除不需要的字符:

x <- c("PP150",NA, "50,376.45\r\n","40096.21","43721.59",NA,NA,"27282272.16", NA)

gsub('[,\r\n]', '', x)
#[1] "PP150"   NA  "50376.45" "40096.21" "43721.59"  NA  NA   "27282272.16" NA

最终输出仍然是一个字符串,因为“PP150”不是数字。