rxTextToXdf 将逗号读取为小数
rxTextToXdf to read commas as decimals
我有一个大文本文件,它使用逗号而不是句点来表示小数。
有没有办法让 RevolScaleR 包中的 rxTexttoXdf 函数将逗号视为句点?
我怀疑我会因为这个 post 而受到如此多的批评,因为它看起来真的很简单
编辑:
我目前使用的解决方法是将数字列导入为字符类型,然后去除逗号并将其替换为句点,然后转换为数字
library(dplyrXdf)
imported_data %>% #dataset with character types
mutate_if(is.character,
funs(gsub(",",".",.))) %>% #replace commas for period
mutate_if(is.character, as.numeric) %>% #convert character to numeric
persist(cleaned_file) # cleaned_file being a file path
感觉有更简洁的方法可以做到这一点
RxTextData
有一个 decimalPoint
论点就是为了这个目的。
假设您的文本文件是欧洲csv(列;
分隔,,
是小数点):
txt <- RxTextData("your/file.txt", decimalPoint=",", delimiter=";")
xdf <- rxDataStep(txt, "imported.xdf")
# do stuff with xdf
一般来说,使用数据源对象来引用文件而不是文件名是个好主意。您也可以对几乎所有内容使用 rxDataStep
。
我有一个大文本文件,它使用逗号而不是句点来表示小数。
有没有办法让 RevolScaleR 包中的 rxTexttoXdf 函数将逗号视为句点?
我怀疑我会因为这个 post 而受到如此多的批评,因为它看起来真的很简单
编辑:
我目前使用的解决方法是将数字列导入为字符类型,然后去除逗号并将其替换为句点,然后转换为数字
library(dplyrXdf)
imported_data %>% #dataset with character types
mutate_if(is.character,
funs(gsub(",",".",.))) %>% #replace commas for period
mutate_if(is.character, as.numeric) %>% #convert character to numeric
persist(cleaned_file) # cleaned_file being a file path
感觉有更简洁的方法可以做到这一点
RxTextData
有一个 decimalPoint
论点就是为了这个目的。
假设您的文本文件是欧洲csv(列;
分隔,,
是小数点):
txt <- RxTextData("your/file.txt", decimalPoint=",", delimiter=";")
xdf <- rxDataStep(txt, "imported.xdf")
# do stuff with xdf
一般来说,使用数据源对象来引用文件而不是文件名是个好主意。您也可以对几乎所有内容使用 rxDataStep
。