Read.table 与 read_csv:模型不同
Read.table vs. read_csv: model are divergent
我使用了 read.table(带参数 sep="\t", header = T, na.string = "NA")和 read_csv(带参数col_names = T, na = "NA") 从 reader 包中读入 csv 文件。当我估计一个模型时,尽管观察的数量相同,但摘要显示的结果却截然不同。现在我不知道这两个模型中的哪一个是基于正确导入的数据。我该如何调试它?
问题:如何在将数据读入 R 后调试意外结果。
回答:第一步,甚至在您 运行 陷入问题之前,应该是查看数据。您将开发自己的工作流程,但我的工作流程涉及在文本编辑器中查看它以查看我的假设是否成立。我可能会在文本编辑器中搜索某些值。然后我用 str(my_data)
、head(my_data)
、colSums(is.na(my_data))
、View(my_data)
在 R 中查看它,并根据它的结构,summary(my_data)
,或者整个数据框,或它的子集(取决于它有多少变量)。
我使用了 read.table(带参数 sep="\t", header = T, na.string = "NA")和 read_csv(带参数col_names = T, na = "NA") 从 reader 包中读入 csv 文件。当我估计一个模型时,尽管观察的数量相同,但摘要显示的结果却截然不同。现在我不知道这两个模型中的哪一个是基于正确导入的数据。我该如何调试它?
问题:如何在将数据读入 R 后调试意外结果。
回答:第一步,甚至在您 运行 陷入问题之前,应该是查看数据。您将开发自己的工作流程,但我的工作流程涉及在文本编辑器中查看它以查看我的假设是否成立。我可能会在文本编辑器中搜索某些值。然后我用 str(my_data)
、head(my_data)
、colSums(is.na(my_data))
、View(my_data)
在 R 中查看它,并根据它的结构,summary(my_data)
,或者整个数据框,或它的子集(取决于它有多少变量)。