使用 readxl 将 excel 文件读入 R 时缺少数据框列
Missing data frame column reading excel file into R with readxl
我在使用 readxl
包中的 read_excel 函数将 xls 文件读入 R 时遇到了一些问题。数据框已生成,但至少缺少一列,我多次打印以下消息:
fread: wanted 1 got 0 loc=30208
这是我正在尝试的命令:
df <- read_excel(path = "Emery0114Aug16-1656_log2.xls",
sheet = 2, col_names = F, skip = 3)
电子表格的前两行(跳过前三行)如下所示:
8/13/2016 2:20 PM 0 753 738 881 1234
8/13/2016 2:30 PM 0 757 739 881 1245
读入R后数据框的前两行看起来像这样,似乎缺少最后一列。
X1 X2 X3 X4 X5
<time> <dbl> <dbl> <dbl> <dbl>
1 2016-08-13 14:19:59 0 753 738 881
2 2016-08-13 14:29:59 0 757 739 881
这是 xls 文件的 link。该文件是从水分记录器生成的,与软件生成的默认值没有变化。
https://drive.google.com/file/d/0BzGqPx_G2wnhUzk2eWpNYlBYdHM/view?usp=sharing
我是 运行 readxl 版本 0.1.1.9000,R 版本 3.2.4,和 Ubuntu 16.04.1
感谢所有帮助!
library(gdata)
mydata = read.xls("Emery0114Aug16-1656_log2.xls")
head(mydata)
Emery01 Port.1 Port.2 Port.3 Port.4 Port.5
1 159 records EC-5 Soil Moisture EC-5 Soil Moisture EC-5 Soil Moisture EC-5 Soil Moisture EC-5 Soil Moisture
2 Measurement Time m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC
3 8/13/2016 2:20 PM #N/A! 0.159 0.146 0.268 0.568
4 8/13/2016 2:30 PM #N/A! 0.162 0.147 0.268 0.577
5 8/13/2016 2:40 PM #N/A! 0.168 0.154 0.332 0.590
6 8/13/2016 2:50 PM #N/A! 0.171 0.156 0.353 0.596
这对我有用...
以下也是...
library(xlsx)
mydata <- read.xlsx("Emery0114Aug16-1656_log2.xls")
head(mydata)
Emery01 Port.1 Port.2 Port.3 Port.4 Port.5
1 159 records EC-5 Soil Moisture EC-5 Soil Moisture EC-5 Soil Moisture EC-5 Soil Moisture EC-5 Soil Moisture
2 Measurement Time m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC
3 8/13/2016 2:20 PM #N/A! 0.159 0.146 0.268 0.568
4 8/13/2016 2:30 PM #N/A! 0.162 0.147 0.268 0.577
5 8/13/2016 2:40 PM #N/A! 0.168 0.154 0.332 0.590
6 8/13/2016 2:50 PM #N/A! 0.171 0.156 0.353 0.596
我在使用 readxl
包中的 read_excel 函数将 xls 文件读入 R 时遇到了一些问题。数据框已生成,但至少缺少一列,我多次打印以下消息:
fread: wanted 1 got 0 loc=30208
这是我正在尝试的命令:
df <- read_excel(path = "Emery0114Aug16-1656_log2.xls",
sheet = 2, col_names = F, skip = 3)
电子表格的前两行(跳过前三行)如下所示:
8/13/2016 2:20 PM 0 753 738 881 1234
8/13/2016 2:30 PM 0 757 739 881 1245
读入R后数据框的前两行看起来像这样,似乎缺少最后一列。
X1 X2 X3 X4 X5
<time> <dbl> <dbl> <dbl> <dbl>
1 2016-08-13 14:19:59 0 753 738 881
2 2016-08-13 14:29:59 0 757 739 881
这是 xls 文件的 link。该文件是从水分记录器生成的,与软件生成的默认值没有变化。 https://drive.google.com/file/d/0BzGqPx_G2wnhUzk2eWpNYlBYdHM/view?usp=sharing
我是 运行 readxl 版本 0.1.1.9000,R 版本 3.2.4,和 Ubuntu 16.04.1
感谢所有帮助!
library(gdata)
mydata = read.xls("Emery0114Aug16-1656_log2.xls")
head(mydata)
Emery01 Port.1 Port.2 Port.3 Port.4 Port.5
1 159 records EC-5 Soil Moisture EC-5 Soil Moisture EC-5 Soil Moisture EC-5 Soil Moisture EC-5 Soil Moisture
2 Measurement Time m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC
3 8/13/2016 2:20 PM #N/A! 0.159 0.146 0.268 0.568
4 8/13/2016 2:30 PM #N/A! 0.162 0.147 0.268 0.577
5 8/13/2016 2:40 PM #N/A! 0.168 0.154 0.332 0.590
6 8/13/2016 2:50 PM #N/A! 0.171 0.156 0.353 0.596
这对我有用...
以下也是...
library(xlsx)
mydata <- read.xlsx("Emery0114Aug16-1656_log2.xls")
head(mydata)
Emery01 Port.1 Port.2 Port.3 Port.4 Port.5
1 159 records EC-5 Soil Moisture EC-5 Soil Moisture EC-5 Soil Moisture EC-5 Soil Moisture EC-5 Soil Moisture
2 Measurement Time m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC m\xb3/m\xb3 VWC
3 8/13/2016 2:20 PM #N/A! 0.159 0.146 0.268 0.568
4 8/13/2016 2:30 PM #N/A! 0.162 0.147 0.268 0.577
5 8/13/2016 2:40 PM #N/A! 0.168 0.154 0.332 0.590
6 8/13/2016 2:50 PM #N/A! 0.171 0.156 0.353 0.596