将 hdf 文件读入 R 并将它们转换为 geoTIFF 栅格
Reading hdf files into R and converting them to geoTIFF rasters
我正在尝试将 MODIS 17 数据文件读入 R,对其进行操作(裁剪等),然后将它们保存为 geoTIFF。数据文件采用 .hdf
格式,似乎没有一种简单的方法可以将它们读入 R。
与其他主题相比,那里没有很多建议,而且大部分都是几年前的了。其中一些还建议使用其他程序,但我想坚持只使用 R。
人们使用什么 package/s 来处理 R 中的 .hdf
文件?
好的,所以我的 MODIS hdf 文件是 hdf4 而不是 hdf5 格式。发现这一点出奇地困难,MODIS 没有在他们的网站上提及它,但在各种博客和堆栈交换帖子中有一些提示。最后我不得不下载 HDFView 来确定。
R 不处理 hdf4 文件,几乎所有的包(如 rgdal
)只支持 hdf5 文件。有一些关于从源代码下载驱动程序和编译 rgdal 的帖子,但它们看起来都相当复杂,而且这些帖子是针对 MAC 或 Unix 的,我正在使用 Windows.
基本上 gdalUtils
包中的 gdal_translate
是任何想在 R 中使用 hdf4 文件的人的救星。它将 hdf4 文件转换为 geoTIFF 而无需将它们读入 R。这意味着您根本无法操纵它们,例如通过裁剪它们,因此值得获得最小的图块(通过混响之类的 MODIS 数据)以最小化计算时间。
这是代码示例:
library(gdalUtils)
# Provides detailed data on hdf4 files but takes ages
gdalinfo("MOD17A3H.A2000001.h21v09.006.2015141183401.hdf")
# Tells me what subdatasets are within my hdf4 MODIS files and makes them into a list
sds <- get_subdatasets("MOD17A3H.A2000001.h21v09.006.2015141183401.hdf")
sds
[1] "HDF4_EOS:EOS_GRID:MOD17A3H.A2000001.h21v09.006.2015141183401.hdf:MOD_Grid_MOD17A3H:Npp_500m"
[2] "HDF4_EOS:EOS_GRID:MOD17A3H.A2000001.h21v09.006.2015141183401.hdf:MOD_Grid_MOD17A3H:Npp_QC_500m"
# I'm only interested in the first subdataset and I can use gdal_translate to convert it to a .tif
gdal_translate(sds[1], dst_dataset = "NPP2000.tif")
# Load and plot the new .tif
rast <- raster("NPP2000.tif")
plot(rast)
# If you have lots of files then you can make a loop to do all this for you
files <- dir(pattern = ".hdf")
files
[1] "MOD17A3H.A2000001.h21v09.006.2015141183401.hdf" "MOD17A3H.A2001001.h21v09.006.2015148124025.hdf"
[3] "MOD17A3H.A2002001.h21v09.006.2015153182349.hdf" "MOD17A3H.A2003001.h21v09.006.2015166203852.hdf"
[5] "MOD17A3H.A2004001.h21v09.006.2015099031743.hdf" "MOD17A3H.A2005001.h21v09.006.2015113012334.hdf"
[7] "MOD17A3H.A2006001.h21v09.006.2015125163852.hdf" "MOD17A3H.A2007001.h21v09.006.2015169164508.hdf"
[9] "MOD17A3H.A2008001.h21v09.006.2015186104744.hdf" "MOD17A3H.A2009001.h21v09.006.2015198113503.hdf"
[11] "MOD17A3H.A2010001.h21v09.006.2015216071137.hdf" "MOD17A3H.A2011001.h21v09.006.2015230092603.hdf"
[13] "MOD17A3H.A2012001.h21v09.006.2015254070417.hdf" "MOD17A3H.A2013001.h21v09.006.2015272075433.hdf"
[15] "MOD17A3H.A2014001.h21v09.006.2015295062210.hdf"
filename <- substr(files,11,14)
filename <- paste0("NPP", filename, ".tif")
filename
[1] "NPP2000.tif" "NPP2001.tif" "NPP2002.tif" "NPP2003.tif" "NPP2004.tif" "NPP2005.tif" "NPP2006.tif" "NPP2007.tif" "NPP2008.tif"
[10] "NPP2009.tif" "NPP2010.tif" "NPP2011.tif" "NPP2012.tif" "NPP2013.tif" "NPP2014.tif"
i <- 1
for (i in 1:15){
sds <- get_subdatasets(files[i])
gdal_translate(sds[1], dst_dataset = filename[i])
}
现在您可以使用光栅包中的 raster
将 .tif 文件读入 R 并正常工作。我已经将生成的文件与我使用 QGIS 手动转换的一些文件进行了检查,它们是匹配的,所以我相信代码正在做我认为的事情。感谢 Loïc Dutrieux 和 this 的帮助!
这个脚本非常有用,我用它成功地转换了一批 36 个文件。但是,我的问题是转换似乎不正确。当我使用 ArcGIS 'Make NetCDF Raster Layer tool' 执行此操作时,我得到了不同的结果 + 我能够使用简单的公式将数字从 Kelvin 转换为 C:RasterValue * 0.02 - 273.15。根据 R 转换的结果,转换后我没有得到正确的结果,这让我相信 ArcGIS 转换是好的,而 R 转换 returns 是一个错误。
library(gdalUtils)
library(raster)
setwd("D:/Data/Climate/MODIS")
# Get a list of sds names
sds <- get_subdatasets('MOD11C3.A2009001.006.2016006051904.hdf')
# Isolate the name of the first sds
name <- sds[1]
filename <- 'Rasterinr.tif'
gdal_translate(sds[1], dst_dataset = filename)
# Load the Geotiff created into R
r <- raster(filename)
# Identify files to read:
rlist=list.files(getwd(), pattern="hdf$", full.names=FALSE)
# Substract last 5 digits from MODIS filename for use in a new .img filename
substrRight <- function(x, n){
substr(x, nchar(x)-n+1, nchar(x))
}
filenames0 <- substrRight(rlist,9)
# Suffixes for MODIS files for identyfication:
filenamessuffix <- substr(filenames0,1,5)
listofnewnames <- c("2009.01.MODIS_","2009.02.MODIS_","2009.03.MODIS_","2009.04.MODIS_","2009.05.MODIS_",
"2009.06.MODIS_","2009.07.MODIS_","2009.08.MODIS_","2009.09.MODIS_","2009.10.MODIS_",
"2009.11.MODIS_","2009.12.MODIS_",
"2010.01.MODIS_","2010.02.MODIS_","2010.03.MODIS_","2010.04.MODIS_","2010.05.MODIS_",
"2010.06.MODIS_","2010.07.MODIS_","2010.08.MODIS_","2010.09.MODIS_","2010.10.MODIS_",
"2010.11.MODIS_","2010.12.MODIS_",
"2011.01.MODIS_","2011.02.MODIS_","2011.03.MODIS_","2011.04.MODIS_","2011.05.MODIS_",
"2011.06.MODIS_","2011.07.MODIS_","2011.08.MODIS_","2011.09.MODIS_","2011.10.MODIS_",
"2011.11.MODIS_","2011.12.MODIS_")
# Final new names for converted files:
newnames <- vector()
for (i in 1:length(listofnewnames)) {
newnames[i] <- paste0(listofnewnames[i],filenamessuffix[i],".img")
}
# Loop converting files to raster from NetCDF
for (i in 1:length(rlist)) {
sds <- get_subdatasets(rlist[i])
gdal_translate(sds[1], dst_dataset = newnames[i])
}
以下对我有用。这是一个简短的程序,只接受输入文件夹名称。确保您知道需要哪些子数据。我对子数据 1 感兴趣。
library(raster)
library(gdalUtils)
inpath <- "E:/aster200102/ast_200102"
setwd(inpath)
filenames <- list.files(,pattern=".hdf$",full.names = FALSE)
for (filename in filenames)
{
sds <- get_subdatasets(filename)
gdal_translate(sds[1], dst_dataset=paste0(substr(filename, 1, nchar(filename)-4) ,".tif"))
}
使用 NASA 提供的 HEG 工具包将您的 hdf 文件转换为 geotiff,然后使用任何包(例如 "raster")读取该文件。我对旧的和新的 hdf 文件都做同样的事情。
继承人link:https://newsroom.gsfc.nasa.gov/sdptoolkit/HEG/HEGHome.html
在此处查看支持的 NASA 产品:https://newsroom.gsfc.nasa.gov/sdptoolkit/HEG/HEGProductList.html
希望对您有所帮助。
现在您可以将 terra
软件包与 HDF 文件一起使用
要么获取子数据集
library(terra)
s <- sds("file.hdf")
s
可以像这样提取为SpatRasters
s[1]
或者像这样创建所有子数据集的 SpatRaster
r <- rast("file.hdf")
我正在尝试将 MODIS 17 数据文件读入 R,对其进行操作(裁剪等),然后将它们保存为 geoTIFF。数据文件采用 .hdf
格式,似乎没有一种简单的方法可以将它们读入 R。
与其他主题相比,那里没有很多建议,而且大部分都是几年前的了。其中一些还建议使用其他程序,但我想坚持只使用 R。
人们使用什么 package/s 来处理 R 中的 .hdf
文件?
好的,所以我的 MODIS hdf 文件是 hdf4 而不是 hdf5 格式。发现这一点出奇地困难,MODIS 没有在他们的网站上提及它,但在各种博客和堆栈交换帖子中有一些提示。最后我不得不下载 HDFView 来确定。
R 不处理 hdf4 文件,几乎所有的包(如 rgdal
)只支持 hdf5 文件。有一些关于从源代码下载驱动程序和编译 rgdal 的帖子,但它们看起来都相当复杂,而且这些帖子是针对 MAC 或 Unix 的,我正在使用 Windows.
基本上 gdalUtils
包中的 gdal_translate
是任何想在 R 中使用 hdf4 文件的人的救星。它将 hdf4 文件转换为 geoTIFF 而无需将它们读入 R。这意味着您根本无法操纵它们,例如通过裁剪它们,因此值得获得最小的图块(通过混响之类的 MODIS 数据)以最小化计算时间。
这是代码示例:
library(gdalUtils)
# Provides detailed data on hdf4 files but takes ages
gdalinfo("MOD17A3H.A2000001.h21v09.006.2015141183401.hdf")
# Tells me what subdatasets are within my hdf4 MODIS files and makes them into a list
sds <- get_subdatasets("MOD17A3H.A2000001.h21v09.006.2015141183401.hdf")
sds
[1] "HDF4_EOS:EOS_GRID:MOD17A3H.A2000001.h21v09.006.2015141183401.hdf:MOD_Grid_MOD17A3H:Npp_500m"
[2] "HDF4_EOS:EOS_GRID:MOD17A3H.A2000001.h21v09.006.2015141183401.hdf:MOD_Grid_MOD17A3H:Npp_QC_500m"
# I'm only interested in the first subdataset and I can use gdal_translate to convert it to a .tif
gdal_translate(sds[1], dst_dataset = "NPP2000.tif")
# Load and plot the new .tif
rast <- raster("NPP2000.tif")
plot(rast)
# If you have lots of files then you can make a loop to do all this for you
files <- dir(pattern = ".hdf")
files
[1] "MOD17A3H.A2000001.h21v09.006.2015141183401.hdf" "MOD17A3H.A2001001.h21v09.006.2015148124025.hdf"
[3] "MOD17A3H.A2002001.h21v09.006.2015153182349.hdf" "MOD17A3H.A2003001.h21v09.006.2015166203852.hdf"
[5] "MOD17A3H.A2004001.h21v09.006.2015099031743.hdf" "MOD17A3H.A2005001.h21v09.006.2015113012334.hdf"
[7] "MOD17A3H.A2006001.h21v09.006.2015125163852.hdf" "MOD17A3H.A2007001.h21v09.006.2015169164508.hdf"
[9] "MOD17A3H.A2008001.h21v09.006.2015186104744.hdf" "MOD17A3H.A2009001.h21v09.006.2015198113503.hdf"
[11] "MOD17A3H.A2010001.h21v09.006.2015216071137.hdf" "MOD17A3H.A2011001.h21v09.006.2015230092603.hdf"
[13] "MOD17A3H.A2012001.h21v09.006.2015254070417.hdf" "MOD17A3H.A2013001.h21v09.006.2015272075433.hdf"
[15] "MOD17A3H.A2014001.h21v09.006.2015295062210.hdf"
filename <- substr(files,11,14)
filename <- paste0("NPP", filename, ".tif")
filename
[1] "NPP2000.tif" "NPP2001.tif" "NPP2002.tif" "NPP2003.tif" "NPP2004.tif" "NPP2005.tif" "NPP2006.tif" "NPP2007.tif" "NPP2008.tif"
[10] "NPP2009.tif" "NPP2010.tif" "NPP2011.tif" "NPP2012.tif" "NPP2013.tif" "NPP2014.tif"
i <- 1
for (i in 1:15){
sds <- get_subdatasets(files[i])
gdal_translate(sds[1], dst_dataset = filename[i])
}
现在您可以使用光栅包中的 raster
将 .tif 文件读入 R 并正常工作。我已经将生成的文件与我使用 QGIS 手动转换的一些文件进行了检查,它们是匹配的,所以我相信代码正在做我认为的事情。感谢 Loïc Dutrieux 和 this 的帮助!
这个脚本非常有用,我用它成功地转换了一批 36 个文件。但是,我的问题是转换似乎不正确。当我使用 ArcGIS 'Make NetCDF Raster Layer tool' 执行此操作时,我得到了不同的结果 + 我能够使用简单的公式将数字从 Kelvin 转换为 C:RasterValue * 0.02 - 273.15。根据 R 转换的结果,转换后我没有得到正确的结果,这让我相信 ArcGIS 转换是好的,而 R 转换 returns 是一个错误。
library(gdalUtils)
library(raster)
setwd("D:/Data/Climate/MODIS")
# Get a list of sds names
sds <- get_subdatasets('MOD11C3.A2009001.006.2016006051904.hdf')
# Isolate the name of the first sds
name <- sds[1]
filename <- 'Rasterinr.tif'
gdal_translate(sds[1], dst_dataset = filename)
# Load the Geotiff created into R
r <- raster(filename)
# Identify files to read:
rlist=list.files(getwd(), pattern="hdf$", full.names=FALSE)
# Substract last 5 digits from MODIS filename for use in a new .img filename
substrRight <- function(x, n){
substr(x, nchar(x)-n+1, nchar(x))
}
filenames0 <- substrRight(rlist,9)
# Suffixes for MODIS files for identyfication:
filenamessuffix <- substr(filenames0,1,5)
listofnewnames <- c("2009.01.MODIS_","2009.02.MODIS_","2009.03.MODIS_","2009.04.MODIS_","2009.05.MODIS_",
"2009.06.MODIS_","2009.07.MODIS_","2009.08.MODIS_","2009.09.MODIS_","2009.10.MODIS_",
"2009.11.MODIS_","2009.12.MODIS_",
"2010.01.MODIS_","2010.02.MODIS_","2010.03.MODIS_","2010.04.MODIS_","2010.05.MODIS_",
"2010.06.MODIS_","2010.07.MODIS_","2010.08.MODIS_","2010.09.MODIS_","2010.10.MODIS_",
"2010.11.MODIS_","2010.12.MODIS_",
"2011.01.MODIS_","2011.02.MODIS_","2011.03.MODIS_","2011.04.MODIS_","2011.05.MODIS_",
"2011.06.MODIS_","2011.07.MODIS_","2011.08.MODIS_","2011.09.MODIS_","2011.10.MODIS_",
"2011.11.MODIS_","2011.12.MODIS_")
# Final new names for converted files:
newnames <- vector()
for (i in 1:length(listofnewnames)) {
newnames[i] <- paste0(listofnewnames[i],filenamessuffix[i],".img")
}
# Loop converting files to raster from NetCDF
for (i in 1:length(rlist)) {
sds <- get_subdatasets(rlist[i])
gdal_translate(sds[1], dst_dataset = newnames[i])
}
以下对我有用。这是一个简短的程序,只接受输入文件夹名称。确保您知道需要哪些子数据。我对子数据 1 感兴趣。
library(raster)
library(gdalUtils)
inpath <- "E:/aster200102/ast_200102"
setwd(inpath)
filenames <- list.files(,pattern=".hdf$",full.names = FALSE)
for (filename in filenames)
{
sds <- get_subdatasets(filename)
gdal_translate(sds[1], dst_dataset=paste0(substr(filename, 1, nchar(filename)-4) ,".tif"))
}
使用 NASA 提供的 HEG 工具包将您的 hdf 文件转换为 geotiff,然后使用任何包(例如 "raster")读取该文件。我对旧的和新的 hdf 文件都做同样的事情。
继承人link:https://newsroom.gsfc.nasa.gov/sdptoolkit/HEG/HEGHome.html
在此处查看支持的 NASA 产品:https://newsroom.gsfc.nasa.gov/sdptoolkit/HEG/HEGProductList.html
希望对您有所帮助。
现在您可以将 terra
软件包与 HDF 文件一起使用
要么获取子数据集
library(terra)
s <- sds("file.hdf")
s
可以像这样提取为SpatRasters
s[1]
或者像这样创建所有子数据集的 SpatRaster
r <- rast("file.hdf")