如何在 R 中读取 .MAP 文件扩展名?

How to read a .MAP file extension in R?

有没有一种简单的方法可以在 R 中读取 .MAP 扩展名的文件?我尝试了以下几个选项但没有成功。 Here is a .MAP file for a reproducible example.

context:出于某种奇怪的原因,巴西卫生规划政策中使用的空间区域化仅适用于这种格式。我想将它转换为 geopackage 以便我们可以将它添加到 geobr 包中。

# none of these options work
mp <- sf::st_read("./se_mapas_2013/se_regsaud.MAP")
mp <- rgdal::readGDAL("./se_mapas_2013/se_regsaud.MAP")
mp <- rgdal::readOGR("./se_mapas_2013/se_regsaud.MAP")
mp <- raster::raster("./se_mapas_2013/se_regsaud.MAP")
mp <- stars::read_stars("./se_mapas_2013/se_regsaud.MAP")

ps。 there is a similar question on SO focused on Python, unfortunately unanswered

更新

我们发现 a publication 使用自定义函数来读取 .MAP 文件。请参见下面的示例。但是,它 returns 一个 "polylist" 对象。有没有一种简单的方法可以将其转换为 simple feature?

原始自定义函数

read.map = function(filename){
  zz=file(filename,"rb")
  #
  # header of .map
  #
  versao = readBin(zz,"integer",1,size=2)  # 100 = versao 1.00
  #Bounding Box
  Leste = readBin(zz,"numeric",1,size=4)
  Norte = readBin(zz,"numeric",1,size=4)
  Oeste = readBin(zz,"numeric",1,size=4)
  Sul   = readBin(zz,"numeric",1,size=4)

  geocodigo = ""
  nome = ""
  xleg = 0
  yleg = 0
  sede = FALSE
  poli = list()
  i = 0

  #
  # repeat of each object in file
  #
  repeat{  
    tipoobj = readBin(zz,"integer",1,size=1) # 0=Poligono, 1=PoligonoComSede, 2=Linha, 3=Ponto

    if (length(tipoobj) == 0) break
    i = i + 1

    Len = readBin(zz,"integer",1,size=1)  # length byte da string Pascal
    geocodigo[i] = readChar(zz,10)
    Len = readBin(zz,"integer",1,size=1)  # length byte da string Pascal
    nome[i] = substr(readChar(zz,25),1,Len)
    xleg[i] = readBin(zz,"numeric",1,size=4)
    yleg[i] = readBin(zz,"numeric",1,size=4)
    numpontos = readBin(zz,"integer",1,size=2)

    sede = sede || (tipoobj = 1)

    x=0
    y=0   
    for (j in 1:numpontos){
      x[j] = readBin(zz,"numeric",1,size=4)
      y[j] = readBin(zz,"numeric",1,size=4)
    }


    # separate polygons
    xInic = x[1]
    yInic = y[1]  
    for (j in 2:numpontos){
      if (x[j] == xInic & y[j] == yInic) {x[j]=NA; y[j] = NA}
    }

    poli[[i]] = c(x,y)
    dim(poli[[i]]) = c(numpontos,2)
  }

  class(poli) = "polylist"
  attr(poli,"region.id") = geocodigo
  attr(poli,"region.name") = nome
  attr(poli,"centroid") = list(x=xleg,y=yleg)
  attr(poli,"sede") = sede
  attr(poli,"maplim") = list(x=c(Oeste,Leste),y=c(Sul,Norte))

  close(zz)
  return(poli)
}

使用原始自定义函数

mp <- read.map("./se_mapas_2013/se_regsaud.MAP")

class(mp)
>[1] "polylist"

# plot
plot(attributes(mp)$maplim, type='n', asp=1, xlab=NA, ylab=NA)
title('Map')
lapply(mp, polygon, asp=T, col=3)

编辑:看起来这通常不适用于所有文件,因此正确转换为 sf 需要更深入地了解。

这是复活的快速尝试。累积求和以获得多线串可能是不正确的,我用 se_municip.MAP 进行了测试,它只有 NA 作为每个环的结束行。如果它可能具有未连接的多环(多多边形),那么这种方法将无法完全发挥作用。

x <- read.map("se_municip.MAP")
df <- setNames(as.data.frame(do.call(rbind, x)), c("x", "y"))
df$region.name <- rep(attr(x, "region.name"), unlist(lapply(x, nrow)))
## in case there are multi-rings
df$linestring_id <- cumsum(c(0, diff(is.na(df$x)))) 
df$polygon_id <- as.integer(factor(df$region.name))
df <- df[!is.na(df$x), ]
sfx <- sfheaders::sf_polygon(df, x = "x", y = "y", linestring_id = "linestring_id", polygon_id = "polygon_id", keep = TRUE)
#sf::st_crs(sfx) <- sf::st_crs(<whatever it is probably 4326>)

plot(sf::st_geometry(sfx), reset = FALSE)
maps::map(add = TRUE)

有趣的是,您遇到了被遗忘的遗产的官方版本!

(顺便说一句,我可以打包发布数据集吗?)

问题是:使用带有尾随 nul 字节的 readChar - 更改为 readBin()rawToChar() 不接受的 8 位字符(在我的 UTF-8 系统上);一些需要删除的文件中有多个碎片;和其他一些人。我将上面编辑的 read.map() 函数添加到 maptools,但名称不同且未导出。所以现在(使用 maptools rev 370 从 https://r-forge.r-project.org/R/?group_id=943 构建完成时):

library(maptools)
o <- maptools:::readMAP2polylist("se_regsaud.MAP")
oo <- maptools:::.makePolylistValid(o)
ooo <- maptools:::.polylist2SpP(oo, tol=.Machine$double.eps^(1/4))
rn <- row.names(ooo)
df <- data.frame(ID=rn, row.names=rn, stringsAsFactors=FALSE)
res <- SpatialPolygonsDataFrame(ooo, data=df)
library(sf)
res_sf <- st_as_sf(res)
res_sf
plot(st_geometry(res_sf))

这种方法重新使用了近二十年前的 maptools 代码,并进行了少量编辑以处理读取二进制文件和修复条带的后续更改。