R 可视化:地图上的合理排斥点(蜂群?)

R visualization: sensible repel points on map (beeswarm?)

我正在尝试大致复制这样的地图。

它描绘了分布在一个区域中的少量项目(学校)。对于输入,我有区域地图,每个区域都有一个数字。我想把它布置成该地区周围的许多点。如果它们不扩散到区域边界就更好了,但简单地分布它们就足够了。区域内一些不错的排斥点可能会起作用。

蜜蜂地块做的事情非常相似,这可以在地图上完成吗?奖金问题 - 事实上,我一直在寻找动画,但只能想到非常复杂的方法来做到这一点,以便随着总和 nrs 的增加而添加新点。

下面的代码将点放在地图的质心上,并将数字作为大小。 (我无法将地图正确导出为单个文件,所以坐标有点乱,但原理是一样的。)

places = st_read("https://gist.githubusercontent.com/peeter-t2/9646a4169e993948fa97f6f503a0688b/raw/cb4e910bf153e51e3727dc9d1c73dd9ef86d2556/kih1897m.geojson", stringsAsFactors = FALSE)

schools <- read_tsv("https://gist.github.com/peeter-t2/34467636b3c1017e89f33284d7907b42/raw/6ea7dd6c005ef8577b36f5e84338afcb6c76b707/school_nums.tsv")
schools_geo <- merge(places,schools,by.x="KIHELKOND",by.y="Kihelkond") #94 matches

p<- schools_geo %>% 
  ggplot()+
  geom_sf(data=schools_geo)+
  geom_sf(data=st_centroid(schools_geo),aes(size=value))+
  theme_bw()
p

谢谢!

这不是一个简单的问题。我决定简化它,只选择一个区域而不是全部。理论上,该解决方案对于您的所有领域都是可复制的。

我们首先导入我们的库

library(rgdal)
library(sf)
library(readr)
library(ggplot2)

我们使用建议的数据:

places <- st_read("https://gist.githubusercontent.com/peeter-t2/9646a4169e993948fa97f6f503a0688b/raw/cb4e910bf153e51e3727dc9d1c73dd9ef86d2556/kih1897m.geojson", stringsAsFactors = FALSE)

schools <- read_tsv("https://gist.github.com/peeter-t2/34467636b3c1017e89f33284d7907b42/raw/6ea7dd6c005ef8577b36f5e84338afcb6c76b707/school_nums.tsv")
schools_geo <- merge(places,schools,by.x="KIHELKOND",by.y="Kihelkond") #94 matches

我们select一个州

one <- places$geometry[[1]]

多亏了网格,我们将多边形拆分为几个子多边形

grid <- st_make_grid(one, n = c(10, 10))
area <- st_area(grid)
grid <- st_as_sf(data.frame(ID=c(1:length(area)),
                            area=area,
                            geometry=grid))
tmp <- st_intersection(grid, one)
tmp$area <- st_area(tmp)

我们显示由小方块构成的网格的所有质心

plot(st_geometry(tmp['area']))
plot(st_geometry(st_centroid(tmp['area'])),
     pch = 16, col = 'red', add = TRUE)

最后我们只想保留您想要的点数,这与您的示例中的值(学校数量)相当。

nbr <- 20
plot(st_geometry(one))
plot(st_geometry(st_centroid(tmp[order(tmp$area, decreasing = T),][1:nbr,])),
     pch = 16, col = 'red', add = TRUE)

希望对您有所帮助。

正如我在评论中指出的那样,当我读入文件时,它将 crs 设置为 lat/lon (epsg: 4326) 而几何列是不同的 crs。我猜到正确的 crsespg: 3301 并在此基础上继续进行,这似乎工作正常。

st_crs(schools_geo) <- 3301

我们可以使用 st_sample 获取多边形内与我们的 'value' 列相关的点样本:

# we can set type = 'hexagonal', 'regular' or 'random'
school_pts <- schools_geo %>% st_sample(size = .$value, type = 'hexagonal')


schools_geo %>% 
  ggplot()+
  geom_sf()+
  geom_sf(data=school_pts, size = .8)+
  theme_bw()

这会产生下面的图,我认为它看起来很乱,因为 st_sample 将点散布到多边形的范围内。

像您发布的示例中那样,让每个多边形的点更居中看起来会更好。为此,我们可以根据要在其中绘制的点数重新缩放多边形。在下面的代码中,如果多边形在 (1) 内的点数最少,我将多边形缩小 90%;如果多边形内的点数最多 (27),我将多边形缩小 20%。

# put values on scale between 0 and 1
scale_fact <- (max(schools_geo$value) -  schools_geo$value) / (max(schools_geo$value) - min(schools_geo$value)) 
# re-scale between 0.2 and 0.9
scale_fact <- scale_fact * (0.9 - 0.2) + 0.2
# reverse the scale 
scale_fact <-  max(scale_fact) + min(scale_fact) - scale_fact 

# apply the scale factor
schools_centroid <- st_geometry(st_centroid(schools_geo))
schools_geo_rescaled <- (st_geometry(schools_geo) - schools_centroid) * scale_fact + schools_centroid

school_pts <- schools_geo_rescaled %>% 
  st_sf(crs = 3301) %>% 
  bind_cols(value = schools_geo$value) %>%
  st_sample(size = .$value, type = 'hexagonal')


# plot
schools_geo %>% 
  ggplot()+
  geom_sf()+
  geom_sf(data=school_pts, size = .8)+
  theme_bw()