在 geopandas 中重新排列多边形以进行 matplotlib 绘图
Rearranging polygons in geopandas for matplotlib plotting
我正在做一个项目,我正在使用形状文件制作美国的等值线图。为此,我从美国人口普查局下载了标准形状文件 here。经过一些清理(我通过更改绘图的轴限制删除了一些无关的岛屿领土),我能够让连续的状态整齐地适合 matplotlib 图的边界。 供参考,请参阅下面的编辑 4。
编辑 1: 我正在使用 cb_2018_us_state_500k.zip
[3.2 MB] 形状文件。
现在唯一的问题是,通过设置轴限制,我现在无法再看到阿拉斯加和夏威夷(因为这些显然通过限制轴限制被切断了)。我现在想将这两个多边形添加回我的地图中,但现在朝向绘图的下部(大多数其他此类地图给出的处理方式),尽管它的地理不准确。
更具体地说,我有兴趣选择代表阿拉斯加和夏威夷的多边形形状并将它们移动到我的图形的左下角。这是可能的吗?
我可以使用以下方法创建布尔掩码:
mask = df['STUSPS'] == 'AK'
自行获取该州的多边形;但是,我现在对如何移动 it/reposition 它被选中后有点卡住了。
编辑 2: 由于每个状态都由 geometry
dtype 表示,我可以只对多边形中的每个点应用转换吗?对于阿拉斯加,几何列显示:
27 MULTIPOLYGON (((179.48246 51.98283, 179.48656 ...
Name: geometry, dtype: geometry
可以说将此列表中的每个数字乘以相同的常数就可以做到这一点吗?
我想将阿拉斯加放在 (-125, 27)
地区附近的左下角,然后将夏威夷放在 (-112, 27)
附近。
编辑 3:
我的代码:
import geopandas as gpd
import matplotlib.pyplot as plt
# import the United States shape file
df = gpd.read_file('Desktop/cb_2018_us_state_500k/cb_2018_us_state_500k.shp')
# exclude the values that we would not like to display
exclude = df[~df['STUSPS'].isin(['PR', 'AS', 'VI', 'MP', 'GU','AK'])]
# create a plot figure
fig, ax = plt.subplots(1, figsize=(20, 10))
exclude.plot(column="NAME", ax=ax)
_ = ax.set_xlim([-130, -64])
_ = ax.set_ylim([22, 53])
我现在的示例图:
任何见解或指向资源、解释或示例的链接都将不胜感激。
注意:从技术上讲,我可以通过简单地使用一个形状文件来避免这个问题,这个文件已经在这个位置有阿拉斯加和夏威夷,比如内政部提供的那个;但是,如果我想说添加关岛或波多黎各,这将不起作用。
期望的结果:
编辑 4: 我想要做的是类似于 this question,但在 Python 而不是 R.
图片来源:Murphy
你可以这样做。您必须找到正确的偏移量才能将阿拉斯加准确定位在您想要的位置。
现在,您有以下数据框:
STATEFP STATENS AFFGEOID GEOID STUSPS NAME LSAD \
0 28 01779790 0400000US28 28 MS Mississippi 00
1 37 01027616 0400000US37 37 NC North Carolina 00
2 40 01102857 0400000US40 40 OK Oklahoma 00
ALAND AWATER \
0 121533519481 3926919758
1 125923656064 13466071395
2 177662925723 3374587997
geometry
0 MULTIPOLYGON (((-88.50297 30.21523, -88.49176 ...
1 MULTIPOLYGON (((-75.72681 35.93584, -75.71827 ...
2 POLYGON ((-103.00257 36.52659, -103.00219 36.6...
您可以像以前那样提取阿拉斯加,或类似的方法:
USA_ALS = USA[USA.STUSPS=='AK']
您可以从那里执行以下操作:
USA_ALS['geometry'] = USA_ALS.geometry.apply(lambda x: shapely.affinity.translate(x, xoff=0, yoff=-100))
沿 x 轴和 y 轴平移几何。
从原来的df中删除旧的Alska并与新的连接:
USA = USA[USA.STUSPS!='AK']
New_USA = pd.concat([USA,USA_ALS])
New_USA.geometry.plot()
这给出:
``
您可以简单地使用 ax.inset_axes()
实现最终目标,然后在插图上指定不同的经度/纬度范围。
这是一个简单的方法:
# import the United States shape file
df = gpd.read_file('cb_2018_us_state_500k/cb_2018_us_state_500k.shp')
# set state code as index, exclude states that we will never display
df = df.set_index('STUSPS').drop(index=['PR', 'VI', 'MP', 'GU', 'AS'])
# create an axis with 2 insets − this defines the inset sizes
fig, continental_ax = plt.subplots(figsize=(20, 10))
alaska_ax = continental_ax.inset_axes([.08, .01, .20, .28])
hawaii_ax = continental_ax.inset_axes([.28, .01, .15, .19])
# Set bounds to fit desired areas in each plot
continental_ax.set_xlim(-130, -64)
continental_ax.set_ylim(22, 53)
alaska_ax.set_ylim(51, 72)
alaska_ax.set_xlim(-180, -127)
hawaii_ax.set_ylim(18.8, 22.5)
hawaii_ax.set_xlim(-160, -154.6)
# Plot the data per area - requires passing the same choropleth parameters to each call
# because different data is used in each call, so automatically setting bounds won’t work
vmin, vmax = df['ALAND'].agg(['min', 'max'])
df.drop(index=['HI', 'AK']).plot(column="ALAND", ax=continental_ax, vmin=vmin, vmax=vmax)
df.loc[['AK']].plot(column="ALAND", ax=alaska_ax, vmin=vmin, vmax=vmax)
df.loc[['HI']].plot(column="ALAND", ax=hawaii_ax, vmin=vmin, vmax=vmax)
# remove ticks
for ax in [continental_ax, alaska_ax, hawaii_ax]:
ax.set_yticks([])
ax.set_xticks([])
这是结果,如您所见,颜色与每个州的土地面积成正比:
我正在做一个项目,我正在使用形状文件制作美国的等值线图。为此,我从美国人口普查局下载了标准形状文件 here。经过一些清理(我通过更改绘图的轴限制删除了一些无关的岛屿领土),我能够让连续的状态整齐地适合 matplotlib 图的边界。 供参考,请参阅下面的编辑 4。
编辑 1: 我正在使用 cb_2018_us_state_500k.zip [3.2 MB] 形状文件。
现在唯一的问题是,通过设置轴限制,我现在无法再看到阿拉斯加和夏威夷(因为这些显然通过限制轴限制被切断了)。我现在想将这两个多边形添加回我的地图中,但现在朝向绘图的下部(大多数其他此类地图给出的处理方式),尽管它的地理不准确。
更具体地说,我有兴趣选择代表阿拉斯加和夏威夷的多边形形状并将它们移动到我的图形的左下角。这是可能的吗?
我可以使用以下方法创建布尔掩码:
mask = df['STUSPS'] == 'AK'
自行获取该州的多边形;但是,我现在对如何移动 it/reposition 它被选中后有点卡住了。
编辑 2: 由于每个状态都由 geometry
dtype 表示,我可以只对多边形中的每个点应用转换吗?对于阿拉斯加,几何列显示:
27 MULTIPOLYGON (((179.48246 51.98283, 179.48656 ...
Name: geometry, dtype: geometry
可以说将此列表中的每个数字乘以相同的常数就可以做到这一点吗?
我想将阿拉斯加放在 (-125, 27)
地区附近的左下角,然后将夏威夷放在 (-112, 27)
附近。
编辑 3:
我的代码:
import geopandas as gpd
import matplotlib.pyplot as plt
# import the United States shape file
df = gpd.read_file('Desktop/cb_2018_us_state_500k/cb_2018_us_state_500k.shp')
# exclude the values that we would not like to display
exclude = df[~df['STUSPS'].isin(['PR', 'AS', 'VI', 'MP', 'GU','AK'])]
# create a plot figure
fig, ax = plt.subplots(1, figsize=(20, 10))
exclude.plot(column="NAME", ax=ax)
_ = ax.set_xlim([-130, -64])
_ = ax.set_ylim([22, 53])
我现在的示例图:
任何见解或指向资源、解释或示例的链接都将不胜感激。
注意:从技术上讲,我可以通过简单地使用一个形状文件来避免这个问题,这个文件已经在这个位置有阿拉斯加和夏威夷,比如内政部提供的那个;但是,如果我想说添加关岛或波多黎各,这将不起作用。
期望的结果:
编辑 4: 我想要做的是类似于 this question,但在 Python 而不是 R.
图片来源:Murphy
你可以这样做。您必须找到正确的偏移量才能将阿拉斯加准确定位在您想要的位置。
现在,您有以下数据框:
STATEFP STATENS AFFGEOID GEOID STUSPS NAME LSAD \
0 28 01779790 0400000US28 28 MS Mississippi 00
1 37 01027616 0400000US37 37 NC North Carolina 00
2 40 01102857 0400000US40 40 OK Oklahoma 00
ALAND AWATER \
0 121533519481 3926919758
1 125923656064 13466071395
2 177662925723 3374587997
geometry
0 MULTIPOLYGON (((-88.50297 30.21523, -88.49176 ...
1 MULTIPOLYGON (((-75.72681 35.93584, -75.71827 ...
2 POLYGON ((-103.00257 36.52659, -103.00219 36.6...
您可以像以前那样提取阿拉斯加,或类似的方法:
USA_ALS = USA[USA.STUSPS=='AK']
您可以从那里执行以下操作:
USA_ALS['geometry'] = USA_ALS.geometry.apply(lambda x: shapely.affinity.translate(x, xoff=0, yoff=-100))
沿 x 轴和 y 轴平移几何。
从原来的df中删除旧的Alska并与新的连接:
USA = USA[USA.STUSPS!='AK']
New_USA = pd.concat([USA,USA_ALS])
New_USA.geometry.plot()
这给出:
``
您可以简单地使用 ax.inset_axes()
实现最终目标,然后在插图上指定不同的经度/纬度范围。
这是一个简单的方法:
# import the United States shape file
df = gpd.read_file('cb_2018_us_state_500k/cb_2018_us_state_500k.shp')
# set state code as index, exclude states that we will never display
df = df.set_index('STUSPS').drop(index=['PR', 'VI', 'MP', 'GU', 'AS'])
# create an axis with 2 insets − this defines the inset sizes
fig, continental_ax = plt.subplots(figsize=(20, 10))
alaska_ax = continental_ax.inset_axes([.08, .01, .20, .28])
hawaii_ax = continental_ax.inset_axes([.28, .01, .15, .19])
# Set bounds to fit desired areas in each plot
continental_ax.set_xlim(-130, -64)
continental_ax.set_ylim(22, 53)
alaska_ax.set_ylim(51, 72)
alaska_ax.set_xlim(-180, -127)
hawaii_ax.set_ylim(18.8, 22.5)
hawaii_ax.set_xlim(-160, -154.6)
# Plot the data per area - requires passing the same choropleth parameters to each call
# because different data is used in each call, so automatically setting bounds won’t work
vmin, vmax = df['ALAND'].agg(['min', 'max'])
df.drop(index=['HI', 'AK']).plot(column="ALAND", ax=continental_ax, vmin=vmin, vmax=vmax)
df.loc[['AK']].plot(column="ALAND", ax=alaska_ax, vmin=vmin, vmax=vmax)
df.loc[['HI']].plot(column="ALAND", ax=hawaii_ax, vmin=vmin, vmax=vmax)
# remove ticks
for ax in [continental_ax, alaska_ax, hawaii_ax]:
ax.set_yticks([])
ax.set_xticks([])
这是结果,如您所见,颜色与每个州的土地面积成正比: