如何在 pandas 或 GeoPandas 中过滤具有无效几何的 WKT 字符串
How to filter WKT strings with invalid geometries in pandas or GeoPandas
我正在尝试将 Excel 文件转换为 GeoPandas 数据框。我正在尝试使用 Shapely 和 WKT 来这样做。
将文件读入 pandas 后,我有一个几何列。我正在尝试执行以下操作以将几何列转换为 'object' 数据类型:
from shapely import wkt
my_df['geometry'] = my_df['geometry'].apply(wkt.loads)
我收到以下错误:
WKTReadingError: Could not create geometry because of errors while reading input.
为了尝试诊断问题所在,我还尝试使用以下代码将此 Excel 文件转换为地理数据框:
import geopandas
my_df = gpd.GeoDataFrame(my_df, geometry='geometry')
我收到以下错误:
TypeError: Input must be valid geometry objects: MULTIPOLYGON (((1314112.145833299 1027703.927083313, 1314091.947916642 1027761.937499985, 1314232.583333299 1027811.447916642, 1314240.99999997 1027814.395833313, 1314246.739583299 1027794.468749985, 1314292.71874997 1027692.947916642, 1314282.18749997 1027689.010416642, 1314136.364583299 1027634.374999985, 1314112.145833299 1027703.927083313)))
看来我只有一个不好的几何图形? (或者它可能只是第一个糟糕的几何图形)。
我可以在 wkt.loads
步骤中跳过这个不好的吗?我找不到有关如何执行此操作的文档或其他示例。
试试这个简单的代码来只绘制有效的几何图形:
my_df[ my_df.geometry.is_valid ].plot(ec='black', alpha=0.3)
要在新地理数据框中仅获取有效几何图形:
valid_gdf = my_df[ my_df.geometry.is_valid ]
您可以执行循环而不是应用 try/except 来捕获错误的几何图形。
from shapely import wkt
geom = []
for g in my_df['geometry']:
try:
geom.append(wkt.loads(g))
except:
geom.append(None)
my_df['geometry'] = geom
我正在尝试将 Excel 文件转换为 GeoPandas 数据框。我正在尝试使用 Shapely 和 WKT 来这样做。
将文件读入 pandas 后,我有一个几何列。我正在尝试执行以下操作以将几何列转换为 'object' 数据类型:
from shapely import wkt
my_df['geometry'] = my_df['geometry'].apply(wkt.loads)
我收到以下错误:
WKTReadingError: Could not create geometry because of errors while reading input.
为了尝试诊断问题所在,我还尝试使用以下代码将此 Excel 文件转换为地理数据框:
import geopandas
my_df = gpd.GeoDataFrame(my_df, geometry='geometry')
我收到以下错误:
TypeError: Input must be valid geometry objects: MULTIPOLYGON (((1314112.145833299 1027703.927083313, 1314091.947916642 1027761.937499985, 1314232.583333299 1027811.447916642, 1314240.99999997 1027814.395833313, 1314246.739583299 1027794.468749985, 1314292.71874997 1027692.947916642, 1314282.18749997 1027689.010416642, 1314136.364583299 1027634.374999985, 1314112.145833299 1027703.927083313)))
看来我只有一个不好的几何图形? (或者它可能只是第一个糟糕的几何图形)。
我可以在 wkt.loads
步骤中跳过这个不好的吗?我找不到有关如何执行此操作的文档或其他示例。
试试这个简单的代码来只绘制有效的几何图形:
my_df[ my_df.geometry.is_valid ].plot(ec='black', alpha=0.3)
要在新地理数据框中仅获取有效几何图形:
valid_gdf = my_df[ my_df.geometry.is_valid ]
您可以执行循环而不是应用 try/except 来捕获错误的几何图形。
from shapely import wkt
geom = []
for g in my_df['geometry']:
try:
geom.append(wkt.loads(g))
except:
geom.append(None)
my_df['geometry'] = geom