Python 更改维度和坐标 Xarray 数据集

Python Change Dimension and Coordinates Xarray Dataset

我有一个如下所示的 xarray 数据集。我需要能够按纬度和经度绘制“数据变量:si10、si10_u、平均”中的三个变量中的任何一个。但是,我不知道如何将维度从 index_id 更改为纬度和经度。或者,删除坐标中的“index_id”。我试过了,然后 'latitude' 和 'longitude' 从“坐标”中消失了。谢谢你的建议。

这是我的 xarray 数据集:

<xarray.Dataset>
Dimensions:    (index: 2448, index_id: 2448)
Coordinates:
  * index_id   (index_id) MultiIndex
  - latitude   (index_id) float64 58.0 58.0 58.0 58.0 ... 23.0 23.0 23.0 23.0
  - longitude  (index_id) float64 -130.0 -129.0 -128.0 ... -65.0 -64.0 -63.0
Dimensions without coordinates: index
Data variables:
    si10       (index) float32 1.7636629 1.899161 ... 5.9699616 5.9121003
    si10_u     (index) float32 1.6784391 1.7533684 ... 6.13361 6.139127
    avg        (index) float32 1.721051 1.8262646 ... 6.0517855 6.025614

你有两个问题。首先,您需要将 'index' 替换为 'index_id',以便您的数据得到一致的索引。其次,要取消堆叠 'index_id',您正在寻找 xr.Dataset.unstack:

ds = ds.unstack('index_id')

举个例子...这里有一个与您类似的数据集

In [16]: y = np.arange(58, 23, -1)
    ...: x = np.arange(-130, -63, 1)

In [17]: ds = xr.Dataset(
    ...:     data_vars={
    ...:         v: (("index",), np.random.random(len(x) * len(y)))
    ...:         for v in ["si10", "si10_u", "avg"]
    ...:     },
    ...:     coords={
    ...:         "index_id": pd.MultiIndex.from_product(
    ...:             [y, x], names=["latitude", "longitude"],
    ...:         ),
    ...:     },
    ...: )

In [18]: ds
Out[18]:
<xarray.Dataset>
Dimensions:    (index: 2345, index_id: 2345)
Coordinates:
  * index_id   (index_id) MultiIndex
  - latitude   (index_id) int64 58 58 58 58 58 58 58 58 ... 24 24 24 24 24 24 24
  - longitude  (index_id) int64 -130 -129 -128 -127 -126 ... -68 -67 -66 -65 -64
Dimensions without coordinates: index
Data variables:
    si10       (index) float64 0.9412 0.7395 0.6843 ... 0.03979 0.4259 0.09203
    si10_u     (index) float64 0.7359 0.1984 0.5919 ... 0.5535 0.2867 0.4093
    avg        (index) float64 0.04257 0.1442 0.008705 ... 0.1911 0.2669 0.1498

首先,重新组织您的数据以获得一致的暗淡:

In [19]: index_id = ds['index_id']
In [20]: ds = (
    ...:     ds.drop("index_id")
    ...:     .rename({"index": "index_id"})
    ...:     .assign_coords(index_id=index_id)
    ...: )

然后,ds.unstack将数据重组为MultiIndex中所有维度的组合乘积:

In [21]: ds.unstack("index_id")
Out[21]:
<xarray.Dataset>
Dimensions:    (latitude: 35, longitude: 67)
Coordinates:
  * latitude   (latitude) int64 24 25 26 27 28 29 30 31 ... 52 53 54 55 56 57 58
  * longitude  (longitude) int64 -130 -129 -128 -127 -126 ... -67 -66 -65 -64
Data variables:
    si10       (latitude, longitude) float64 0.9855 0.1467 ... 0.6569 0.9479
    si10_u     (latitude, longitude) float64 0.4672 0.2664 ... 0.4894 0.128
    avg        (latitude, longitude) float64 0.3738 0.01793 ... 0.1264 0.21