python 从 netCDF 中提取数据
Extracting data from netCDF by python
我是 Python 的新手,也是 NetCDF 的新手,如果我不清楚,请见谅。
我有一个包含多个变量的 nc 文件,我需要以新的顺序从这些 nc 文件中提取数据。
我的 nc 文件有 8 个变量(经度、纬度、时间、u10、v10、swh、mwd、mwp),我尝试的逻辑是 "If I input longitude and latitude, my program outputs other variables (u10, v10, swh, mwd, mwp) ordered by time." 然后我将提取的数据放在另一个数据库。
我测试了我的 nc 文件如下:
import netCDF4
from netCDF4 import Dataset
jan = Dataset('2016_01.nc')
print jan.variables.keys()
lon = jan.variables['longitude']
lat = jan.variables['latitude']
time = jan.variables['time']
for d in jan.dimensions.items():
print d
lon_array = lon[:]
lat_array = lat[:]
time_array = time[:]
print lon_array
print lat_array
print time_array
部分结果如下
[u'longitude', u'latitude', u'time', u'u10', u'v10', u'swh', u'mwd', u'mwp']
(u'longitude', <type 'netCDF4._netCDF4.Dimension'>: name = 'longitude', size = 1440)
(u'latitude', <type 'netCDF4._netCDF4.Dimension'>: name = 'latitude', size = 721)
(u'time', <type 'netCDF4._netCDF4.Dimension'> (unlimited): name = 'time', size = 186)
如有任何建议,我们将不胜感激。
谢谢。
您首先需要知道 time/space 变量中维度的顺序,例如u10
,您可以通过以下方式获得:
u10 = jan.variables['u10']
print(u10.dimensions)
接下来是 slicing/indexing 数组是否正确的问题。如果你想要 latitude=30
、longitude = 10
的数据,可以使用(将 Numpy 导入为 import numpy as np
后)找到相应的(最接近的)索引:
i = np.abs(lon_array - 10).argmin()
j = np.abs(lat_array - 30).argmin()
假设u10
的维度排序为{time, lat, lon}
,可以读取数据为:
u10_time = u10[:,j,i]
这会为您提供所请求位置的所有(时变)u10
值。
嗨,我在来自 WRF 的文件 netCDF 上使用了这个。
import numpy as np
from netCDF4 import Dataset # http://code.google.com/p/netcdf4-python/
import pandas as pd
import os
os.chdir('.../netcdf') # Select your dir
f = Dataset('wrfout_d01_2007-01-01_10_00_00', 'r') #Charge your file
latbounds = [ 4.691417 ]# Latitud
lonbounds = [ -74.209 ]# Longitud
cor_lat = pd.DataFrame(f.variables['XLAT'][0][:])
cor_lat2 = pd.DataFrame({'a':cor_lat.iloc[:,0], 'b':abs(cor_lat.iloc[:,0] - latbounds)})
a = cor_lat2[cor_lat2.b == min(cor_lat2.b)].index.get_values()[0]
cor_lon = pd.DataFrame(f.variables['XLONG'][0][:])
cor_lon2 = pd.DataFrame({'a':cor_lon.iloc[0,:], 'b':abs(cor_lon.iloc[0,:] - lonbounds)})
b = cor_lon2[cor_lon2.b == min(cor_lon2.b)].index.get_values()[0]
vlr = (f.variables['T2'][ : , a , b ] - 273.15)[0] #This change from kelvin to celsius
vlr
我是 Python 的新手,也是 NetCDF 的新手,如果我不清楚,请见谅。 我有一个包含多个变量的 nc 文件,我需要以新的顺序从这些 nc 文件中提取数据。
我的 nc 文件有 8 个变量(经度、纬度、时间、u10、v10、swh、mwd、mwp),我尝试的逻辑是 "If I input longitude and latitude, my program outputs other variables (u10, v10, swh, mwd, mwp) ordered by time." 然后我将提取的数据放在另一个数据库。
我测试了我的 nc 文件如下:
import netCDF4
from netCDF4 import Dataset
jan = Dataset('2016_01.nc')
print jan.variables.keys()
lon = jan.variables['longitude']
lat = jan.variables['latitude']
time = jan.variables['time']
for d in jan.dimensions.items():
print d
lon_array = lon[:]
lat_array = lat[:]
time_array = time[:]
print lon_array
print lat_array
print time_array
部分结果如下
[u'longitude', u'latitude', u'time', u'u10', u'v10', u'swh', u'mwd', u'mwp']
(u'longitude', <type 'netCDF4._netCDF4.Dimension'>: name = 'longitude', size = 1440)
(u'latitude', <type 'netCDF4._netCDF4.Dimension'>: name = 'latitude', size = 721)
(u'time', <type 'netCDF4._netCDF4.Dimension'> (unlimited): name = 'time', size = 186)
如有任何建议,我们将不胜感激。 谢谢。
您首先需要知道 time/space 变量中维度的顺序,例如u10
,您可以通过以下方式获得:
u10 = jan.variables['u10']
print(u10.dimensions)
接下来是 slicing/indexing 数组是否正确的问题。如果你想要 latitude=30
、longitude = 10
的数据,可以使用(将 Numpy 导入为 import numpy as np
后)找到相应的(最接近的)索引:
i = np.abs(lon_array - 10).argmin()
j = np.abs(lat_array - 30).argmin()
假设u10
的维度排序为{time, lat, lon}
,可以读取数据为:
u10_time = u10[:,j,i]
这会为您提供所请求位置的所有(时变)u10
值。
嗨,我在来自 WRF 的文件 netCDF 上使用了这个。
import numpy as np
from netCDF4 import Dataset # http://code.google.com/p/netcdf4-python/
import pandas as pd
import os
os.chdir('.../netcdf') # Select your dir
f = Dataset('wrfout_d01_2007-01-01_10_00_00', 'r') #Charge your file
latbounds = [ 4.691417 ]# Latitud
lonbounds = [ -74.209 ]# Longitud
cor_lat = pd.DataFrame(f.variables['XLAT'][0][:])
cor_lat2 = pd.DataFrame({'a':cor_lat.iloc[:,0], 'b':abs(cor_lat.iloc[:,0] - latbounds)})
a = cor_lat2[cor_lat2.b == min(cor_lat2.b)].index.get_values()[0]
cor_lon = pd.DataFrame(f.variables['XLONG'][0][:])
cor_lon2 = pd.DataFrame({'a':cor_lon.iloc[0,:], 'b':abs(cor_lon.iloc[0,:] - lonbounds)})
b = cor_lon2[cor_lon2.b == min(cor_lon2.b)].index.get_values()[0]
vlr = (f.variables['T2'][ : , a , b ] - 273.15)[0] #This change from kelvin to celsius
vlr