将 .dat 文件处理为 Python 中具有不规则间距的数据帧
Process .dat file as dataframe in Python with irregular spacing
我有一个 .dat 文件,其中的值由 space 分隔。但是,space 是不规则的(一些列由一个 space 分隔,一些列由八个 space 分隔)并且一些列也有包含 space 的字符串。例如,前五行如下所示:
CURRENCY DATE = 04/19/20
LATITUDE LONGITUDE OBSTACLE AGL AMSL LT ACC MAR FAA ACTION
OAS# V CO ST CITY DEG MIN SEC DEG MIN SEC TYPE HT HT H V IND STUDY JDATE
-------------------------------------------------------------------------------------------------------------------------------
06-159571 U US CA IMPERIAL BEACH 32 31 54.66N 117 11 11.20W TOWER 1 00006 00007 N 4 D N 2016AWP08468OE A 2018027
如您所见,"IMPERIAL BEACH"是一个城市,应该算作一列,但是"CA"是一个州,与城市列只有一个space。有些城市也只有一个词,因此仅使用一个 space(“”)分隔符是行不通的。有什么方法可以将这个大数据集处理成 Python 中可用的数据框?
想办法!刚刚将 .dat 文件加载到 Microsoft Excel.
我有一个 .dat 文件,其中的值由 space 分隔。但是,space 是不规则的(一些列由一个 space 分隔,一些列由八个 space 分隔)并且一些列也有包含 space 的字符串。例如,前五行如下所示:
CURRENCY DATE = 04/19/20
LATITUDE LONGITUDE OBSTACLE AGL AMSL LT ACC MAR FAA ACTION
OAS# V CO ST CITY DEG MIN SEC DEG MIN SEC TYPE HT HT H V IND STUDY JDATE
-------------------------------------------------------------------------------------------------------------------------------
06-159571 U US CA IMPERIAL BEACH 32 31 54.66N 117 11 11.20W TOWER 1 00006 00007 N 4 D N 2016AWP08468OE A 2018027
如您所见,"IMPERIAL BEACH"是一个城市,应该算作一列,但是"CA"是一个州,与城市列只有一个space。有些城市也只有一个词,因此仅使用一个 space(“”)分隔符是行不通的。有什么方法可以将这个大数据集处理成 Python 中可用的数据框?
想办法!刚刚将 .dat 文件加载到 Microsoft Excel.