将 .dat 文件处理为 Python 中具有不规则间距的数据帧

Process .dat file as dataframe in Python with irregular spacing

我有一个 .dat 文件,其中的值由 space 分隔。但是,space 是不规则的(一些列由一个 space 分隔,一些列由八个 space 分隔)并且一些列也有包含 space 的字符串。例如,前五行如下所示:

  CURRENCY DATE = 04/19/20
                                     LATITUDE    LONGITUDE     OBSTACLE            AGL   AMSL LT ACC MAR FAA         ACTION
OAS#      V CO ST CITY            DEG MIN SEC   DEG MIN SEC   TYPE                 HT    HT     H V IND STUDY           JDATE
-------------------------------------------------------------------------------------------------------------------------------
06-159571 U US CA IMPERIAL BEACH   32 31 54.66N 117 11 11.20W TOWER              1 00006 00007 N 4 D N 2016AWP08468OE A 2018027

如您所见,"IMPERIAL BEACH"是一个城市,应该算作一列,但是"CA"是一个州,与城市列只有一个space。有些城市也只有一个词,因此仅使用一个 space(“”)分隔符是行不通的。有什么方法可以将这个大数据集处理成 Python 中可用的数据框?

想办法!刚刚将 .dat 文件加载到 Microsoft Excel.