将数据框列 header 和值拆分为多列

split dataframe column header and values into multiple columns

我已经在 Azure 上上传了我的 csv 文件,但由于某种原因它变成了这样

 nominal;data;curs;cdx         Column 1
0          1;21.06.2000;28  2300;������ ���
1          1;22.06.2000;28  2200;������ ���
2          1;23.06.2000;28  1900;������ ���
3          1;24.06.2000;28  1700;������ ���
4          1;27.06.2000;28  1300;������ ���
5          1;28.06.2000;28  1100;������ ���

基本上不是四列 nominaldatacurscdx 我有两列,其中一列包含所有值,最后一列(它是空的或其他东西,因为最后一列有编码问题)- 不知道是什么。

我已经删除了这样的列Column 1

import pandas as pd

def azureml_main(dataframe1 = None, dataframe2 = None):
    dataframe1.drop(['Column 1'], axis = 1, inplace = True)
    print('Input pandas.DataFrame #1:\r\n\r\n{0}'.format(dataframe1))
    return dataframe1,

现在如何将第一列拆分成多个?获得 4 个单独的列

我正在使用 pandas 0.18

您需要拆分列:

dataframe1['nominal;data;curs;cdx'].str.split(';',expand=True)

然后将 headers 更改为:

dataframe1.columns = 'nominal;data;curs;cdx'.split(';')