将数据框列 header 和值拆分为多列
split dataframe column header and values into multiple columns
我已经在 Azure 上上传了我的 csv
文件,但由于某种原因它变成了这样
nominal;data;curs;cdx Column 1
0 1;21.06.2000;28 2300;������ ���
1 1;22.06.2000;28 2200;������ ���
2 1;23.06.2000;28 1900;������ ���
3 1;24.06.2000;28 1700;������ ���
4 1;27.06.2000;28 1300;������ ���
5 1;28.06.2000;28 1100;������ ���
基本上不是四列 nominal
、data
、curs
、cdx
我有两列,其中一列包含所有值,最后一列(它是空的或其他东西,因为最后一列有编码问题)- 不知道是什么。
我已经删除了这样的列Column 1
import pandas as pd
def azureml_main(dataframe1 = None, dataframe2 = None):
dataframe1.drop(['Column 1'], axis = 1, inplace = True)
print('Input pandas.DataFrame #1:\r\n\r\n{0}'.format(dataframe1))
return dataframe1,
现在如何将第一列拆分成多个?获得 4 个单独的列
我正在使用 pandas 0.18
您需要拆分列:
dataframe1['nominal;data;curs;cdx'].str.split(';',expand=True)
然后将 headers 更改为:
dataframe1.columns = 'nominal;data;curs;cdx'.split(';')
我已经在 Azure 上上传了我的 csv
文件,但由于某种原因它变成了这样
nominal;data;curs;cdx Column 1
0 1;21.06.2000;28 2300;������ ���
1 1;22.06.2000;28 2200;������ ���
2 1;23.06.2000;28 1900;������ ���
3 1;24.06.2000;28 1700;������ ���
4 1;27.06.2000;28 1300;������ ���
5 1;28.06.2000;28 1100;������ ���
基本上不是四列 nominal
、data
、curs
、cdx
我有两列,其中一列包含所有值,最后一列(它是空的或其他东西,因为最后一列有编码问题)- 不知道是什么。
我已经删除了这样的列Column 1
import pandas as pd
def azureml_main(dataframe1 = None, dataframe2 = None):
dataframe1.drop(['Column 1'], axis = 1, inplace = True)
print('Input pandas.DataFrame #1:\r\n\r\n{0}'.format(dataframe1))
return dataframe1,
现在如何将第一列拆分成多个?获得 4 个单独的列
我正在使用 pandas 0.18
您需要拆分列:
dataframe1['nominal;data;curs;cdx'].str.split(';',expand=True)
然后将 headers 更改为:
dataframe1.columns = 'nominal;data;curs;cdx'.split(';')