使用 pandas [Python] 提取 xls 文件后如何从输出中删除编号
How remove numbering from output after extract xls file with pandas [Python]
我有一个从 Excel .xls
文件中提取特定列的 Python 脚本,但输出的提取信息旁边有一个编号,所以我想知道如何格式化输出以使它们不出现。
我的实际代码是这样的:
for i in sys.argv:
file_name = sys.argv[1]
workbook = pd.read_excel(file_name)
df = pd.DataFrame(workbook, columns=['NOM_LOGR_COMPLETO'])
df = df.drop_duplicates()
df = df.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
print(df)
我当前的输出:
1 Street Alpha <br>
2 Street Bravo
但我需要的结果是:
Street Alpha <br>
Street Bravo
没有编号,只有街道名称。
谢谢!
我相信你想要一个没有索引的数据框。请注意,没有索引就不能有 DataFrame
,它们是 DataFrame
的全部要点。所以对于你的情况,你可以采用:
print(df.values)
查看没有索引列的数据框。要保存没有索引的输出,请使用:
writer = pd.ExcelWriter("dataframe.xlsx", engine='xlsxwriter')
df.to_excel(writer, sheet_name = df, index=False)
writer.save()
其中 file_name = "dataframe.xlsx"
适合您的情况。
可在以下位置找到更多参考资料:
How to print pandas DataFrame without index
Printing a pandas dataframe without row number/index
disable index pandas data frame
Python to_excel without row names (index)?
我有一个从 Excel .xls
文件中提取特定列的 Python 脚本,但输出的提取信息旁边有一个编号,所以我想知道如何格式化输出以使它们不出现。
我的实际代码是这样的:
for i in sys.argv:
file_name = sys.argv[1]
workbook = pd.read_excel(file_name)
df = pd.DataFrame(workbook, columns=['NOM_LOGR_COMPLETO'])
df = df.drop_duplicates()
df = df.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
print(df)
我当前的输出:
1 Street Alpha <br>
2 Street Bravo
但我需要的结果是:
Street Alpha <br>
Street Bravo
没有编号,只有街道名称。
谢谢!
我相信你想要一个没有索引的数据框。请注意,没有索引就不能有 DataFrame
,它们是 DataFrame
的全部要点。所以对于你的情况,你可以采用:
print(df.values)
查看没有索引列的数据框。要保存没有索引的输出,请使用:
writer = pd.ExcelWriter("dataframe.xlsx", engine='xlsxwriter')
df.to_excel(writer, sheet_name = df, index=False)
writer.save()
其中 file_name = "dataframe.xlsx"
适合您的情况。
可在以下位置找到更多参考资料:
How to print pandas DataFrame without index
Printing a pandas dataframe without row number/index
disable index pandas data frame
Python to_excel without row names (index)?