使用 pandas 读取和编辑 excel 个文件
Reading and editing excel files with pandas
所以,我正在读取 xlsx 文件,我需要 select 3 个特定的列,然后重命名它们,并将每列的前 100 行传输到一个新的 xlsx 文件,从原来的文件中删除它们一.
我的代码目前正在从手动编辑的 xlsx 文件中读取,我在其中重命名列,select 其中的前 100 个(header 除外),等等:
df = pandas.read_excel('test.xlsx', names=['date', 'value', 'source'])
df['date'] = pandas.to_datetime(df['date'], format='%b %d %Y.%f').astype(str)
print(df.head(5))
returns,如预期:
date value source
0 2018-05-01 1 xxxxxxx
1 2018-05-01 1 xxxxxxxxxxxxxxxxx
2 2018-05-02 1 xxxxxxxxxxxxxxxxx
3 2018-05-02 1 xxxxxxxxxxxxxxxxx
4 2018-05-03 1 xxxxxxxxxxxxxxxxxx
有没有办法用pandas自动读取和编辑xlsx文件?其他库?我是 python 的新手,我真的迷路了:(
看来您需要输出 2 个文件。一个是前一百行,另一个是其余的。这很简单 pandas.DataFrame.iloc
:
import pandas as pd
df = pd.read_excel('test.xlsx', names=['date', 'value', 'source'])
df.iloc[:100].to_excel('out1.xlsx', index=False)
df.iloc[100:].to_excel('out2.xlsx', index=False)
所以,我正在读取 xlsx 文件,我需要 select 3 个特定的列,然后重命名它们,并将每列的前 100 行传输到一个新的 xlsx 文件,从原来的文件中删除它们一.
我的代码目前正在从手动编辑的 xlsx 文件中读取,我在其中重命名列,select 其中的前 100 个(header 除外),等等:
df = pandas.read_excel('test.xlsx', names=['date', 'value', 'source'])
df['date'] = pandas.to_datetime(df['date'], format='%b %d %Y.%f').astype(str)
print(df.head(5))
returns,如预期:
date value source
0 2018-05-01 1 xxxxxxx
1 2018-05-01 1 xxxxxxxxxxxxxxxxx
2 2018-05-02 1 xxxxxxxxxxxxxxxxx
3 2018-05-02 1 xxxxxxxxxxxxxxxxx
4 2018-05-03 1 xxxxxxxxxxxxxxxxxx
有没有办法用pandas自动读取和编辑xlsx文件?其他库?我是 python 的新手,我真的迷路了:(
看来您需要输出 2 个文件。一个是前一百行,另一个是其余的。这很简单 pandas.DataFrame.iloc
:
import pandas as pd
df = pd.read_excel('test.xlsx', names=['date', 'value', 'source'])
df.iloc[:100].to_excel('out1.xlsx', index=False)
df.iloc[100:].to_excel('out2.xlsx', index=False)