使用 pandas 读取和编辑 excel 个文件

Question

所以，我正在读取 xlsx 文件，我需要 select 3 个特定的列，然后重命名它们，并将每列的前 100 行传输到一个新的 xlsx 文件，从原来的文件中删除它们一.

我的代码目前正在从手动编辑的 xlsx 文件中读取，我在其中重命名列，select 其中的前 100 个（header 除外），等等：

df = pandas.read_excel('test.xlsx', names=['date', 'value', 'source'])
df['date'] = pandas.to_datetime(df['date'], format='%b %d %Y.%f').astype(str)

print(df.head(5))

returns，如预期：

         date    value               source

0  2018-05-01      1                xxxxxxx
1  2018-05-01      1      xxxxxxxxxxxxxxxxx
2  2018-05-02      1      xxxxxxxxxxxxxxxxx
3  2018-05-02      1      xxxxxxxxxxxxxxxxx
4  2018-05-03      1     xxxxxxxxxxxxxxxxxx

有没有办法用pandas自动读取和编辑xlsx文件？其他库？我是 python 的新手，我真的迷路了:(

Answer 1

看来您需要输出 2 个文件。一个是前一百行，另一个是其余的。这很简单 pandas.DataFrame.iloc:

import pandas as pd

df = pd.read_excel('test.xlsx', names=['date', 'value', 'source'])

df.iloc[:100].to_excel('out1.xlsx', index=False)
df.iloc[100:].to_excel('out2.xlsx', index=False)

使用 pandas 读取和编辑 excel 个文件

Reading and editing excel files with pandas

python

excel

xlsx

xlwt

pandas