我有一个 excel sheet,中间有一些页眉和页脚以及数据,现在我想编辑中间数据框的一列
I have a excel sheet with some header and footer and data in between , now I want edit one column of that dataframe in between
我有一个 excel sheet,中间有一些页眉和页脚以及数据,现在我想编辑中间数据框的一列,这样我就不想更改任何其他列事物。您在 link 和照片中看到的那一栏是贷款编号。例如在给定的数据集中,我想更改贷款号。从第 6 行到 xyzzz 从 abcd|xyzzz 并且不想更改除此之外的任何东西并将文件保存回 excel 格式。
当读取 pd.read_excel 中的文件时,它会格式化一些数据(弄乱列、未命名等),我还应该如何在 python 中执行此操作?
P.S- 最后还有一行页脚
https://drive.google.com/file/d/1gJ97HpG3OJlrcQswI2BIWLsZluza4PEm/view?usp=drivesdk
Here's the link to the dataset
你可以试试这样的
import pandas as pd
import xlrd
# pip install openpyxl
df = pd.read_excel('./sample23.xlsx', 'Sheet0', header=None)
def change(x):
try:
if x != 'abcd|xyzzz' and x == 'Loan No.':
return x
elif x == 'abcd|xyzzz':
return 'xyzzz'
except Exception as e:
return x
df[6] = df.apply(lambda row: change(row[6]), axis=1)
df.to_excel("test.xlsx",sheet_name='Sheet0', header=None, index=None)
df.head(10)
我有一个 excel sheet,中间有一些页眉和页脚以及数据,现在我想编辑中间数据框的一列,这样我就不想更改任何其他列事物。您在 link 和照片中看到的那一栏是贷款编号。例如在给定的数据集中,我想更改贷款号。从第 6 行到 xyzzz 从 abcd|xyzzz 并且不想更改除此之外的任何东西并将文件保存回 excel 格式。
当读取 pd.read_excel 中的文件时,它会格式化一些数据(弄乱列、未命名等),我还应该如何在 python 中执行此操作?
P.S- 最后还有一行页脚 https://drive.google.com/file/d/1gJ97HpG3OJlrcQswI2BIWLsZluza4PEm/view?usp=drivesdk
Here's the link to the dataset
你可以试试这样的
import pandas as pd
import xlrd
# pip install openpyxl
df = pd.read_excel('./sample23.xlsx', 'Sheet0', header=None)
def change(x):
try:
if x != 'abcd|xyzzz' and x == 'Loan No.':
return x
elif x == 'abcd|xyzzz':
return 'xyzzz'
except Exception as e:
return x
df[6] = df.apply(lambda row: change(row[6]), axis=1)
df.to_excel("test.xlsx",sheet_name='Sheet0', header=None, index=None)
df.head(10)