使用 python 和 xlrd 到 combine/merge 2 个不同的电子表格
using python and xlrd to combine/merge 2 different spreadsheets
我有 2 个单独的 excel 电子表格
电子表格 1 是这样的:
ID tin name date
1 21043 Bob 8/1/2019
2 45667 Jim 7/1/2018
3 69780 Sal 4/24/2017
第二个电子表格是这样的:
ID tin job
1 21043 02
2 76544 02
3 45667 04
我正在尝试弄清楚如何匹配 2 个电子表格并制作 1 个列表:
ID tin name date job
1 21043 Bob 8/1/2019 02
2 45667 Jim 7/1/2018 04
3 69780 Sal 4/24/2017
4 76544 02
共同点是 "tin" 但我必须合并重复的那些,然后添加两张纸中不重复的那些..
我是 python 的新手,也是 xlrd 的新手,所以我似乎甚至无法找出用于 google 示例的最佳术语。
我找到了一些关于 next(iter 语句的信息,但经过无数次尝试后,我无法找到一种有用的方法来使用它来组合。
有没有简单的方法或者我"up a creek"??
谢谢,
鲍勃
您可以为此使用 pandas。 Pandas 在后台使用 xlrd 和其他 excel 阅读器。
你会做这样的事情:
df1 = pandas.read_excel('file1.xls', sheet_name='...')
df2 = pandas.read_excel('file2.xls', sheet_name='...')
df1.merge(df2, how='outer')
根据您的列名,您可能需要一些变体。请参阅 pandas merge
我有 2 个单独的 excel 电子表格 电子表格 1 是这样的:
ID tin name date
1 21043 Bob 8/1/2019
2 45667 Jim 7/1/2018
3 69780 Sal 4/24/2017
第二个电子表格是这样的:
ID tin job
1 21043 02
2 76544 02
3 45667 04
我正在尝试弄清楚如何匹配 2 个电子表格并制作 1 个列表:
ID tin name date job
1 21043 Bob 8/1/2019 02
2 45667 Jim 7/1/2018 04
3 69780 Sal 4/24/2017
4 76544 02
共同点是 "tin" 但我必须合并重复的那些,然后添加两张纸中不重复的那些..
我是 python 的新手,也是 xlrd 的新手,所以我似乎甚至无法找出用于 google 示例的最佳术语。
我找到了一些关于 next(iter 语句的信息,但经过无数次尝试后,我无法找到一种有用的方法来使用它来组合。
有没有简单的方法或者我"up a creek"??
谢谢,
鲍勃
您可以为此使用 pandas。 Pandas 在后台使用 xlrd 和其他 excel 阅读器。
你会做这样的事情:
df1 = pandas.read_excel('file1.xls', sheet_name='...')
df2 = pandas.read_excel('file2.xls', sheet_name='...')
df1.merge(df2, how='outer')
根据您的列名,您可能需要一些变体。请参阅 pandas merge