python / pandas - 从目录导入最后修改的 .xlsx 文件
python / pandas - Import last modified .xlsx file from a directory
我在保管箱中有一个文件夹,路径为:
C:\Users\Sophocles PC\Dropbox\RGS Delivery\Impact Coefficients\Consumer Discretionary\CD_LG_Apparel_Accessories_Luxury_Goods\Data\CD_LG_DataOutputs
并且我想导入最后修改的 .xlsx
文件。我使用代码:
list_of_files = glob.glob(r'C:\Users\Sophocles PC\Dropbox\RGS Delivery\Impact Coefficients\Consumer Discretionary\CD_LG_Apparel_Accessories_Luxury_Goods\Data\CD_LG_DataOutputs/*')
latest_file = max(list_of_files, key=os.path.getctime)
latest_file
,打印:
C:\Users\Sophocles PC\Dropbox\RGS Delivery\Impact Coefficients\Consumer Discretionary\CD_LG_Apparel_Accessories_Luxury_Goods\Data\CD_LG_DataOutputs\~$CD_LG_Results - 2020-11-27 - mean - v2.xlsx
这实际上是最新的文件,因此也是我要导入的文件。 但是,当我尝试导入文件时:
x = pd.read_excel(latest_file)
我收到以下错误: XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\x0cSophocl'
我不知道如何解决这个错误,但我也认为解决这个问题应该相当简单。对此的任何帮助将不胜感激。谢谢。
使用以下代码删除 ~$
(临时文件)后问题已解决:
x = pd.read_excel(f"{latest_file}".replace('~$',''),sheet_name=2)
谢谢。
我在保管箱中有一个文件夹,路径为:
C:\Users\Sophocles PC\Dropbox\RGS Delivery\Impact Coefficients\Consumer Discretionary\CD_LG_Apparel_Accessories_Luxury_Goods\Data\CD_LG_DataOutputs
并且我想导入最后修改的 .xlsx
文件。我使用代码:
list_of_files = glob.glob(r'C:\Users\Sophocles PC\Dropbox\RGS Delivery\Impact Coefficients\Consumer Discretionary\CD_LG_Apparel_Accessories_Luxury_Goods\Data\CD_LG_DataOutputs/*')
latest_file = max(list_of_files, key=os.path.getctime)
latest_file
,打印:
C:\Users\Sophocles PC\Dropbox\RGS Delivery\Impact Coefficients\Consumer Discretionary\CD_LG_Apparel_Accessories_Luxury_Goods\Data\CD_LG_DataOutputs\~$CD_LG_Results - 2020-11-27 - mean - v2.xlsx
这实际上是最新的文件,因此也是我要导入的文件。 但是,当我尝试导入文件时:
x = pd.read_excel(latest_file)
我收到以下错误: XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\x0cSophocl'
我不知道如何解决这个错误,但我也认为解决这个问题应该相当简单。对此的任何帮助将不胜感激。谢谢。
使用以下代码删除 ~$
(临时文件)后问题已解决:
x = pd.read_excel(f"{latest_file}".replace('~$',''),sheet_name=2)
谢谢。