python / pandas - 从目录导入最后修改的 .xlsx 文件

python / pandas - Import last modified .xlsx file from a directory

我在保管箱中有一个文件夹,路径为:

C:\Users\Sophocles PC\Dropbox\RGS Delivery\Impact Coefficients\Consumer Discretionary\CD_LG_Apparel_Accessories_Luxury_Goods\Data\CD_LG_DataOutputs

并且我想导入最后修改的 .xlsx 文件。我使用代码:

list_of_files = glob.glob(r'C:\Users\Sophocles PC\Dropbox\RGS Delivery\Impact Coefficients\Consumer Discretionary\CD_LG_Apparel_Accessories_Luxury_Goods\Data\CD_LG_DataOutputs/*') 
latest_file = max(list_of_files, key=os.path.getctime)

latest_file ,打印:

C:\Users\Sophocles PC\Dropbox\RGS Delivery\Impact Coefficients\Consumer Discretionary\CD_LG_Apparel_Accessories_Luxury_Goods\Data\CD_LG_DataOutputs\~$CD_LG_Results - 2020-11-27 - mean - v2.xlsx

这实际上是最新的文件,因此也是我要导入的文件。 但是,当我尝试导入文件时:

x = pd.read_excel(latest_file)

我收到以下错误: XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\x0cSophocl'

我不知道如何解决这个错误,但我也认为解决这个问题应该相当简单。对此的任何帮助将不胜感激。谢谢。

使用以下代码删除 ~$(临时文件)后问题已解决:

x = pd.read_excel(f"{latest_file}".replace('~$',''),sheet_name=2)

谢谢。