在 Power BI 文件夹源中获取最新的更新文件

Getting lastest update file in Power BI Folder Source

我有一个包含 3 个不同子文件夹的文件夹,我在其中存储一些日常导出。我只想从每个文件夹路径中获取最新的更新文件。如图所示。

我需要为每个相同路径保留最新“修改日期”文件的二进制和属性列。每个不同的子文件夹的最新修改日期不同。我的子文件夹指的是一年中的每个月(它们的名称是五月、六月、七月,很快就会合并到八月)。

这样,由于我的文件夹路径列中有 3 个不同的文件夹路径值,我将只有 3 个 csv 可以展开。

我尝试按文件夹路径和最大修改日期进行分组,但我丢失了其他字段。如果我添加最大属性或所有行,也不能解决我的问题。

我也试过这个解决方案:https://community.powerbi.com/t5/Desktop/Keep-only-the-latest-date-for-duplicate-entries/td-p/638447

但是我遇到了一个错误:函数类型值无法转换为Table类型。详细信息:值 = [功能],类型 = [类型].

M 查询代码:

 let
    Source = AzureStorage.DataLake(".../usersDailyData"),
    #"Filtered Hidden Files1" = Table.SelectRows(#"Sorted Rows", each [Attributes]?[Hidden]? <> true),
    #"Invoke Custom Function1" = Table.AddColumn(#"Filtered Hidden Files1", "Transformar archivo", each #"Transformar archivo"([Content])),
    #"Renamed Columns1" = Table.RenameColumns(#"Invoke Custom Function1", {"Name", "Source.Name"}),
    #"Removed Other Columns1" = Table.SelectColumns(#"Renamed Columns1", {"Source.Name", "Transformar archivo"}),
    #"Expanded Table Column1" = Table.ExpandTableColumn(#"Removed Other Columns1", "Transformar archivo", Table.ColumnNames(#"Transformar archivo"(#"Archivo de ejemplo"))),
    #"Changed Type" = Table.TransformColumnTypes(#"Expanded Table Column1",{ Columns name here })
in
    #"Changed Type"
    

有什么解决办法吗?

非常感谢。

我建议为每个文件夹路径添加一个具有最大日期时间的列,然后将每行日期时间与该最大值进行比较,并过滤掉不匹配项。沿着下面的路线。我认为它在 Invoke Custom Function1 步骤之后,但您可以将其移动到需要的地方

...    
#"Added Custom" = Table.AddColumn(#"Invoke Custom Function1","MaxDate",(i)=>List.Max(Table.SelectRows( #"Invoke Custom Function1", each [Folder Path]=i[Folder Path]) [Date modified]), type datetime ),
#"Added Custom1" = Table.AddColumn(#"Added Custom", "Custom", each if [Date modified]=[MaxDate] then "keep" else null),
#"Filtered Rows" = Table.SelectRows(#"Added Custom1", each ([Custom] = "keep")),
...