具有重叠时间范围的时间序列,仅使用 Excel Power Query 中的最新时间
Timeseries with overlapping timeframes, using just the most recent in Excel Power Query
我有以下问题:
在 Power Query 中,我可以将多个 csv 文件与 power query 合并在一起,并具有从文件夹加载的功能。不幸的是,我们得到的时间序列数据是重叠的,整个时间序列的值都发生了变化。
例如,我们每个星期一都会收到一份过去 30 天的文件。过去 30 天的值确实发生了变化,因此我上周报告中的值可能不再是最新的了。我的目标是用本周的新数据覆盖上周的旧数据。
示例:
文件A
Date Item Hits Solved
01.01.2018 A 100 50
01.01.2018 B 138 65
02.01.2018 A 124 70
...
07.01.2018 A 143 50
07.01.2018 B 147 57
...
30.01.2018 A 250 124
文件B
Date Item Hits Solved
07.07.2018 A 143 80
07.07.2018 B 147 95
...
06.02.2018 A 341 148
文件 A 中的数据应使用 文件 B 中的新信息进行更新,仅保留来自(在本例中) 来自 文件 A 的 01.01.2018 到 06.01.2018。其余的应该来自文件B.
直到现在我尝试给我的文件编号(越新越高,所以文件 A -> 1,文件 B -> 2),制作一个新的 (key)带有 Date+Item 的列,按文件编号排序(后代),然后删除 key 列中的重复项。这有时有效(只保留最近的条目),但有时无效。从 Date 列中删除重复项对我不起作用。在这里它只是删除最新的条目,保留旧的。
有没有更好的办法解决这个问题?
非常感谢!
转到根据文件顺序对数据进行排序的步骤并将其放入 Table.Buffer() 中,因此它看起来像
= Table.Buffer(Table.Sort(BLAH BLAH TABLE SORTING CODE))
我不记得技术原因,但出于此处的目的,这会重置 "internal" PQ 在 运行 删除重复项时使用的排序顺序以遵循 [=20= 的视觉排序顺序].
也没有必要创建键列,您可以 select 您的项目 + 日期列并删除重复项,它会完成同样的事情。
我建议从 FileA
开始,并在 Date
和 Item
列上与 FileB
进行左反合并。这将从 FileA
中删除任何在 FileB
.
中匹配 Date
和 Item
行的行
然后删除此合并创建的新列并将 File B
附加到末尾,您应该会得到想要的结果。
我有以下问题:
在 Power Query 中,我可以将多个 csv 文件与 power query 合并在一起,并具有从文件夹加载的功能。不幸的是,我们得到的时间序列数据是重叠的,整个时间序列的值都发生了变化。 例如,我们每个星期一都会收到一份过去 30 天的文件。过去 30 天的值确实发生了变化,因此我上周报告中的值可能不再是最新的了。我的目标是用本周的新数据覆盖上周的旧数据。
示例:
文件A
Date Item Hits Solved
01.01.2018 A 100 50
01.01.2018 B 138 65
02.01.2018 A 124 70
...
07.01.2018 A 143 50
07.01.2018 B 147 57
...
30.01.2018 A 250 124
文件B
Date Item Hits Solved
07.07.2018 A 143 80
07.07.2018 B 147 95
...
06.02.2018 A 341 148
文件 A 中的数据应使用 文件 B 中的新信息进行更新,仅保留来自(在本例中) 来自 文件 A 的 01.01.2018 到 06.01.2018。其余的应该来自文件B.
直到现在我尝试给我的文件编号(越新越高,所以文件 A -> 1,文件 B -> 2),制作一个新的 (key)带有 Date+Item 的列,按文件编号排序(后代),然后删除 key 列中的重复项。这有时有效(只保留最近的条目),但有时无效。从 Date 列中删除重复项对我不起作用。在这里它只是删除最新的条目,保留旧的。
有没有更好的办法解决这个问题?
非常感谢!
转到根据文件顺序对数据进行排序的步骤并将其放入 Table.Buffer() 中,因此它看起来像
= Table.Buffer(Table.Sort(BLAH BLAH TABLE SORTING CODE))
我不记得技术原因,但出于此处的目的,这会重置 "internal" PQ 在 运行 删除重复项时使用的排序顺序以遵循 [=20= 的视觉排序顺序].
也没有必要创建键列,您可以 select 您的项目 + 日期列并删除重复项,它会完成同样的事情。
我建议从 FileA
开始,并在 Date
和 Item
列上与 FileB
进行左反合并。这将从 FileA
中删除任何在 FileB
.
Date
和 Item
行的行
然后删除此合并创建的新列并将 File B
附加到末尾,您应该会得到想要的结果。