使用 Pig latin 从文件中获取最大日期
Get max date from file using Pig latin
我有一个包含日期和其他一些列的文本文件。
日期列值的格式为 'yyyy-MM-dd HH:mm:ss'.
我想从文本文件中获取最大日期或最新日期。
(注意:我在 Pig Latin 中看到 MAX 函数仅在 GROUP BY 时有效)
任何人都可以建议是否有办法使用 Pig Latin 或任何替代方法来获得它?
基于样本数据集,
Apple|0|2009-01-14 00:00:00|
Apple|0|2010-12-16 10:20:20|
Banana|0|2019-12-14 00:00:00|
Banana|0|2016-11-11 01:45:03|
日期列的最大值可以使用
检索
fruits = LOAD 'fruits.txt' using PigStorage('|');
dt = FOREACH fruits GENERATE ToDate(, 'yyyy-MM-dd HH:mm:ss');
odt = ORDER dt by [=11=] DESC;
max = LIMIT odt 1;
dump max;
我有一个包含日期和其他一些列的文本文件。 日期列值的格式为 'yyyy-MM-dd HH:mm:ss'.
我想从文本文件中获取最大日期或最新日期。 (注意:我在 Pig Latin 中看到 MAX 函数仅在 GROUP BY 时有效)
任何人都可以建议是否有办法使用 Pig Latin 或任何替代方法来获得它?
基于样本数据集,
Apple|0|2009-01-14 00:00:00|
Apple|0|2010-12-16 10:20:20|
Banana|0|2019-12-14 00:00:00|
Banana|0|2016-11-11 01:45:03|
日期列的最大值可以使用
检索fruits = LOAD 'fruits.txt' using PigStorage('|');
dt = FOREACH fruits GENERATE ToDate(, 'yyyy-MM-dd HH:mm:ss');
odt = ORDER dt by [=11=] DESC;
max = LIMIT odt 1;
dump max;