将行与aws athena中的日期相乘
Multiply the rows with dates in aws athena
我是 aws athena 的新手。
有没有办法从这个输入中获得预期的输出?
INPUT(csv 文件有以下输入)
DATE (yyyymmdd) | ip | FINISHED ( 1:finished; 0: not finish)
2017-01-01 | 111 | 1
2017-01-01 | 222 | 1
2017-01-02 | 333 | 1
2017-01-03 | 444 | 1
预期输出
DATE (yyyymmdd) | ip | FINISHED ( 1:finished; 0: not finish)
2017-01-01 | 111 | 1
2017-01-01 | 222 | 1
2017-01-01 | 333 | 0
2017-01-01 | 444 | 0
2017-01-02 | 111 | 1
2017-01-02 | 222 | 1
2017-01-02 | 333 | 1
2017-01-02 | 444 | 0
2017-01-03 | 111 | 1
2017-01-03 | 222 | 1
2017-01-03 | 333 | 1
2017-01-03 | 444 | 1
这是查询操作的示例:
select t1."DATE (yyyymmdd)",t2.ip from
(SELECT "DATE (yyyymmdd)" FROM tab1 group by "DATE (yyyymmdd)") t1,
(SELECT ip FROM tab2 group by ip) t2
这里"select"使用的是cartesian join,所以不能应用于大数据集,会出现性能问题。
我是 aws athena 的新手。
有没有办法从这个输入中获得预期的输出?
INPUT(csv 文件有以下输入)
DATE (yyyymmdd) | ip | FINISHED ( 1:finished; 0: not finish)
2017-01-01 | 111 | 1
2017-01-01 | 222 | 1
2017-01-02 | 333 | 1
2017-01-03 | 444 | 1
预期输出
DATE (yyyymmdd) | ip | FINISHED ( 1:finished; 0: not finish)
2017-01-01 | 111 | 1
2017-01-01 | 222 | 1
2017-01-01 | 333 | 0
2017-01-01 | 444 | 0
2017-01-02 | 111 | 1
2017-01-02 | 222 | 1
2017-01-02 | 333 | 1
2017-01-02 | 444 | 0
2017-01-03 | 111 | 1
2017-01-03 | 222 | 1
2017-01-03 | 333 | 1
2017-01-03 | 444 | 1
这是查询操作的示例:
select t1."DATE (yyyymmdd)",t2.ip from
(SELECT "DATE (yyyymmdd)" FROM tab1 group by "DATE (yyyymmdd)") t1,
(SELECT ip FROM tab2 group by ip) t2
这里"select"使用的是cartesian join,所以不能应用于大数据集,会出现性能问题。