查询另一个 table 中列出的日期

Querying for dates listed in another table

我想 select 两个日期之间的 table 的某些行(在单独的 table 中找到)。我的 table 和查询的详细信息可以在之前的问题 here 中找到(我现在对如何在 HIVE/hiveQL 中执行此操作感兴趣)。正如我当前的查询所代表的那样,它运行了很长时间然后似乎无限期地挂起,而当我在日期中进行硬编码时它运行速度相当快。供参考的表格和查询:

VISIT_INFO,包含这些列:

pers_key - unique identifyer for each person
pers_name - name of person
visit_date - date at which they visited a business

VALID_DATES,包含这些列:

condition - string
start_date - date
end_date - date 

查询本身:

select pers_key, pers_name from VISIT_INFO a
CROSS JOIN
(select start_date, end_date from VALID_DATES where condition = 'condition1') b
WHERE (a.visit_date >= b.start_date and a.visit_date <= b.end_date)
GROUP BY a.pers_key

值得注意的是,我使用的是 HIVE 0.12,因此摆脱连接并将 select 语句放在 WHERE 子句中是不可能的。我想知道这个查询究竟有什么问题,或者是什么导致它失败。任何关于如何改进这一点的建议将不胜感激。

尝试:

select pers_key, pers_name 
from VISIT_INFO a 
join 
valid_dates b
WHERE a.visit_date BETWEEN b.start_date AND b.end_date
GROUP BY pers_key, pers_name;

从 Hive 0.13 开始:

select pers_key, pers_name 
from VISIT_INFO a , valid_dates b
WHERE a.visit_date BETWEEN b.start_date AND b.end_date
GROUP BY pers_key, pers_name;