如何增加最大查询时间？

Question

我运行一个最终会 return 大约 1700 万行的查询，每行 500,000。一切似乎都很顺利，但我运行出现以下错误：

Traceback (most recent call last):
File "sql_csv.py", line 22, in <module>
    for chunk in  pd.read_sql_query(hours_query, db.conn, chunksize = 500000):
File "/Users/michael.chirico/anaconda2/lib/python2.7/site-packages/pandas/io/sql.py", line 1424, in _query_iterator
    data = cursor.fetchmany(chunksize)
File "/Users/michael.chirico/anaconda2/lib/python2.7/site-packages/jaydebeapi/\__init__.py", line 546, in fetchmany
    row = self.fetchone()
File "/Users/michael.chirico/anaconda2/lib/python2.7/site-packages/jaydebeapi/\__init__.py", line 526, in fetchone
    if not self._rs.next(): jpype._jexception.SQLExceptionPyRaisable: java.sql.SQLException: Query failed (#20171013_015410_01255_8pff8):
**Query exceeded maximum time limit of 60.00m**

显然这样的查询可能需要一些时间；我对此很好（分块意味着我知道我不会打破任何 RAM 限制——事实上，我运行ning 的文件输出显示查询在崩溃前完成了 17M 行中的 16M！）。

但我没有看到 read_sql_query 的任何直接选项。 params 似乎是一个不错的候选者，但我在 jaydebeapi 文档中看不到任何关于给 execute 的正确参数可能是什么的提示。

我该如何克服这个问题以及运行我的完整查询？

Answer 1

执行查询时，Presto 通过CPU、内存、执行时间和其他约束来限制每个查询。您达到了执行时间限制。请确保您的查询是正确的，否则，您可能会导致集群崩溃。

要增加查询执行时间，请在 session variables 中定义一个新值。

SET SESSION query_max_execution_time=60m;

Answer 2

要覆盖最长查询执行时间，请在 CLI 中添加此参数：

SET SESSION query_max_execution_time='60m';

这会将它更改为 60 分钟，请注意单引号。

如何增加最大查询时间？

How can I increase the maximum query time?

python

python-2.7

pandas

presto

jaydebeapi