Apache HAWQ 生产使用

Apache HAWQ production usage

我不知道还能在哪里问这个问题，所以我会在这里问，因为我认为这可以为未来可能有类似问题的用户提供一个很好的参考。

Apache HAWQ 是否有任何已知的生产用途 (http://hawq.incubator.apache.org/)？我想将这项服务与 Presto、Spark、Impala 等其他服务进行比较。但除了漂亮的基准测试之外，我还没有发现它在现实世界中的任何用法。最后，如果您亲自使用过它，您的使用体验如何？

Pivotal HDB（HAWQ 的商业产品）面向各种客户。 Hawq 是真正 100% SQL 兼容的 SQL 引擎，基于 MPP 历史。这是一款独特的产品，具有最先进的查询优化器和动态分区消除，非常强大的 HDFS 数据联合功能，具有 Hbase、Hive、JSON、ORC（测试版）和本机 hadoop 文件系统。 Hawq 使用 parquet 存储格式，因此在 hawq 中创建的表可以在 Hadoop eco-system 中使用。Hawq 能够收集外部表的统计信息以加快数据访问速度。支持 ACID 事务（插入）。在所有这些最引人注目的功能之上，是使用 sql 中的语言扩展进行数据科学，支持 R、Python、Java、Perl。我已经在汽车、石油和天然气、物联网、医疗保健行业看到了 HAWQ 的实施。我经历的典型用例是 Hadoop 之上的 BI、数据科学模型训练和执行模型、结构化数据上的交互 SQL。由于 HAWQ 诞生于 Greenplum 传统，因此 hawq 的一些功能很难在竞争产品中找到。 Hawq 完美补充了 Hadoop eco-system.

目前没有独立的apache hawq 文档。但是社区正在将文档从 pivotal hdb 转移到 apache hawq。页面上的文档链接链接到 hdb 文档 (http://hdb.docs.pivotal.io/211/hdb/index.html). You can refer to this one first and you can find incubator-hawq-docs projects at https://github.com/apache/incubator-hawq-docs。

此外，如果您不知道在哪里提问，您可以订阅开发和用户邮件列表，发送电子邮件至 dev-subscribe@hawq.incubator.apache.org / user-subscribe@hawq.incubator.apache.org 订阅并发送电子邮件至 dev@hawq.incubator.apache.org / user@hawq.incubator.apache.org 以提问。

Apache HAWQ 生产使用

Apache HAWQ production usage

hadoop

apache-spark

hawq