是否可以使用 R 访问 Hadoop HDInsight 集群中的 Hive 数据?

Is it possible toaccess Hive data in Hadoop HDInsight cluster using R?

是否可以使用 R 访问 Hadoop HDInsight 集群中的 Hive 数据?假设我们没有 R Server,我感兴趣的只是使用 R 作为访问 Hive 数据的客户端工具?

是的,可以在没有 R Server 的情况下访问 Hive。有很多解决方案,如下所示。

  1. RHive, an R extension facilitating distributed computing via Apache Hive. There is a slide可以参考一下,不过好像太老了,不支持YARN
  2. RJDBC, a package implementing DBI in R on the basis of JDBC. There is a blog 介绍R与Hive的用法
  3. R package hive,有这个包的文档,你可以参考一下,知道如何使用。

看来R包hive是个不错的选择,因为它支持的Hadoop版本是Apache Hadoop >= 2.6.0基于它的HDInsight

希望对您有所帮助。