azure.datalake.store.AdlFileSystem 在 Spark 中找不到
azure.datalake.store.AdlFileSystem not found in Spark
我正在尝试使用 spark sql 查询放置在 Data Lake Store 中的 csv 文件。当我查询时,我得到 "java.lang.ClassNotFoundException: Class com.microsoft.azure.datalake.store.AdlFileSystem not found".
如何使用 spark sql 查询放置在 Data Lake Store 中的文件?请帮我做个样品。
csv 示例:
Id Name Designation
1 aaa bbb
2 ccc ddd
3 eee fff
提前致谢,
索旺达亚
您在创建 HDInsight 集群时似乎没有为 Data Lake Store 配置Cluster AAD Identity
。
您可以尝试在 Azure 门户上使用 Data Lake Store 创建 HDInsight 的 Spark 集群,请参阅 https://azure.microsoft.com/en-us/documentation/articles/data-lake-store-hdinsight-hadoop-use-portal/。
目前 HDInsight-Spark 集群不适用于 Azure Data Lake Storage。一旦我们得到支持,它就会无缝运行。
同时,您可以使用 U-SQL 查询尝试将 ADL Analytics 用于 ADLS 上的同一作业。如需参考,请访问 link:https://azure.microsoft.com/en-us/documentation/articles/data-lake-analytics-get-started-portal/
我们正在努力争取支持,目前的目标是在 2016 年夏季之前的一段时间内提供。
希望对你有帮助。
谢谢,
苏拉布。
今天试了几个小时才弄明白...把它留在这里以防其他人需要帮助!
对于 Hadoop 3.0.1,确保在 hadoop-env.sh
文件
中取消注释以下内容
export HADOOP_OPTIONAL_TOOLS
我正在尝试使用 spark sql 查询放置在 Data Lake Store 中的 csv 文件。当我查询时,我得到 "java.lang.ClassNotFoundException: Class com.microsoft.azure.datalake.store.AdlFileSystem not found".
如何使用 spark sql 查询放置在 Data Lake Store 中的文件?请帮我做个样品。
csv 示例:
Id Name Designation
1 aaa bbb
2 ccc ddd
3 eee fff
提前致谢, 索旺达亚
您在创建 HDInsight 集群时似乎没有为 Data Lake Store 配置Cluster AAD Identity
。
您可以尝试在 Azure 门户上使用 Data Lake Store 创建 HDInsight 的 Spark 集群,请参阅 https://azure.microsoft.com/en-us/documentation/articles/data-lake-store-hdinsight-hadoop-use-portal/。
目前 HDInsight-Spark 集群不适用于 Azure Data Lake Storage。一旦我们得到支持,它就会无缝运行。 同时,您可以使用 U-SQL 查询尝试将 ADL Analytics 用于 ADLS 上的同一作业。如需参考,请访问 link:https://azure.microsoft.com/en-us/documentation/articles/data-lake-analytics-get-started-portal/ 我们正在努力争取支持,目前的目标是在 2016 年夏季之前的一段时间内提供。 希望对你有帮助。
谢谢, 苏拉布。
今天试了几个小时才弄明白...把它留在这里以防其他人需要帮助!
对于 Hadoop 3.0.1,确保在 hadoop-env.sh
文件
export HADOOP_OPTIONAL_TOOLS