如何在 MAPR 文件系统和 HDInsight Blob 存储之间进行 distcp

How to distcp between a MAPR filesystem and a HDInsight Blob Storage

我正在尝试执行下面的 distcp 命令,但它抛出了异常:

hadoop distcp date_load=201901* wasb://dev3-spark@clusterdev.blob.core.windows.net/luiz/producao/performance/performance_report

抛出异常如下:

我正在尝试执行下面的 distcp 命令,但它抛出了异常:

hadoop distcp date_load=201901* wasb://dev3-spark@clusterdev.blob.core.windows.net/luiz/producao/performance/performance_report

抛出异常如下:

19/02/06 13:34:53 信息 impl.MetricsConfig:从 hadoop 加载属性-metrics2.properties 19/02/06 13:34:53 信息 impl.MetricsSystemImpl:计划的快照周期为 10 秒。 19/02/06 13:34:53 信息 impl.MetricsSystemImpl:azure 文件系统指标系统已启动 19/02/06 13:34:53 错误 tools.DistCp:无效参数: org.apache.hadoop.fs.azure.AzureException:org.apache.hadoop.fs.azure.AzureException:未找到帐户 clusterdev.blob.core.windows.net 中的容器 dev3-spark,我们无法使用匿名凭据创建它。 在 org.apache.hadoop.fs.azure.AzureNativeFileSystemStore.createAzureStorageSession(AzureNativeFileSystemStore.java:938) 在 org.apache.hadoop.fs.azure.AzureNativeFileSystemStore.initialize(AzureNativeFileSystemStore.java:438) 在 org.apache.hadoop.fs.azure.NativeAzureFileSystem.initialize(NativeAzureFileSystem.java:1048) 在 org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2693) org.apache.hadoop.fs.FileSystem.access300 美元(FileSystem.java:98) 在 org.apache.hadoop.fs.FileSystem$Cache.getInternal(FileSystem.java:2773) 在 org.apache.hadoop.fs.FileSystem$Cache.get(FileSystem.java:2755) 在 org.apache.hadoop.fs.FileSystem.get(FileSystem.java:411) 在 org.apache.hadoop.fs.Path.getFileSystem(Path.java:309) 在 org.apache.hadoop.tools.DistCp.setTargetPathExists(DistCp.java:216) 在 org.apache.hadoop.tools.DistCp.运行(DistCp.java:116) 在 org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70) 在 org.apache.hadoop.tools.DistCp.main(DistCp.java:430) 原因:org.apache.hadoop.fs.azure.AzureException:未找到帐户 clusterdev.blob.core.windows.net 中的容器 dev3-spark,我们无法使用匿名凭据创建它。 在 org.apache.hadoop.fs.azure.AzureNativeFileSystemStore.connectUsingAnonymousCredentials(AzureNativeFileSystemStore.java:730) 在 org.apache.hadoop.fs.azure.AzureNativeFileSystemStore.createAzureStorageSession(AzureNativeFileSystemStore.java:933) ... 还有 12 个 参数无效:org.apache.hadoop.fs.azure.AzureException:未找到帐户 clusterdev.blob.core.windows.net 中的容器 dev3-spark,我们无法使用匿名凭据创建它。

您可以从本地集群 distcp 到您的 Azure 存储帐户

% hadoop distCP hdfs://<yourHostName>:9001/user/<yourUser>/<yourDirectory> wasbs://<yourStorageContainer>@<YourStorageAccount>.blob.core.windows.net/<yourDestinationDirectory>/

希望对您有所帮助。