在 oozei 中与 spark java.lang.IllegalArgumentException: java.net.UnknownHostException: nameservice1

Question

我用的是CDH 6.3.2

hadoop 是 HA

我在 hue 中使用 spark 创建了一个工作流程

运行这个工作流程我得到一个错误

Failing Oozie Launcher, java.net.UnknownHostException: nameservice1
java.lang.IllegalArgumentException: java.net.UnknownHostException: nameservice1
    at org.apache.hadoop.security.SecurityUtil.buildTokenService(SecurityUtil.java:445)
    at org.apache.hadoop.hdfs.NameNodeProxiesClient.createProxyWithClientProtocol(NameNodeProxiesClient.java:132)
    at org.apache.hadoop.hdfs.DFSClient.<init>(DFSClient.java:351)
    at org.apache.hadoop.hdfs.DFSClient.<init>(DFSClient.java:285)
    at org.apache.hadoop.hdfs.DistributedFileSystem.initialize(DistributedFileSystem.java:168)
    at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:3237)
    at org.apache.hadoop.fs.FileSystem.access0(FileSystem.java:123)
    at org.apache.hadoop.fs.FileSystem$Cache.getInternal(FileSystem.java:3286)
    at org.apache.hadoop.fs.FileSystem$Cache.get(FileSystem.java:3254)
    at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:478)
    at org.apache.spark.deploy.DependencyUtils$.org$apache$spark$deploy$DependencyUtils$$resolveGlobPath(DependencyUtils.scala:190)
    at org.apache.spark.deploy.DependencyUtils$$anonfun$resolveGlobPaths.apply(DependencyUtils.scala:146)
    at org.apache.spark.deploy.DependencyUtils$$anonfun$resolveGlobPaths.apply(DependencyUtils.scala:144)
    at scala.collection.TraversableLike$$anonfun$flatMap.apply(TraversableLike.scala:241)
    at scala.collection.TraversableLike$$anonfun$flatMap.apply(TraversableLike.scala:241)
    at scala.collection.IndexedSeqOptimized$class.foreach(IndexedSeqOptimized.scala:33)
    at scala.collection.mutable.WrappedArray.foreach(WrappedArray.scala:35)
    at scala.collection.TraversableLike$class.flatMap(TraversableLike.scala:241)
    at scala.collection.AbstractTraversable.flatMap(Traversable.scala:104)
    at org.apache.spark.deploy.DependencyUtils$.resolveGlobPaths(DependencyUtils.scala:144)
    at org.apache.spark.deploy.SparkSubmit$$anonfun$prepareSubmitEnvironment.apply(SparkSubmit.scala:355)
    at org.apache.spark.deploy.SparkSubmit$$anonfun$prepareSubmitEnvironment.apply(SparkSubmit.scala:355)
    at scala.Option.map(Option.scala:146)
    at org.apache.spark.deploy.SparkSubmit.prepareSubmitEnvironment(SparkSubmit.scala:355)
    at org.apache.spark.deploy.SparkSubmit.submit(SparkSubmit.scala:143)
    at org.apache.spark.deploy.SparkSubmit.doSubmit(SparkSubmit.scala:86)
    at org.apache.spark.deploy.SparkSubmit$$anon.doSubmit(SparkSubmit.scala:926)
    at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:935)
    at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)
    at org.apache.oozie.action.hadoop.SparkMain.runSpark(SparkMain.java:186)
    at org.apache.oozie.action.hadoop.SparkMain.run(SparkMain.java:93)
    at org.apache.oozie.action.hadoop.LauncherMain.run(LauncherMain.java:104)
    at org.apache.oozie.action.hadoop.SparkMain.main(SparkMain.java:60)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at org.apache.oozie.action.hadoop.LauncherAM.runActionMain(LauncherAM.java:410)
    at org.apache.oozie.action.hadoop.LauncherAM.access0(LauncherAM.java:55)
    at org.apache.oozie.action.hadoop.LauncherAM.run(LauncherAM.java:223)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:422)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1875)
    at org.apache.oozie.action.hadoop.LauncherAM.run(LauncherAM.java:217)
    at org.apache.oozie.action.hadoop.LauncherAM.run(LauncherAM.java:153)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:422)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1875)
    at org.apache.oozie.action.hadoop.LauncherAM.main(LauncherAM.java:141)
Caused by: java.net.UnknownHostException: nameservice1

在我的 hdfs-site.xml

<property>
    <name>dfs.nameservices</name>
    <value>nameservice1</value>
  </property>
  <property>
    <name>dfs.client.failover.proxy.provider.nameservice1</name>
    <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
  </property>
  <property>
    <name>dfs.ha.automatic-failover.enabled.nameservice1</name>
    <value>true</value>
  </property>
  <property>
    <name>ha.zookeeper.quorum</name>
    <value>bigdser2:2181,bigdser3:2181,bigdser5:2181</value>
  </property>
  <property>
    <name>dfs.ha.namenodes.nameservice1</name>
    <value>namenode337,namenode369</value>
  </property>

我可以运行在 hue 中使用 hive 的工作流程

我可以运行 spark-shell --jars hdfs://nameservice1/sparklib/*.jar

“hadoop fs -ls /user”有效。

它不适用于 oozie

所以如何修复it.someone可以帮助我。

Answer 1

我的job.properties

nameNode=hdfs://nameservice1
jobTracker=bigdser3:8032
queueName=default
oozie.use.system.libpath=True　　
oozie.wf.application.path=${nameNode}/user/jztwk
security_enabled=True

我的workflow.xml

<workflow-app  name="Spark-example2" xmlns="uri:oozie:workflow:0.5">
    <start to="SparkOozieAction1"/>
    <action name="SparkOozieAction1">
        <spark xmlns="uri:oozie:spark-action:0.2">
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <master>yarn</master>
            <mode>cluster</mode>
            <name>Spark Example1</name>
            <class>App</class>
            <jar>JztCloudAnalyse.jar</jar>
            <spark-opts>--jars hdfs://nameservice1/sparklib/*.jar  --conf spark.executor.extraJavaOptions=-Dfile.encoding=UTF-8 --conf spark.driver.extraJavaOptions=-Dfile.encoding=UTF-8</spark-opts>
            <arg>-r 10.3.87.31:7000,10.3.87.31:7001,10.3.87.32:7002,10.3.87.32:7003,10.3.87.36:7004,10.3.87.36:7005 -d 0 -k 22 -w http://10.3.87.49:8082/SendMsgApi.ashx -n JZTanalyse10_102 -h JZTanalyse -o jjj</arg>
           <file>/user/jztwk/JztCloudAnalyse.jar#JztCloudAnalyse.jar</file>
        </spark>
        <ok to="end"/>
        <error to="kill"/>
    </action>
    <kill name="kill">
        <message>Action failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
    </kill>
    <end name="end"/>
</workflow-app>

运行 oozie 手动“menas without hue”

同样报错

Answer 2

在 jar

中删除排除 resources/hdfs-site.xml resources/core-site.xml

Answer 3

我也有这个问题，使用oozie 5.2.1和apache hadoop 2.10.1 这是由于 applicationmaster 无法从类路径中找到 hdfs-site.xml，当我们使用 spark-submit 时它会添加 HADOOP_CONF_DIR 到类路径

oozie 也将它添加到类路径中 $PWD:$PWD/:$HADOOP_CONF_DIR:$HADOOP_COMMON_HOME/share/hadoop/common/:......

但是我发现环境变量'HADOOP_CONF_DIR' oozie submit to rm 是空的

检查下面的代码，它将 HADOOP_CONF_DIR 设置为 HADOOP_CLIENT_CONF_DIR

 private void setHadoopConfDirIfEmpty(Map<String, String> env) {
    String envHadoopConfDir = env.get(HADOOP_CONF_DIR);
    if (StringUtils.isEmpty(envHadoopConfDir)) {
        String hadoopClientConfDirVariable = String.format("${%s}",HADOOP_CLIENT_CONF_DIR);
        LOG.debug("Setting {0} environment variable to {1}.", HADOOP_CONF_DIR, hadoopClientConfDirVariable);
        env.put(HADOOP_CONF_DIR, hadoopClientConfDirVariable);
    }
    else {
        LOG.debug( "Environment variable {0} is already set to {1}.", HADOOP_CONF_DIR, envHadoopConfDir);
    }
}

即使我添加了与HADOOP_CONF_DIR相同的值的env 'HADOOP_CLIENT_CONF_DIR'，我发现问题仍然没有解决，我不知道，然后我找到另一种方法来指定环境变量，

在核心添加跟随配置-site.xml

<property>
    <name>oozie.launcher.env</name>
    <value>HADOOP_CONF_DIR=/usr/local/hadoop/hadoop-2.10.1/etc/hadoop/</value>
</property>

最后，我这样解决了问题

在 oozei 中与 spark java.lang.IllegalArgumentException: java.net.UnknownHostException: nameservice1

in oozei with spark java.lang.IllegalArgumentException: java.net.UnknownHostException: nameservice1

hdfs

hue

oozie

apache-spark

oozie-workflow