在事件中心的 Spark Streaming 作业中设置 eventhubs.checkpoint.dir 时出错

Error in setting eventhubs.checkpoint.dir in spark streaming job from event hub

我正在尝试通过 运行 本地的火花流作业访问事件中心数据。 我在为 eventhubs.checkpoint.dir 设置事件中心配置时遇到问题。我尝试设置以下值

每个都导致与以下类似的错误:

ERROR ReceiverTracker: Deregistered receiver for stream 0: Restarting receiver with delay 2000ms: Error handling message; restarting receiver -   java.io.IOException: No FileSystem for scheme: https
    at org.apache.hadoop.fs.FileSystem.getFileSystemClass(FileSystem.java:2421)
    at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2428)
    at org.apache.hadoop.fs.FileSystem.access0(FileSystem.java:88)
    at org.apache.hadoop.fs.FileSystem$Cache.getInternal(FileSystem.java:2467)
    at org.apache.hadoop.fs.FileSystem$Cache.get(FileSystem.java:2449)
    at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:367)

您可以将 eventhubs.checkpoint.dir 设置为一个字符串值,该值将是一个有效的 wasb 文件夹名称。例如,我将其设置为“/myeventhubspark”。该文件夹将在您的 Spark 集群的默认容器中自动创建。请务必在文件夹名称前加上正斜杠,例如 -

"eventhubs.checkpoint.dir" -> “/myeventhubspark”