无法从 S3 存储桶在 Amazon Neptune 中加载数据

Unable to Load Data in Amazon Neptune from S3 Bucket

我正在使用 Amazon Neptune 作为 GraphDB。

尝试从 S3 存储桶加载数据时遇到异常 "{"code":"InvalidParameterException","detailedMessage":"The source s3-URL does not exist/not reachable"}".

已检查 S3 资源 URL,它可以公开访问。 无法理解为什么会出现此错误。

我参考了 this AWS 文档并使用下面的 post 调用 Neptune 数据库实例来加载数据。

curl -X POST -H 'Content-Type: application/json' neptune-endpoint:8182/loader -d '
{
      "source" : "s3-URL",
      "format" : "csv",
      "iamRoleArn" : "arn:aws:iam::",
      "region" : "us-east-2",
      "failOnError" : "FALSE",
      "parallelism" : "MEDIUM",
      "updateSingleCardinalityProperties" : "FALSE"
}'

您是否创建了 VPC 端点? https://docs.aws.amazon.com/neptune/latest/userguide/bulk-load.html

查看您的错误消息,您似乎忘记替换占位符 s3-URL。您基本上需要将数据放在 S3 中,并使用 S3 URL 到文件夹以进行批量加载请求。

此外,您的代码段也没有 iamRoleArn 的有效值。请详细阅读文档,因为它解释了成功加载 S3 所需执行的一系列步骤。步骤的简短摘要如下:

  1. 将您的 CSV 或 RDF 数据上传到 S3,获取 S3 URL
  2. 创建有权访问 S3 数据的 IAM 角色
  3. 使用addRoleToDbCluster API(或控制台)将此角色添加到集群。这使得集群在需要获取数据时模拟该角色。
  4. 将 VPC 端点附加到您的 VPC,以便它可以与 S3 通信。
  5. 触发 /loader 请求并跟踪您的加载状态。

文档:https://docs.aws.amazon.com/neptune/latest/userguide/bulk-load.html

创建网关端点instated接口端点

Check Simple Description Here