使用导入工具将 TSV 数据导入 Neo4j

Import TSV data into Neo4j using import tool

我正在尝试将大型数据集导入我的本地 Neo4j 实例。我正在尝试使用导入工具,但到目前为止没有成功。

由于我的数据量大,我无法使用 Cypher 或 "LOAD CSV WITH HEADERS" 方法(而且我的数据没有 headers)。

我正在尝试通过以下语句使用导入工具:

neo4jimport --into C:\...\my_database --nodes    C:\...\Authors_header.csv,C:\...\Authors.csv --stacktrace --delimeter TAB

我的文件是 .CSV 文件,但值是用制表符分隔的。我的 header 文件格式为:

authorID    author_name

我的主要(示例中的虚拟)文件如下所示:

1   Banana
2   Apple   
3   Pear
4   Potato
5   Tomato 

我尝试使用逗号和分号创建虚拟文件,该方法工作正常,但使用 TAB 将两个属性合并为一个,因此在导入后我只有一个 属性 节点,名为:

authorID author_name 

由于文件的大小,我不能只用逗号替换 TABS。我尝试将分隔符更改为 '\t' 和其他组合,但没有成功。

另外我想知道是否可以在创建节点时为每个节点添加一个静态标签,即使标签不是从数据文件中读取的。

我正在考虑使用 Python 和 py2neo 的不同方法,如果导入工具无法提取它的话。

我在普通便携式计算机上使用 Neo4j 2.2.3 社区版。

如有任何帮助,我们将不胜感激。

你打错了:不是delimeter而是delimiter,见neo4jimport --help

更新到 2.2.5 以获取具有最高性能的最新版本。

您的 header 应该是:

authorID:ID author_name

你还应该提供 --id-type integer

您可以为 command-line 上的所有节点提供标签:--nodes:Author