使用导入工具将 TSV 数据导入 Neo4j
Import TSV data into Neo4j using import tool
我正在尝试将大型数据集导入我的本地 Neo4j 实例。我正在尝试使用导入工具,但到目前为止没有成功。
由于我的数据量大,我无法使用 Cypher 或 "LOAD CSV WITH HEADERS" 方法(而且我的数据没有 headers)。
我正在尝试通过以下语句使用导入工具:
neo4jimport --into C:\...\my_database --nodes C:\...\Authors_header.csv,C:\...\Authors.csv --stacktrace --delimeter TAB
我的文件是 .CSV 文件,但值是用制表符分隔的。我的 header 文件格式为:
authorID author_name
我的主要(示例中的虚拟)文件如下所示:
1 Banana
2 Apple
3 Pear
4 Potato
5 Tomato
我尝试使用逗号和分号创建虚拟文件,该方法工作正常,但使用 TAB 将两个属性合并为一个,因此在导入后我只有一个 属性 节点,名为:
authorID author_name
由于文件的大小,我不能只用逗号替换 TABS。我尝试将分隔符更改为 '\t' 和其他组合,但没有成功。
另外我想知道是否可以在创建节点时为每个节点添加一个静态标签,即使标签不是从数据文件中读取的。
我正在考虑使用 Python 和 py2neo 的不同方法,如果导入工具无法提取它的话。
我在普通便携式计算机上使用 Neo4j 2.2.3 社区版。
如有任何帮助,我们将不胜感激。
你打错了:不是delimeter
而是delimiter
,见neo4jimport --help
更新到 2.2.5 以获取具有最高性能的最新版本。
您的 header 应该是:
authorID:ID author_name
你还应该提供 --id-type integer
您可以为 command-line 上的所有节点提供标签:--nodes:Author
我正在尝试将大型数据集导入我的本地 Neo4j 实例。我正在尝试使用导入工具,但到目前为止没有成功。
由于我的数据量大,我无法使用 Cypher 或 "LOAD CSV WITH HEADERS" 方法(而且我的数据没有 headers)。
我正在尝试通过以下语句使用导入工具:
neo4jimport --into C:\...\my_database --nodes C:\...\Authors_header.csv,C:\...\Authors.csv --stacktrace --delimeter TAB
我的文件是 .CSV 文件,但值是用制表符分隔的。我的 header 文件格式为:
authorID author_name
我的主要(示例中的虚拟)文件如下所示:
1 Banana
2 Apple
3 Pear
4 Potato
5 Tomato
我尝试使用逗号和分号创建虚拟文件,该方法工作正常,但使用 TAB 将两个属性合并为一个,因此在导入后我只有一个 属性 节点,名为:
authorID author_name
由于文件的大小,我不能只用逗号替换 TABS。我尝试将分隔符更改为 '\t' 和其他组合,但没有成功。
另外我想知道是否可以在创建节点时为每个节点添加一个静态标签,即使标签不是从数据文件中读取的。
我正在考虑使用 Python 和 py2neo 的不同方法,如果导入工具无法提取它的话。
我在普通便携式计算机上使用 Neo4j 2.2.3 社区版。
如有任何帮助,我们将不胜感激。
你打错了:不是delimeter
而是delimiter
,见neo4jimport --help
更新到 2.2.5 以获取具有最高性能的最新版本。
您的 header 应该是:
authorID:ID author_name
你还应该提供 --id-type integer
您可以为 command-line 上的所有节点提供标签:--nodes:Author