从 .csv 创建 .jsonl 文件
Create .jsonl files from .csv
我想使用 AutoML
,特别是 Entity extraction
,但是系统要求我上传 .jsonl 文件。
我不知道 .jsonl 文件是什么,也不知道如何创建它。我只有一个 .csv 文件。
那么,如何从 .csv 文件创建 .jsonl 文件?如果这不可能,我该如何创建 .jsonl 文件?
这是JSON行http://jsonlines.org/
并且您可以使用 Miller (https://github.com/johnkerl/miller)。例如,如果您输入的 CSV 是
fieldOne,FieldTwo
1,lorem
2,ipsum
你可以运行
mlr --c2j cat input_01.csv >output.json
有
{ "fieldOne": 1, "FieldTwo": "lorem" }
{ "fieldOne": 2, "FieldTwo": "ipsum" }
此输出是 JSON 行(每行一个有效的 JSON 对象)。如果您想要 JSON,则必须添加 --jlistwrap
标志。
mlr --c2j --jlistwrap cat input.csv
有
[
{ "fieldOne": 1, "FieldTwo": "lorem" }
,{ "fieldOne": 2, "FieldTwo": "ipsum" }
]
我想使用 AutoML
,特别是 Entity extraction
,但是系统要求我上传 .jsonl 文件。
我不知道 .jsonl 文件是什么,也不知道如何创建它。我只有一个 .csv 文件。
那么,如何从 .csv 文件创建 .jsonl 文件?如果这不可能,我该如何创建 .jsonl 文件?
这是JSON行http://jsonlines.org/
并且您可以使用 Miller (https://github.com/johnkerl/miller)。例如,如果您输入的 CSV 是
fieldOne,FieldTwo
1,lorem
2,ipsum
你可以运行
mlr --c2j cat input_01.csv >output.json
有
{ "fieldOne": 1, "FieldTwo": "lorem" }
{ "fieldOne": 2, "FieldTwo": "ipsum" }
此输出是 JSON 行(每行一个有效的 JSON 对象)。如果您想要 JSON,则必须添加 --jlistwrap
标志。
mlr --c2j --jlistwrap cat input.csv
有
[
{ "fieldOne": 1, "FieldTwo": "lorem" }
,{ "fieldOne": 2, "FieldTwo": "ipsum" }
]