使用胶水爬虫 return 未知分类阅读 json
Read json with glue crawler return UNKNOWN classification
我有一个json文件,格式如下
{"result": [{"key1":"value1", "key2":"value2", "key3":"value3"}]}
当我使用爬虫时,table 创建的分类为 UNKOWNN。我做了一些研究,如果您使用 JsonPath $[*] 创建自定义分类器,您应该能够获得整个数组。不幸的是,这不起作用,至少对我而言。我在创建分类器后创建了一个新的爬虫,因为如果用分类器更新旧的爬虫,它将无法工作。
有没有人运行解决这个问题并且可以提供帮助?
您的 JSONPath 假设根是一个集合,例如。
[{"result ..},{}]
由于您的根不是集合,请尝试这样的 JSONPath:
$.result
假设整个对象就是你想要的值,你可能还想这样做:
$.result[*]
这会将结果集合中的每个条目作为一个单独的对象。
我找到了解决方法..
在我的 python 脚本中,我 select “结果”数组。换句话说,我现在没有“结果”键。然后我可以使用带有以下 JsonPath $[*] 的分类器。此解决方法对我来说效果很好。
玩得开心!
我有一个json文件,格式如下
{"result": [{"key1":"value1", "key2":"value2", "key3":"value3"}]}
当我使用爬虫时,table 创建的分类为 UNKOWNN。我做了一些研究,如果您使用 JsonPath $[*] 创建自定义分类器,您应该能够获得整个数组。不幸的是,这不起作用,至少对我而言。我在创建分类器后创建了一个新的爬虫,因为如果用分类器更新旧的爬虫,它将无法工作。
有没有人运行解决这个问题并且可以提供帮助?
您的 JSONPath 假设根是一个集合,例如。
[{"result ..},{}]
由于您的根不是集合,请尝试这样的 JSONPath:
$.result
假设整个对象就是你想要的值,你可能还想这样做:
$.result[*]
这会将结果集合中的每个条目作为一个单独的对象。
我找到了解决方法..
在我的 python 脚本中,我 select “结果”数组。换句话说,我现在没有“结果”键。然后我可以使用带有以下 JsonPath $[*] 的分类器。此解决方法对我来说效果很好。
玩得开心!