pd.read_json 在 aws 中使用时出错
pd.read_json error when using in aws
我是 aws 和 json 文件的新手。我正在尝试使用代码读取 aws 实例中的 json 文件:pd.read_json('train.json') 但我收到 ValueError 消息:
ValueError:解码数组值 (2) 时发现意外字符
json 文件是从 kaggle 比赛中下载的:https://www.kaggle.com/c/statoil-iceberg-classifier-challenge/data。有两列是图像数据,其中一些数字是这样的“-27.878360999999998”
我在本地计算机上 运行 时没有收到任何错误消息。在aws实例(Deep Learning AMI -Amazon Linux--2-0)中,我尝试使用绝对路径,但它不起作用。一件事是,我可以读取其他 json 文件,在该实例中使用相同的代码行。只是无法读取这个包含长数字的 json 文件。
这是数据的样子,我在本地计算机上获取数据框。
'train.json' to dataframe
服务器中的python、pandas与我本地电脑的版本相同或更新。
提前致谢。
我遇到了同样的问题,我找到的解决方法是:
- 使用任何解压工具解压缩 json.7z 文件。
- 此处将提取文件:'processed/data/train.json'。
该文件在我的 AWS AMI 上使用 pandas 打开时有效。
希望对您有所帮助。
我是 aws 和 json 文件的新手。我正在尝试使用代码读取 aws 实例中的 json 文件:pd.read_json('train.json') 但我收到 ValueError 消息:
ValueError:解码数组值 (2) 时发现意外字符
json 文件是从 kaggle 比赛中下载的:https://www.kaggle.com/c/statoil-iceberg-classifier-challenge/data。有两列是图像数据,其中一些数字是这样的“-27.878360999999998”
我在本地计算机上 运行 时没有收到任何错误消息。在aws实例(Deep Learning AMI -Amazon Linux--2-0)中,我尝试使用绝对路径,但它不起作用。一件事是,我可以读取其他 json 文件,在该实例中使用相同的代码行。只是无法读取这个包含长数字的 json 文件。
这是数据的样子,我在本地计算机上获取数据框。
'train.json' to dataframe
服务器中的python、pandas与我本地电脑的版本相同或更新。
提前致谢。
我遇到了同样的问题,我找到的解决方法是:
- 使用任何解压工具解压缩 json.7z 文件。
- 此处将提取文件:'processed/data/train.json'。 该文件在我的 AWS AMI 上使用 pandas 打开时有效。
希望对您有所帮助。