Pandas Python- read_csv 没有读取每一行的完整数据
Pandas Python- read_csv not reading complete data on each row
我正在使用 read_csv 分块读取相当大的 csv(只读取第一行进行测试)。
data = read_csv('VOD_Properties.csv', nrows=1, low_memory=False)
print(data)
结果:
PROPERTIES
0 {"video_id":241338,"play_uuid":"0d293b16-566a-...
excel中的原始数据:
{"video_id":241338,"play_uuid":"0d293b16-566a-46e7-ac90-e3caa602a527","seconds":0.116,"current_state":"PLAY","total_seconds":100.032}
为了测试数据是否只是没有显示,我将其转换为字符串:
string_data = data.to_string()
并打印字符串的最后几个字符以查看它们是否为“...”:
6-566a-...
我试过调整参数但没有任何改进。
提前致谢。
整行实际上是正确读取的,只是在打印时 pandas 用省略号“...”截断了宽列。
您可以更改 pandas' 列宽显示阈值,如下所示:
How to remove ellipsis from a row in a Python Pandas series or data frame, shown when long lines/wide columns are truncated?
pandas.set_option('display.max_colwidth', 1000) # or whatever width
我正在使用 read_csv 分块读取相当大的 csv(只读取第一行进行测试)。
data = read_csv('VOD_Properties.csv', nrows=1, low_memory=False)
print(data)
结果:
PROPERTIES
0 {"video_id":241338,"play_uuid":"0d293b16-566a-...
excel中的原始数据:
{"video_id":241338,"play_uuid":"0d293b16-566a-46e7-ac90-e3caa602a527","seconds":0.116,"current_state":"PLAY","total_seconds":100.032}
为了测试数据是否只是没有显示,我将其转换为字符串:
string_data = data.to_string()
并打印字符串的最后几个字符以查看它们是否为“...”:
6-566a-...
我试过调整参数但没有任何改进。
提前致谢。
整行实际上是正确读取的,只是在打印时 pandas 用省略号“...”截断了宽列。
您可以更改 pandas' 列宽显示阈值,如下所示: How to remove ellipsis from a row in a Python Pandas series or data frame, shown when long lines/wide columns are truncated?
pandas.set_option('display.max_colwidth', 1000) # or whatever width