如何在 pandas 中使用 API 端点下载 .csv 文件

how to download .csv file using API Endpoint in pandas

我想使用 pandas 从 API 端点下载一个 csv 文件。我正在使用以下代码:

df=pd.read_csv('https://data.cityofnewyork.us/resource/nu7n-tubp.csv').

然而,生成的数据框只有 1,000 行,尽管数据集要大得多(大约 121k 行)。如何下载所有行?

我试图用 nrows 指定一个大于 1,000 的数字,但我得到了相同的结果。

Socrata typically requires you to page through data, which is set at 1,000 rows. You could modify it by increasing it by using the $limit parameter. Based on the data set page,这大约是 122k 行,所以可以使用 130k 的限制来获取它们:

df=pd.read_csv('https://data.cityofnewyork.us/resource/nu7n-tubp.csv?$limit=130000')

您可能还想探索 SodaPy 图书馆。