通过 API 访问 kaggle 数据集

Accessing kaggle datasets through its API

我希望处理 Kaggle 上可用的一些 public 数据集。 是否可以使用 RStudio 通过其 API 访问 kaggle 数据集?

干杯, 晚饭

Kaggle just launched their public API in February 2018 (so earlier this year). According to their Github repository, Kaggle/kaggle-api,Kaggle 已经(至少到目前为止)使他们的 API 可访问 "using a command line tool implemented in Python".

我也很高兴发现 Kaggle 的 API 的存在,同样,如果有人在R. 我找不到任何人,所以我自己写了一个,你可以在这里找到:https://github.com/mkearney/kaggler。从我创建回购协议到现在还不到一周,所以我还不能说它的可靠性,但现在它似乎是最好的起点。而且,作为记录,只要人们愿意使用它,我完全有意保持至少最低水平的包支持(假设没有热心的第三方介入他们自己的 R 包),但是 API 本身是新的,因此可能还需要几个月的时间才能有任何真正稳定的选择。

;;

此外,虽然我完全理解你的问题的意思,但我认为值得指出的是,从技术上讲,Rstudio 是一个集成开发环境 (IDE) 而不一定是 source/library/program将您连接到非 Rstudio 网络 APIs。您实际上要寻找的是一个 R extension/library/package,它被设计为充当 Kaggle 的 API 的 wrapper/client/interface。当然,这种区别在很大程度上是微不足道的,因为如果你在 Rstudio(一个优秀的、开源的以 R 为中心的 IDE)中工作来与外部 API 交流,比如 Kaggle,那么你 "access[ing] kaggle datasets through its API using RStudio"。但是为了在信用到期时给予信用,更准确地说你希望利用 {Rstudio} 和 {pkgname} 包通过 R 环境 .

与 Kaggle 的 API 通信