如何在 R 中使用 sqldf 来操作本地数据帧?
How to use sqldf in R to manipulate local dataframes?
我试图在 RStudio 中分析一些源自 MySQL 数据库的数据,因此我使用 dbConnect 连接到所述数据库,并复制了该项目所需的单个 table。然后我使用 R 稍微清理了数据,去掉了一些不需要的列。到目前为止,还不错。
当我意识到我的数据有一些异常值时,我的问题就出现了,我需要删除包含明显异常值数据的行。这是我在 SQL 做的没有问题的事情,但缺乏有效做的 R 经验。所以我调查了一下,发现了 sqldf,这是一个自称为使用 SQL 命令来操纵 data.frames 的方法的包。完美的!但是我在这方面遇到了一些麻烦,因为 sqldf 似乎需要某种数据库连接。有没有一种方法可以简单地连接到我在 RStudio 的全局环境中的 data.frame?
问:在将数据导入 R 之前,您不能在 MySQL 中操作数据吗?
A: 是的,必要时我也会这么做,但我想更好地理解 sqldf。
尝试:
options(sqldf.driver = "SQLite")
sqldf("select * from book;", drv = 'SQLite')
我试图在 RStudio 中分析一些源自 MySQL 数据库的数据,因此我使用 dbConnect 连接到所述数据库,并复制了该项目所需的单个 table。然后我使用 R 稍微清理了数据,去掉了一些不需要的列。到目前为止,还不错。
当我意识到我的数据有一些异常值时,我的问题就出现了,我需要删除包含明显异常值数据的行。这是我在 SQL 做的没有问题的事情,但缺乏有效做的 R 经验。所以我调查了一下,发现了 sqldf,这是一个自称为使用 SQL 命令来操纵 data.frames 的方法的包。完美的!但是我在这方面遇到了一些麻烦,因为 sqldf 似乎需要某种数据库连接。有没有一种方法可以简单地连接到我在 RStudio 的全局环境中的 data.frame?
问:在将数据导入 R 之前,您不能在 MySQL 中操作数据吗?
A: 是的,必要时我也会这么做,但我想更好地理解 sqldf。
尝试:
options(sqldf.driver = "SQLite")
sqldf("select * from book;", drv = 'SQLite')