如何 python 中 rpy2 中 R 数据帧的 select 列?
how to select columns from R dataframe in rpy2 in python?
我在 python 的 rpy2 中有一个数据框,我想从中提取列。此 R 代码的 rpy2 等价物是什么?
df[,c("colA", "colC")]
这适用于获取第一列:
mydf.rx(1)
但是我怎样才能拉出一组列,例如第一、第三和第五?
mydf.rx([1,3,5])
无效。也没有:
mydf.rx(rpy2.robjects.r.c([1,3,5]))
我认为答案是:
# cols to select
c = rpy2.robjects.IntVector((1,3))
# selection from df
mydf.rx(True, c)
或者,您可以将 R 数据框传递到 Python pandas 数据框并子集生成的 1、3、5 列:
#!/usr/bin/python
import rpy2
import rpy2.robjects as ro
import pandas as pd
import pandas.rpy.common as com
# SOURCE R SCRIPT INSIDE PYTHON
ro.r.source('C:\Path\To\R script.R')
# DEFINE PYTHON DF AS R DF
pydf = com.load_data('rdf')
cols = pydf[[1,3,5]]
我发现最好的方法是做这个简单的事情:
from rpy2.robjects.packages import importr
from rpy2.robjects import pandas2ri
import rpy2.robjects as robjects
dataframe = robjects.r('data.frame')
df_rpy2 = dataframe([1,2,],[5,6])
df_pd = pd.DataFrame({'A': [1,2], 'B': [5,6]})
base = importr('base') #Creates an instance of R's base package
pandas2ri.activate() #Converts any pandas dataframe to R equivalent
base.colnames(df_pd) #Finds the column names of the dataframe df_pd
base.colnames(df_rpy2) #Finds the column names of the dataframe df_rpy2
输出为:
R object with classes: ('character',) mapped to:
<StrVector - Python:0x7fa3504d3048 / R:0x10f65ac0>
['X1L', 'X2L', 'X5L', 'X6L']
R object with classes: ('character',) mapped to:
<StrVector - Python:0x7fa352493548 / R:0x103b6e40>
['A', 'B']
这适用于使用 pandas 和 rpy2 创建的数据帧。希望这对您有所帮助!
我在 python 的 rpy2 中有一个数据框,我想从中提取列。此 R 代码的 rpy2 等价物是什么?
df[,c("colA", "colC")]
这适用于获取第一列:
mydf.rx(1)
但是我怎样才能拉出一组列,例如第一、第三和第五?
mydf.rx([1,3,5])
无效。也没有:
mydf.rx(rpy2.robjects.r.c([1,3,5]))
我认为答案是:
# cols to select
c = rpy2.robjects.IntVector((1,3))
# selection from df
mydf.rx(True, c)
或者,您可以将 R 数据框传递到 Python pandas 数据框并子集生成的 1、3、5 列:
#!/usr/bin/python
import rpy2
import rpy2.robjects as ro
import pandas as pd
import pandas.rpy.common as com
# SOURCE R SCRIPT INSIDE PYTHON
ro.r.source('C:\Path\To\R script.R')
# DEFINE PYTHON DF AS R DF
pydf = com.load_data('rdf')
cols = pydf[[1,3,5]]
我发现最好的方法是做这个简单的事情:
from rpy2.robjects.packages import importr
from rpy2.robjects import pandas2ri
import rpy2.robjects as robjects
dataframe = robjects.r('data.frame')
df_rpy2 = dataframe([1,2,],[5,6])
df_pd = pd.DataFrame({'A': [1,2], 'B': [5,6]})
base = importr('base') #Creates an instance of R's base package
pandas2ri.activate() #Converts any pandas dataframe to R equivalent
base.colnames(df_pd) #Finds the column names of the dataframe df_pd
base.colnames(df_rpy2) #Finds the column names of the dataframe df_rpy2
输出为:
R object with classes: ('character',) mapped to:
<StrVector - Python:0x7fa3504d3048 / R:0x10f65ac0>
['X1L', 'X2L', 'X5L', 'X6L']
R object with classes: ('character',) mapped to:
<StrVector - Python:0x7fa352493548 / R:0x103b6e40>
['A', 'B']
这适用于使用 pandas 和 rpy2 创建的数据帧。希望这对您有所帮助!