在 rpy2 中分配数据帧列
Assigning dataframe columns in rpy2
在 rpy2 中等价于 say:
dataf <- data.frame(a=c(1,2,3), b=c(4,5,6))
dataf$a <- dataf$a + 1
因为 dataframe.rx2
是 [[.dataframe
的 rpy2 等价物,我本以为答案会是:
d = {'a': robjects.IntVector((1,2,3)), 'b': robjects.IntVector((4,5,6))}
dataf = robjects.DataFrame(d)
dataf.rx2["a"] = dataf.rx2("a").ro + 1
但是会出现以下错误:
RRuntimeError: Error in `[[<-.data.frame`(list(a = 1:3, b = 4:6), "a", 2:4) :
argument "value" is missing, with no default
我也试过:
dataf.rx["a"] = dataf.rx("a").ro + 1
dataf[dataf.index("a")] = dataf.rx2("a").ro + 1
运气不好
这应该有效:
i = dataf.colnames.index('a')
dataf[i] = dataf[i].ro + 1
事实证明这也有效:
dataf.rx[True, 'a'] = dataf.rx(True, 'a').ro + 1
编辑:
但是这个解决方案并不完全等同于上面的解决方案。它适用于这种情况,但不适用于其他情况。
例如
In [18]: d = {"a": ro.StrVector(["a","b","c"]), "b": ro.IntVector([1,2,3])}
In [19]: dataf = ro.DataFrame(d)
In [20]: print ro.r.levels(dataf.rx2("a"))
[1] a b c
In [21]: dataf.rx[True, "a"] = ro.r.relevel(dataf.rx2("a"), "b")
In [22]: print ro.r.levels(dataf.rx2("a"))
[1] a b c
接受的解决方案在哪里:
In [23]: i = dataf.colnames.index("a")
In [24]: dataf[i] = ro.r.relevel(dataf.rx2("a"), "b")
In [25]: print ro.r.levels(dataf.rx2("a"))
[1] b a c
在 rpy2 中等价于 say:
dataf <- data.frame(a=c(1,2,3), b=c(4,5,6))
dataf$a <- dataf$a + 1
因为 dataframe.rx2
是 [[.dataframe
的 rpy2 等价物,我本以为答案会是:
d = {'a': robjects.IntVector((1,2,3)), 'b': robjects.IntVector((4,5,6))}
dataf = robjects.DataFrame(d)
dataf.rx2["a"] = dataf.rx2("a").ro + 1
但是会出现以下错误:
RRuntimeError: Error in `[[<-.data.frame`(list(a = 1:3, b = 4:6), "a", 2:4) :
argument "value" is missing, with no default
我也试过:
dataf.rx["a"] = dataf.rx("a").ro + 1
dataf[dataf.index("a")] = dataf.rx2("a").ro + 1
运气不好
这应该有效:
i = dataf.colnames.index('a')
dataf[i] = dataf[i].ro + 1
事实证明这也有效:
dataf.rx[True, 'a'] = dataf.rx(True, 'a').ro + 1
编辑:
但是这个解决方案并不完全等同于上面的解决方案。它适用于这种情况,但不适用于其他情况。
例如
In [18]: d = {"a": ro.StrVector(["a","b","c"]), "b": ro.IntVector([1,2,3])}
In [19]: dataf = ro.DataFrame(d)
In [20]: print ro.r.levels(dataf.rx2("a"))
[1] a b c
In [21]: dataf.rx[True, "a"] = ro.r.relevel(dataf.rx2("a"), "b")
In [22]: print ro.r.levels(dataf.rx2("a"))
[1] a b c
接受的解决方案在哪里:
In [23]: i = dataf.colnames.index("a")
In [24]: dataf[i] = ro.r.relevel(dataf.rx2("a"), "b")
In [25]: print ro.r.levels(dataf.rx2("a"))
[1] b a c