变量有连字符时的 Patsy 公式
Patsy formula when variable has a hypthen
我正在尝试将 statsmodel 线性回归函数与公式一起使用。我的示例数据来自 Pandas 数据框。我在公式中的列名有一个小问题。由于下游流程,我的列名中有连字符。例如:
+------+-------+-------+
+ VOLT + B-NN + B-IDW +
+------+-------+-------+
现在,保留连字符的原因之一是它允许 python 拆分字符串以供其他分析,因此我必须保留它。如您所见,当我想使用 VOLT ~ B-NN
使用 B-NN 对 VOLT 进行回归时,我遇到了一个问题,因为 patsy 公式找不到 B。
有没有办法告诉 Patsy B-NN 是一个变量名而不是 B 减去 NN?
谢谢。
北京日报
patsy 使用 Q
来引用名字,例如Q('B-IDW')
http://patsy.readthedocs.io/en/latest/builtins-reference.html#patsy.builtins.Q
my_fit_function("y ~ Q('weight.in.kg')", ...)
我正在尝试将 statsmodel 线性回归函数与公式一起使用。我的示例数据来自 Pandas 数据框。我在公式中的列名有一个小问题。由于下游流程,我的列名中有连字符。例如:
+------+-------+-------+
+ VOLT + B-NN + B-IDW +
+------+-------+-------+
现在,保留连字符的原因之一是它允许 python 拆分字符串以供其他分析,因此我必须保留它。如您所见,当我想使用 VOLT ~ B-NN
使用 B-NN 对 VOLT 进行回归时,我遇到了一个问题,因为 patsy 公式找不到 B。
有没有办法告诉 Patsy B-NN 是一个变量名而不是 B 减去 NN?
谢谢。
北京日报
patsy 使用 Q
来引用名字,例如Q('B-IDW')
http://patsy.readthedocs.io/en/latest/builtins-reference.html#patsy.builtins.Q
my_fit_function("y ~ Q('weight.in.kg')", ...)