使用来自 R 中 2 个不同数据帧的列变量进行 T 测试
T test using column variable from 2 different data frames in R
我正在尝试在 R 中进行 t 检验,以确定在美国西部出生的美国工人和外国出生工人的工资是否存在统计学上的显着差异。我有 2 个基于诞生的两组不同的数据框,并且想比较我在薪水上标题为 "adj_SALARY" 的列变量。为简单起见,假设 US_Born_west 帧中有 3 个观测值,Immigrant_West 数据帧中有 5 个观测值。
US_born_West$adj_SALARY=30000, 25000,22000
Immigrant_West$adj_SALARY=14000,20000,12000,16000,15000
#Here is what I attempted to run:
t.test(US_born_West$adj_SALARY~Immigrant_West$adj_SALARY, alternative="greater",conf.level = .95)
However I received this error message: "Error in model.frame.default(formula = US_born_West$adj_SALARY ~ Immigrant_West$adj_SALARY) :
variable lengths differ (found for 'Immigrant_West$adj_SALARY')"
Any ideas on how I can fix this? Thank you!
US_born_West$adj_SALARY
和 Immigrant_West$adj_SALARY
长度不等。使用 t.test
的公式接口给出了一个错误。我们可以将它们作为单独的向量传递。
t.test(US_born_West$adj_SALARY, Immigrant_West$adj_SALARY,
alternative="greater",conf.level = .95)
我正在尝试在 R 中进行 t 检验,以确定在美国西部出生的美国工人和外国出生工人的工资是否存在统计学上的显着差异。我有 2 个基于诞生的两组不同的数据框,并且想比较我在薪水上标题为 "adj_SALARY" 的列变量。为简单起见,假设 US_Born_west 帧中有 3 个观测值,Immigrant_West 数据帧中有 5 个观测值。
US_born_West$adj_SALARY=30000, 25000,22000
Immigrant_West$adj_SALARY=14000,20000,12000,16000,15000
#Here is what I attempted to run:
t.test(US_born_West$adj_SALARY~Immigrant_West$adj_SALARY, alternative="greater",conf.level = .95)
However I received this error message: "Error in model.frame.default(formula = US_born_West$adj_SALARY ~ Immigrant_West$adj_SALARY) :
variable lengths differ (found for 'Immigrant_West$adj_SALARY')"
Any ideas on how I can fix this? Thank you!
US_born_West$adj_SALARY
和 Immigrant_West$adj_SALARY
长度不等。使用 t.test
的公式接口给出了一个错误。我们可以将它们作为单独的向量传递。
t.test(US_born_West$adj_SALARY, Immigrant_West$adj_SALARY,
alternative="greater",conf.level = .95)