我应该如何将状态 N 作为权重变量？

Question

我的数据结构是：

State           N           Var1            Var2
Alabama         23          54              42
Alaska          4           53              53
Arizona         53          75              65

Var1 和 Var2 是州级别的汇总百分比值。 N 是每个州的参与者人数。我想运行 Var1 和 Var2 之间的线性回归，考虑 N 作为权重，在 SPSS 中最好的方法是什么？

Answer 1

您可以使用 WEIGHT BY 或在 REGRESSION 上使用子命令 - 以下示例。

DATA LIST FREE / State (A15) N  Var1  Var2 (3F2.0).
BEGIN DATA
Alabama         23          54              42
Alaska          4           53              53
Arizona         53          75              65
END DATA.

WEIGHT BY N.
REGRESSION
  /MISSING LISTWISE
  /STATISTICS COEFF OUTS R ANOVA
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN 
  /DEPENDENT Var1
  /METHOD=ENTER Var2.

*Or using subcommand.
WEIGHT OFF.    
REGRESSION
  /MISSING LISTWISE
  /REGWGT=N
  /STATISTICS COEFF OUTS R ANOVA
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN 
  /DEPENDENT Var1
  /METHOD=ENTER Var2.

您可以亲眼看到这两个程序产生相同的估计值。如果你运行没有加权或使用 REGWGT 子命令的回归，它将导致这个例子的不同估计。

Answer 2

使用N作为权重的原因是什么？如果你确实想这样做，因为回归将权重视为复制权重，你需要注意你的自由度。

我应该如何将状态 N 作为权重变量？

How should I incorporate State N as a weight variable?

spss

linear-regression

weighted