我应该如何将状态 N 作为权重变量?

How should I incorporate State N as a weight variable?

我的数据结构是:

State           N           Var1            Var2
Alabama         23          54              42
Alaska          4           53              53
Arizona         53          75              65

Var1Var2 是州级别的汇总百分比值。 N 是每个州的参与者人数。我想 运行 Var1Var2 之间的线性回归,考虑 N 作为权重,在 SPSS 中最好的方法是什么?

您可以使用 WEIGHT BY 或在 REGRESSION 上使用子命令 - 以下示例。

DATA LIST FREE / State (A15) N  Var1  Var2 (3F2.0).
BEGIN DATA
Alabama         23          54              42
Alaska          4           53              53
Arizona         53          75              65
END DATA.

WEIGHT BY N.
REGRESSION
  /MISSING LISTWISE
  /STATISTICS COEFF OUTS R ANOVA
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN 
  /DEPENDENT Var1
  /METHOD=ENTER Var2.

*Or using subcommand.
WEIGHT OFF.    
REGRESSION
  /MISSING LISTWISE
  /REGWGT=N
  /STATISTICS COEFF OUTS R ANOVA
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN 
  /DEPENDENT Var1
  /METHOD=ENTER Var2.

您可以亲眼看到这两个程序产生相同的估计值。如果你 运行 没有加权或使用 REGWGT 子命令的回归,它将导致这个例子的不同估计。

使用N作为权重的原因是什么?如果你确实想这样做,因为回归将权重视为复制权重,你需要注意你的自由度。