So-net無料ブログ作成

IBM SPSS Modelerで一般化線形モデル(GLM):二項分布 [データサイエンス、統計モデル]

ポアソン回帰は、こちら。
http://skellington.blog.so-net.ne.jp/2013-05-23

二項分布の場合は、少々ややこしかったです。(^^;

N個の中からy個を選び出す場合どうするか?


Rで書く場合は、
 fit.xf <- glm(cbind(y, N - y) ~ x + f, data = d, family = binomial)
と書けばOKです。

リンク関数を正確に書くならば、
 fit.xf <- glm(cbind(y, N - y) ~ x + f, data = d, family = binomial(link = "logit"))
と書きます。

IBM SPSS Modeler(Clementine)でどう設定するのか?

まず、Nとyの設定ですが、フィールドタブでこの様に設定します。


エキスパートタブでは、こうです。


これで、RのアウトプットとModelerのアウトプットが同じになることが確認できました。

ちなみに、xとfの交互作用を扱う場合ですが、Rでは、
 fit.xf <- glm(cbind(y, N - y) ~ x * f, data = d, family = binomial)
と書きます。

Modelerの設定は、

モデルタブのモデルタイプ:
主効果のみ → 主効果およびすべての2方向交互作用
と変更します。

こちらも、Rと同じアウトプットが得られました。

nice!(39)  コメント(0)  トラックバック(0) 
共通テーマ:学問