ノンパラと線形モデル

母分布が正規分布に従っていなさそうな場合、ノンパラ検定と一般化線形モデルを使うのではどちらがよい(検出力が高い?)のだろうか。

以下、http://aoki2.si.gunma-u.ac.jp/lecture/Kentei/nonpara.htmlを引用。

まず、パラメトリックな手法とは?

  • 母集団の特性を規定する母数についてある仮説を設けるもので,平均値の差の検定(t 検定と略称されることが多い)や分散分析(F 検定と略称されることがある)などがこれに該当する。これらの検定手法では,母集団の正規性や等分散性が仮定される。

おそらく、この母集団の正規性を二項分布やポワソン分布にまで拡張し、それをlink関数を通して使えるようにしたのが"一般化"線形モデルだろう。

さらに、

ノンパラメトリックな手法

  • 母集団の分布型(母数)について一切の仮定を設けない。このため,分布によらない手法 と呼ばれることもある。特に,標本サイズが小さい場合には,それから求められた統計量の分布型は不正確なことが多く,パラメトリックな手法を適用することは不適切になりやすい。しかし,ノンパラメトリックな手法は常に適用可能である。

さらに、

ここで注意しなければならない点は,パラメトリックな手法はかなり制限(前提条件)が多く,ノンパラメトリックな手法はそのような制限が少ないからといって,ノンパラメトリックな手法を乱用してはいけないということである。

もし,パラメトリックな手法を適用できる条件がそろっているにもかかわらずノンパラメトリック検定を用いると,後述する検出力(対立仮説が正しいときに帰無仮説を棄却できる確率)が低下するという問題が生ずる。

しかし,逆に言えば,パラメトリックな手法を用いるための前提条件が完全に満たされないときに,ノンパラメトリックな手法を適用して帰無仮説が棄却されたとすれば,その結果はより妥当性を持つであろう。

つまり、標本数が少なくて、十分に記述統計ができない場合(母集団の分布が把握できそうにない場合)はノンパラにしたほうが無難なのか。