みんなで築く

Garamszegi, L.Z., Calhim, S., Dochtermann, N., Hegyi, G., Hurd, P., Jorgensen, C., Kutsukake, N., Lajeunesse, M. J., Pollard, K. A., Schielzeth, H., Symonds, M. R. E. & Nakagawa, S. Changing philosophies and tools for statistical inferences in behavioral ecology. Behavioral Ecology 20: 1363-1375

http://beheco.oxfordjournals.org/content/20/6/1363.full



有意差いや,p値至上主義の牙城を崩すのは難しいでしょうが,ここ10年ほどでジョジョに変わってきているのは誰も(統計等を少しかじれば)が感じるところ。この論文では,AICなどの情報理論の手法,ベイズの手法,そしてeffect sizeの手法を例を交えながら軽く説明しています。


やはり個人的に印象に残ったのが「repeatability」。つまり同一サンプルから複数回データを得ることですが,前までは擬似反復とか(nの水増し)言われてた気がしないでもないですが,個体内のバラツキ(もしくは観察バラツキ)を計測することによって,その推定精度をあげること。結局,混合モデル(さらにはベイズ)に落ち着くのですが,そのバラツキを測定する重要性はおおいにあるでしょう。例えば,ある個体を複数回記録して,ただ平均値をプロットしてそれで相関関係をみるよりかは,バラツキを含めた解析をする方が変なバイアスに邪魔されないし,精度が上がる。当たり前です。しかし,この当たり前な部分をやっていく必要がある。


そして様々な手法があるけども,必ずしも新しい手法がいいわけではない。新旧手法を試して,自分のデータの前提をよく踏まえ吟味する必要がある。何なら,電子付録(electronic appendices)に生データを載せることで,別の見方を読者もできるし,別の人によって,より詳しい解析もできるかもしれない。何より情報(データ)の共有は総合的な解析(系統関係を考慮したメタ解析)とかにより重要になる。


勝手な意訳ですが,いやホントに素晴らしいと思いました。著者のBeStatというサイトも面白そう。ますます複雑に解析できる時代が来る。そんな中でデータ屋と処理屋が場所を共有できるのはいいですね。