忘れそう

前回の続き。

> head(data) #またデータを作り直した。
  leaf disc        conc
1    1    1 0.060311173
2    1    2 0.225865086
3    1    3 0.003394487
4    1    4 0.020026101
5    2    1 0.004372889
6    2    2 0.393164132
> data$leaf<-as.factor(data$leaf)
> data$leaf
 [1] 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4
Levels: 1 2 3 4

> model1<-lm(conc~leaf,data=data)
> anova(model1)
Analysis of Variance Table

Response: conc
          Df  Sum Sq Mean Sq F value Pr(>F)
leaf       3 0.05791 0.01930  0.5638 0.6492
Residuals 12 0.41090 0.03424 

ランダム効果の場合,1層だけなら普通の一元配置と同様のANOVA表で対応できる。ただこの例の場合,葉ごとに4枚という同じサンプル数であることに注意しなければならない。

で,この場合残差のMS=0.034なので,同じ葉でも(分散成分が)0.034と推定される。しかしleafの分散成分は(0.019-0.034)/4=-0.0396となる。つまり,leaf間のバラツキはあまりないことがわかる。これは葉間のバラツキより葉内のバラツキの方が大きいことを示しており,技術的な問題があるのかもしれないと考えられる。

で,leafのバラツキの推定方法だけど,何でANOVA表のMSの値じゃないんだと。思いますよね。
ぢつはANOVA表でたたき出される値は,葉という効果に対する期待平均平方になる。要は,普通の分散分析なら,leafの分散(平均平方)というのは,(全平均-各群の平均)をそれぞれの群内サンプル数倍してそれを自由度で割ったもの。もちろんそれには誤差というか残差も含まれているわけ。

だけどランダム効果の場合は,leafの差に興味があるわけではなく,leafという母集団が持つ分散\sigma^2_Sを推定したい。ので,leafの持つMSから,残差のMSを引き,それを4枚分のサンプルを使ったので,4で割る(これがイマイチよくわからん)。おそらく,固定効果の場合は,分散成分がそれぞれの処理区で構成されるため,自由度で割る必要があった。んだけど,ランダム効果の場合は\sigma^2_Sのみを推定すればよい。