統計

ひさかたぶりの投稿

こういうデータをメタアナリシスで解析する。 testが処理した群、contが対照群 testで病気になった人がtest_posで 全体がtest_total id test_pos test_total cont_pos cont_total 1 test1 5 177 6 144 2 test2 5 132 4 155 3 test3 2 23 33 47 4 test4 6 76 …

注意事項

Scientific reportsの著者への注意書きの統計ガイドライン。 サンプル数が10以下の時は、small sample size 正規性を仮定している検定が多いので、注意 多重比較に要注意 p値はp サンプル数が小さい時は、標準偏差ではなくrangeを示す。 サンプル数、比較対…

秀逸だと思う。

データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)作者: 久保拓弥出版社/メーカー: 岩波書店発売日: 2012/05/19メディア: 単行本購入: 16人 クリック: 163回この商品を含むブログ (29件) を見る買った、…

その2

さて、よく解析して、p値出して、その通りでしたー、みたいなことを書いてしまいますが、本当に重要なことは、その解析した際に推定された値、変数だったりするわけではないでしょうか。 ということで、より噛み砕こうというのが今回です。 fitted()は、当て…

薬指使えないだけで、こうも作業効率が下がるとは、、、

前回のおさらいから odds ratioの比較に、ただただ区間推定して比較してみたが、vcdパッケージには、woolf検定(層ごとにオッズ比は同じという帰無仮説を検定)をしてくれるパッケージもある。 library(vcd) woolf_test(data2) Woolf-test on Homogeneity of…

多次元の分割表

コンサルで多次元の分割表を考える機会があったので、メモを残す。 多次元の分割表を考えるうえで陥ってしまいがちなのが、「シンプソンのパラドックス」。要するに、多次元の分割表を勝手に統合したり、分割したりすると、誤った結果を導いてしまうかもしれ…

ジャックナイフ

基本的には、データから1つデータを取り出して、擬似値を計算する。それから、その擬似値の集合(データと同じ分だけできる)から統計量を計算する。 jack.mean { Mean.obs Pseudovalues for (i in 1:length(data)) { Data.minus.one Mean.minus.one Pseudo…

Ben Bolker氏によるサイト

http://glmm.wikidot.com/pkg-comparison

ベイズ入門

図解入門よくわかる最新ベイズ統計の基本と仕組み (How‐nual Visual Guide Book)作者: 松原望出版社/メーカー: 秀和システム発売日: 2010/12/14メディア: 単行本購入: 2人 クリック: 10回この商品を含むブログ (7件) を見る簡単な例で,うまく導入してある。…

練習

通常の回帰をベイズでやってみる。 基本のキ。まずデータの呼び出しから。 オゾン濃度と気温の関係について(のみ)解析してみる。 data(airquality) 通常の回帰(GLMで)。 model.glm Ozone ~ Temp, data = airquality, family = gaussian) summary(model1.…

test = "F" と"chisq"

Rでモデルを2つ作って,その2つのモデルの当てはまりを検定で(どちらかを帰無仮説として)評価したい場合よく anova(model1, model2, ...) を使います。この時,modelがどのような分布に従うかによって test = ""の中身が変わる。それを知るためには, su…

ぼつぼつ

仕事もある程度こなせるようになってきた(ハズ)なので,またRや統計の勉強もボツボツ始めよう。つーか論文書かなきゃ。

そこで

薬を飲んでも全然眠くならないので,以前から書きたかった論文紹介をする。 これから頑張って1週間に1本は読んでupしたいなぁ。 G. D. Ruxton and G. Beauchamp (2008) Time for some a priori thinking about post hoc testing. Behavioral Ecology 20: 690…

昨日の続き。

でも!あまり好まれていないglmmPQLではできた!idを50にしても。 > fglmmPQL fglmmPQL Linear mixed-effects model fit by maximum likelihood Data: dat2 Log-likelihood: NA Fixed: y2 ~ 1 (Intercept) 0.9502553 Random effects: Formula: ~1 | id (Inte…

glmmとかとか。

というか,正規分布だと個体ごとにデータが1つしかないと,ランダム効果を推測できないのか!?まずポワソン分布の場合。 > a b y id dat fglm fglm Call: glm(formula = y ~ 1, family = poisson, data = dat) Coefficients: (Intercept) 1.834 Degrees of…

Bolker et al. 2009 TREE vol.24の続き。

もちろん一概には言えないが,おおまなかな,,,おおまかな解析の手順が紹介されている。 固定効果・ランダム効果を決める。特に重要そうな交互作用だけも決める。だいたいランダム効果は5-6レベルが推奨,固定効果に対しては10-20ほど。 誤差構造とlink関…

Bolker et al. 2009読み

ふうむ,尤度比検定は固定効果に対してはサンプルサイズが大きくないとオススメできないとな。ランダム効果に対して使えと。

これこれ

ん〜,これからますます普及していきそうですね。リンクGeneralized linear mixed models: a practical guide for ecology and evolution Benjamin M. Bolker, Mollie E. Brooks, Connie J. Clark, Shane W. Geange, John R. Poulsen, M. Henry H. Stevens a…

確認3

こちらの続き。 random effectをどのように評価するか? > leaf disc concleaf) > dataleaf=factor(leaf),disc=factor(disc),conc) > summary(data) leaf disc conc 1:4 1:4 Min. :0.007103 2:4 2:4 1st Qu.:0.084563 3:4 3:4 Median :0.280326 4:4 4:4 Mean…

再確認2

階層構造と時系列構造のあるデータを解析することになり,忘れかけていた(?)混合モデルをココにメモする。 期待平均平方(expected mean squares);分散分析的に変量(ランダム)効果を扱おうとする場合,ANOVA表の(調整済みの)平均平方の項にoutputされ…

目的変数が3つ以上あるとき,多項ロジット分析を行うが,目的変数が順序尺度のときは累積ロジットモデルなどをよく使う。累積ロジットモデルはある基準のカテゴリー間に確率を算出する。

通称カエル本を図書館に注文。ざっと見た感じ非常にいい本です。WinBUGS及びベイズの入門書として名高い理由が分かった気がする。でも,久々にamazon見たら値段が跳ね上がっている気が…。