統計関係

みんなで築く

Garamszegi, L.Z., Calhim, S., Dochtermann, N., Hegyi, G., Hurd, P., Jorgensen, C., Kutsukake, N., Lajeunesse, M. J., Pollard, K. A., Schielzeth, H., Symonds, M. R. E. & Nakagawa, S. Changing philosophies and tools for statistical inference…

現時点のジツリキ

はっきり言って統計科学もかなり多様化してきているみたいで,私のような末端ユーザがフォローできる範囲は限られてくるだろう。それはおそらく生物系(とりわけ実験系)にいる人はそうだろう。だけども,実験系でこそデータ同化とかグラフ理論のような解析…

新宿に行った

岩波講座 物理の世界 物理と情報〈3〉ベイズ統計と統計物理作者: 伊庭幸人出版社/メーカー: 岩波書店発売日: 2003/08/27メディア: 単行本購入: 13人 クリック: 151回この商品を含むブログ (44件) を見るいや,さすがに新宿は東京の中心街。すなわち日本の中…

赤本の更新文章?があった。 http://www.maths.bath.ac.uk/~jjf23/ELM/ランダム効果とかの章なので,多少は役立った。

body uwaba

WinBUGSのインストール。 ベイズ統計データ解析で勉強中。経験ベイズとか。

以前の続き。

leafleaf) dataleaf=factor(leaf),disc=factor(disc),conc) ここで,4つの葉っぱからそれぞれ4つの穴を開けて,カルシウム濃度を調べる。で葉っぱごとにどれだけばらつくか(分散)を調べたい場合を考えよう。どのようなときにこの解析を使うかといわれれ…

最近暑さのせいか寝不足だ。そして,明日から盛岡に行きます。 成功を祈る。 ∀はfor all

> sqr.obs data [,1] [,2] [1,] 5 7 [2,] 13 12 > sqr.obs(data)->data.obs [,1] [,2] [1,] 0.1351351 0.1891892 [2,] 0.3513514 0.3243243 > ES.w2(data.obs)->data.w > data.w [1] 0.09678053 #Cohenのeffect sizeを算出。 > pwr.chisq.test(w=data.w,df=1…

先日のやり方は間違ってました。 分割表の確率の計算方法が,期待値算出になってました。 正しくは,実際に得られたデータの比率を計算するだけです。 まず,以下の関数を再度定義。 sqr.obsで,先日の例をおさらい。 > data [,1] [,2] [1,] 5 7 [2,] 13 12 …

2*2の分割表の検定と検出力の計算方法について 以下のようなデータが得られたする。 薬投与 未投与 効果あり 5 7 効果なし 13 12 さて,この薬に効果はあるのでしょうか? (ぱっと見,完全になさそうですけど。) > matrix(c(5,13,7,12),ncol=2)->data > da…

無駄に

統計関連学会参加申し込みしてしまった。

分散成分

混合モデル。。。わかっていたような気がしたけど,全然わかってなかったよ。 改めて確認。

忘れそう

前回の続き。 > head(data) #またデータを作り直した。 leaf disc conc 1 1 1 0.060311173 2 1 2 0.225865086 3 1 3 0.003394487 4 1 4 0.020026101 5 2 1 0.004372889 6 2 2 0.393164132 > data$leafleaf) > data$leaf [1] 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4…

続き。

さて,ここで改めてランダム効果について記述する。 ランダム効果は,一昔前の統計の教科書では「変量効果」などと記述されている。英語では,random effectである。で,どのような時にこの「ランダム効果」を使うのか?以下はこちらやこちらを参考にしまし…

ランダム効果について

これからますます使われるであろう,ランダム効果について参考までに自分なりの解析法を提示します。 こちらにも似た記述はあります。データはこちらの本を参考にさせていただきました。解析にはR(2.7.1)を用います。 > leaf disc conc dataleaf,disc,conc) …

Intro1

イントロでお腹いっぱい。 (正規)線形モデルでは,残差平方和(RSS)は逸脱度。 残差標準誤差は,√(RSS/Df)。新しい関数 termplot() halfplot() MASS中のrlm():ロバスト回帰(外れ値に強くなる) lm()でweight指定で重み付け。

多項ロジックモデル(1)

パッケージneetの中の関数multinom、 パッケージVGAMの中の関数vglm を用いる

Mann-WhitneyのU検定の反対版。 説明変数が順序尺度で,目的変数が2値データ。

[R}

ついにStatistics: An Introduction Using Rが翻訳されます。これで生態学分野にも(今まで以上に)Rと一般化線形モデルが浸透するでしょう。 それまでにレジュメ作らなきゃ。

勘違い1

Rのglm関数などによってデータにモデルを当てはめた際、よく行う(?)summary関数による回帰係数の検定表。 実は今までsummary()で出力されるp値は検定の多重性を考慮していないと思っていた。しかし、summary()で出力される推定値のwald検定のp値は、その…

乱数と計算統計学(その1)

ネット等で調べてみた。あくまでメモ用。 モンテカルロ法(特定の分布や標本から観測値を生成する方法) モンテカルロ法は、複雑な過程をシミュレーションして統計手法が持つ標本特性を調べるもので、古くから概念的にはあった。 しかし、近年の計算機の発展…

最近

全然本業に身が入らない。統計関係の勉強ばかりしている気がする。

モデル選択基準(Wikipedia(English版)より)

AIC(赤池情報量基準) BIC(ベイズ情報量基準) MallowのCp DIC MDL MML ステップワイズ回帰 いずれもモデルの当てはまりのよさ(Devianceとか)とモデルの自由度(用いたデータ数)のバランスをとって、最適なモデルを選ぶ。

quantile regression

先日のNowakさんの論文の解析で、用いていたquantile regressionとは何ぞや?と思いググってみた。多分和訳は「分位点回帰」で、ノンパラメトリック回帰の一部と思われる。 普段よく使う回帰は最小2乗法により、パラメータを推定するが、生態学のような説明…

モデル選択

モデル選択が最近流行り、さまざまな場面で聞くけど、実際に使っている論文に未だ出会ったことはない。って、大して論文読んでないからだろうな。

相関と回帰

回帰係数(b)と相関係数(r)の関係b=SSXY/SSX(共分散をxの分散(平均平方)で割ったもの) b=r*sy/sx(相関係数にyとxの標準偏差の比をかける)r=SSXY/sqrt(SX*SY)(積和をそれぞれの平方和で割る。もしくは共分散を平均平方で割る)ちなみに、分散分析で…

相関と回帰の復習

改めて、相関と回帰の復習をした。

セロトニンと行動連鎖

非常に難しい。どのように解析するかが非常に重要。 例えば、3群以上の場合はやはり多重比較するべきなのだろうか。推定することに意味があるのか。目的変数が順序尺度の場合は?(カテゴリカルデータ解析入門で復習せねば)

無題

自分の本筋とかけ離れていっているような気がする。だいじょうぶかなぁ。