✨ Visual Editor
close
warning

Thread Truncated

Only the first 20 tweets are shown to ensure high-quality rendering and prevent image size issues.

arrow_forward
135°

40px
16px

16px
黒木玄 Gen Kuroki
@genkuroki
#統計 P.D.Hoffさんの本(なぜか『標準ベイズ統計学』という挑発的な題で翻訳された)からの非ベイズ的方法との比較の節の引用。赤字は私によるコメント。

この部分はひどくミスリーディングなので、この本を読む人は騙されないように注意した方がよいと思いました。

よりにもよってWaldの信頼区間!😱
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 n人中0人というデータから、割合パラメータθの推定値を0/n=0とすることの解釈。これは最尤推定値。

⭕️正しい解釈:n人中0人というデータに最もモデルがフィットする割合パラメータ値は0である。

❌現実の割合を0だと推定した。

モデルと現実を混同することは典型的に非科学的です。
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 尤度は単にモデルのデータへのフィッティングの度合いの指標に過ぎなかったことを思い出しましょう。

n人中感染者は0人というデータから尤度最大化で求めた割合の推定値0/n=0は、単にモデルがデータに最も適合するパラメータ値を求めただけで、現実の感染者の割合を求めているのではないです。
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 こういう尤度の定義と意味に戻れば当たり前の話を蔑ろにするから、添付画像に引用した部分のようなおかしな説明になってしまうのです。

尤度は決して「もっともらしさ」ではありません。

モデルのデータの数値への適合度の指標の1つでしかない。
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 非ベイズの代表例としてWaldの信頼区間を出して来たのもかなり酷い。その理由:

* Waldの信頼区間は二項分布モデルでの信頼区間の中では特に性質が悪い(有名)。

* Agresti-Coull(1998)ではWilsonのスコア信頼区間を勧めている。添付画像②

* Wilsonの信頼区間とBayes信用区間は非常に近い。
Thread imageThread image
黒木玄 Gen Kuroki
@genkuroki
#統計 非ベイズ的方法との比較で、引用しているAgresti-Coull(1998)でお勧めになっているWilsonのスコア信頼区間を扱わずに、誤差の大きなWaldの信頼区間の誰も使っていない補正を取り上げていることが不可解に見える理由は添付画像を見れば一目でわかります!続く

github.com/genkuroki/publ…
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 添付画像は二項分布モデルでのP値函数のプロットです。

ベイズ信用区間も区間推定の一種なので、対応するP値函数を定義できます。それがグラフ中の橙色のdashdot line.

WilsonとBayesianがほぼぴったり一致しています!

補正されたWaldとの違いは非常に大きい。

github.com/genkuroki/publ…
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 このように、ベイズ統計との一致について印象的で、参照している文献も勧めているWilsonのスコア信頼区間を取り上げずに、誤差が大きいことが知られているWaldの信頼区間を取り上げ、さらに全然普及していないその補正を取り上げて、ベイズ統計と関連付けている。

物凄いバイアスを感じます。
Thread imageThread imageThread image
黒木玄 Gen Kuroki
@genkuroki
#統計 以下のようなことをやっているように見える!😱

* 誤差の大きなWaldの信頼区間を目立つように取り上げ、非ベイズ的方法に問題があることを印象付けようとしている。

* その非ベイズ的方法の補正方法がベイズ的な方法になっていることに言及し、ベイズ的方法の優位性を印象付けようとしている。
黒木玄 Gen Kuroki
@genkuroki
#統計 しかし、R言語のprop.testで採用されているWilsonのスコア信頼区間(ただしcorrest=Fで連続性補正はオフにすること!)が、ベイズ的な信用区間に非常によく一致しており、これがダメなら、ベイズ統計もダメだということになります。

方法の選択はトレーフォオフの問題でしかない。
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 こういうクォリティの「非ベイズ的方法との比較」が翻訳されて普及してしまうことは、我々の社会にとって損失になるのではないかと思いました。

妙なバイアスをかけずに、比較すれば面白い話になるし、実用的な知識にもなるのに困ったことだと思います。
Thread imageThread imageThread image
黒木玄 Gen Kuroki
@genkuroki
2つ前のツイートの訂正

❌correst=F
⭕️correct=F

この連続性補正がデフォルトでオンになっている仕様の普及はかなり困ったことだと個人的に思っています。

連続性補正を入れて使うくらいなら、確率を正確に計算する方法を使った方がお得だと思い。

Agresti-Coull(1998)で勧めているのも補正無版。
黒木玄 Gen Kuroki
@genkuroki
#統計

Agresti-Coull 1998 は以下の場所で読める。

scholar.google.co.jp/scholar?cluste…
黒木玄 Gen Kuroki
@genkuroki
#統計 P値函数と信頼区間の関係については以下のリンク先を参照。
黒木玄 Gen Kuroki
@genkuroki
相互リンク
黒木玄 Gen Kuroki
@genkuroki
#統計

各種P値函数の実装は添付画像の通り。

WaldよりもWilson (score)の方がシンプルまたは同じ程度。

信頼区間を計算する函数の実装では、Wilsonの側は二次方程式を解く必要が生じるので、Waldよりも少しだけ面倒になる。

github.com/genkuroki/publ…
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 Waldの信頼区間は「n人中y人」についてy/nが0と1から離れている場合にのみ有効な近似法を使っていることはよく知られているのに、y=0だとWaldの信頼区間が0の一点になってしまうことをわざわざ述べている。

狙って誤誘導している、または、入門レベルの知識が足りないのどちらかに見える。続く
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 添付画像は「n=20人中0人」というデータに対応するP値函数のプロット。Wilsonのスコア信頼区間を与えるP値函数の台はθ=0の一点に縮まっていない。Waldの信頼区間を与えるP値函数はθ=0で1になり、0<θ≤1で0になる。

本で引用されているAgresti-Coull 1998もWilsonの信頼区間を勧めている。
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 件の本の件の部分で引用されているAgresti-Coull 1998では、2次方程式を解いて求めるWilsonの信頼区間が優れていることを強調した上で、シンプルに計算できるWaldの信頼区間の補正を

 中点(両端の値の平均)がWilsonの信頼区間と一致する

という条件でシンプルに定義しています。続く
黒木玄 Gen Kuroki
@genkuroki
#統計 z = quantile(Normal(0,1), 1-α/2)とおいたとき、n回中k回成功というデータに関するWilsonの信頼区間の中点は、

p̃ = (k + z²/2)/(n + z²) = mean(Beta(k+z²/2, n-k+z²/2))

になります。続く
Generated by Thread Navigator
100%
workspace_premium Upgrade
Press + S to quick-export