Hi,👋 we have updated the app and fixed multiple bugs. We are lacking funds, request to free user not to use Adblock. Ads are non intrusive. 😊

@genkuroki: #統計 所謂「頻度論」の信頼区間についてもベイズ統計での事後...

@genkuroki
25 views Oct 02, 2024
1
#統計 所謂「頻度論」の信頼区間についてもベイズ統計での事後分布のように使える道具があります。

それは岩田健太郎先生も確実に知っているものです。

もしも知らないなら統計学について完全な無知なままで研究をしていることになります。

問題: さてそれは何でしょうか?

解答の解説に続く!
2
#統計 問題解答

通常の信頼区間におけるベイズ統計の事後分布の類似物はP値です。

統計学を研究で使っていてP値の存在を知らないということはあり得ないのに、どうして正解を自力で思い付けない人たちが多いのか?

その辺のことはSander Greenlandさん達が繰り返し説明しています。続く
3
#統計 非常に残念なことに(特に医学研究の分野では)、P値と言えば「違いはゼロである」という帰無仮説(ゼロ仮説)のP値単体を意味することが多い。

ゼロ仮説のP値単独では、事後分布と同じようには使えません。

だから自明な正解を見逃してしまうのです!(nullism(後述)という病気の症状の1つ)
4
#統計 違いの指標として使うモデルのパラメータθ (例えば母平均の差や対数リスク比など)については、ゼロ仮説θ=0のP値(以下null P値と呼ぶ)だけではなく、任意の数値aに関する一般の検定仮説θ=aのP値も定義されています。

この後者の意味でのP値はちょうど事後分布と同じように使用できます。続く
5
#統計 データxに関するモデルMのパラメータθについての仮説θ=aのP値は、パラメータθの値の関数とみなせます。その関数をP値関数と呼びます。

パラメータθのP値関数はほぼパラメータθの事後分布と同じように使えます。

P値関数と事後分布のグラフの例

Thread image
6
#統計 添付画像は線形回帰 y=β₀+β₁x+u, u ~Normal(0,σ²)の場合のP値関数と事後分布のグラフ。

線形回帰では、事後分布としてβとlog σ²ついて平坦な事前分布を採用すると、通常のP値関数に付随する信頼区間(P値≥αとなるパラメータの値の範囲)とベイズ版信用区間は誤差無しにぴったり一致します。
Thread image
7
#統計 添付画像は、イベルメクチンの新型コロナに関する治験の論文にあった事後分布のグラフとP値関数のグラフを比較するために作ったものです。ベイズでもP値でも区間推定の結果はよく一致しています。

その論文のデータについてはベイズ統計を使ってもP値を使っても同じ結論が得られます。
Thread image
8
#統計 P値関数については『ロスマンの疫学第2版』のような日本語訳された本でも学べますが、個人的な意見では、より徹底した知識を得るために、Sander Greenlandさんの講演スライドを読むのが良いと思います。

biostatistics.ucdavis.edu/sites/g/files/…
Thread image
9
#統計 ちなみにGreenlandさんは、悪名高いsignificance (有意性)だけではなく、confidence intervalのconfidence (信頼)も過大広告の不適切な単語の使い方であると強調しています。

confidence(信頼)はcompatibility(相性の良さ)に置き換えられるべきです。

biostatistics.ucdavis.edu/sites/g/files/…
Thread image
10
#統計 Greenlandさん達のcompatibility (相性の良さ)という解釈は、McElreathさんのStatistical Rethinking (世界的に大人気の講義)において、ベイズ統計の信用区間でも採用されています。

compatibility (相性の良さ)の解釈にすれば通常の信頼区間とベイズ的な信用区間を同じように扱えます。続く
11
#統計 考えの足りない「信頼区間警察」の人達は「頻度論vs.ベイズ統計」という有害な対立図式を持ち出して、信頼区間と信用区間の両方をcompatibility (相性の良さ)で解釈することに反対するかもしれません。

しかし、GreenlandさんとMcElreathさんの考え方は非常に合理的で何も問題ありません。
12
#統計 100(1-α)%の信頼区間と信用区間はどちらも

データの数値と閾値αの設定で相性が良い(compatible)とみなされるモデルのパラメータの範囲

だと解釈されます。ただし、ベイズ版の信用区間ではモデルに事前分布を含め、事前分布も含めて相性を見ていることになります。その点が信頼区間と違う。
13
#統計 閾値αを5%に固定する必然性はないので、閾値αを0から1まで全部動かしたときの信頼区間と信用区間の全体を見ることは、通常のP値関数もしくは事後分布に付随するP値関数(の類似物)を見るのと同じことになります。
14
#統計 P値(=P値関数の値)は

データの数値とモデルのパラメータの値の設定の相性の良さ(compatibility)の指標の1つ

だと解釈されます。

「20人中6人」というデータの数値に関する母比率pのP値関数と事後分布のグラフ。これを見れば上の解釈の仕方が十分合理的なことが分かる。
Thread image
15
#統計 そのとき、

* 水準100(1-α)%での区間推定の結果はP値≥αとなるパラメータの値の範囲(閾値αの設定でデータの数値と相性が良いとみなされるパラメータの値の範囲)になる。

* 点推定値はP値(=データの数値との相性の良さ)が最大になるパラメータの値になる。

シンプルでクリアです!
Thread image
16
#統計 統計学ユーザーは

* nullism (帰無主義)
* dichotomania (二分法病)
* reification (モデルを疑わない病(意訳))

の3つの病気に注意する必要があることも、Greenlandさんの講演スライドでは強調されています。

biostatistics.ucdavis.edu/sites/g/files/…
Thread image
17
#統計 単峰性などに関する適当な条件の下で、P値関数と確率密度関数の間には相互変換を構成できます。

P値関数と事後分布の密度関数の精密な比較をしたいと思った人はどちらか片側に変換して比較する必要があります。

その辺の実装については

github.com/genkuroki/publ…

を参照。 #Julia言語
18
#統計 P値 (null P値以外のすべてのP値も含む)とベイズ統計での事後分布が同じように使える道具であることを納得するためには、複数のデータの数値についてそれらを計算して比較することを繰り返す必要があります。

そのための #Julia言語 のコードを私は全公開しているので、参考になると思います。
Actions
Visual Editor
Update Thread
What You Can Do
  • Download as PDF
  • Save to Notion
  • Export as Markdown
  • Visual Editor
Create Free Account

Includes 7-day Premium trial