Hi,👋 we have updated the app and fixed multiple bugs. We are lacking funds, request to free user not to use Adblock. Ads are non intrusive. 😊

@genkuroki: #統計 統計学入門の教科書の伝統的スタイルでは推定の章と検定...

@genkuroki
32 views Oct 21, 2024
1
#統計 統計学入門の教科書の伝統的スタイルでは推定の章と検定の章が分離されており、多くの場合にそれらの双対性の説明はない。P値の説明がなくて、棄却領域で説明していることが多い。

しかし、実際には、「P値(関数)から点推定、区間推定、仮説検定が全部出て来る」のスタイルに単純化可能。
Thread image
2
#統計 P値を使って仮説検定をできることは常識であるが、P値(関数)を使って点推定と区間推定も実行できるとは残念ながら常識になっていない。

P値関数から点推定値と信頼区間も得られることについては以下のリンク先の添付画像を参照。

P値は推定のための道具でもある。これが常識になるべき。
3
#統計 超有名な疫学者&統計学者のSander Greenlandさんは【P値を推定のための道具として扱わないという重大な誤りを繰り返すことを止めろ】と言っています。

結構昔から「検定から推定へ」とよく言われていて私も正しいと思いますが、P値(関数)について理解すれば自動的にそうなります。
4
#統計 P値についてはなぜか「科学的なまともさ」を蔑ろにしている連中が主要な話題になり易いのですが、ろくでもない連中対策も重要ですが、このスレッドにまとめたような何かポジティブな話もないと色々うまく行かなくなると思います。
5
#統計 簡単なP値関数の例達の紹介に相互リンク
6
#統計 信頼区間をP値から出す流儀には、数学的にテクニカルな話の簡略化にも役に立ちます。

信頼区間の構成では両端の値を与える2つの関数を作る必要があるのですが、P値の構成であれば関数を1つ作るだけなので、相対的にP値の構成の方が楽になります。

P値から信頼区間を出すと納得感も増します。
7
#統計 教科書がP値から信頼区間を出す流儀で書かれていないことの弊害の分かり易い例は、Rのfisher.testが表示するnull P値と信頼区間の組み合わせに整合性がないことです。

null P値 < 5% なのにORの95%信頼区間がnull値の1を含む場合が出て来ます。

こういうのは困りますよね。

解決策

8
#統計 Rで書かれたソフトの多くが、null P値と信頼区間を同時に表示してくれるのですが、null P値を計算するために使ったP値関数とは異なるP値関数から得られる信頼区間を表示するものが結構あって、そういうソフトではP値と信頼区間の整合性が無くなっています。その典型例がfisher.test
9
#統計 P値関数から仮説検定も信頼区間も出て来るというスタイルで学んだ人であれば、互いに整合性がないP値と信頼区間を表示するソフトを作って配布したりしないと思います。

スレッドトップの提案にはこういうメリットもある。

10
#統計 P値関数のグラフ(以下のリンク先の1つ上の投稿にある)と以下のリンク先のベイズ統計での事後分布のグラフを比較すれば、P値関数と事後分布はほぼ同じ使い方をできる道具なことがすぐに分かります。

「P値関数から全部出る」と教えることには、ベイズ統計との接続でも大きなメリットがあります。
11
#統計 添付画像のグラフは、「ルーレットを20回まわしたら当たりが6回出た」というデータに関する二項分布モデル+「当たりが出る確率はpである」という設定のP値と平坦事前分布に対応する事後分布のグラフです。

比較すればどちらも同じような道具であることは明らか。

nbviewer.org/github/genkuro…
Thread image
Thread image
12
#統計 null P値、点推定値、信頼区間の3点セットを報告するというありがちなパターンにも、このスレッドトップで提案した

点推定&区間推定←P値関数→仮説検定

のスタイルは相性が良い。

有害で破壊的なP値批判に乗っかるのではなく、P値関数について教えることにすることのメリットは沢山ある。
13
#統計 P値は検定と推定の両方に使える道具です。

添付画像は二項分布の正規分布近似で作った「20回中6回当たりが出たというデータの数値に関する当たりが出る確率はpであるという検定仮説のP値」のグラフです。横軸がpです。

P値のグラフから点推定値と95%信頼区間を読み取れます。
Thread image
14
#統計 多分「P値は推定に使えない」という思い込みは、P値として「効果は0である」のようなゼロ仮説のP値単体しか考えない誤りをみんな犯しているからだと思います。

数値aを動かしながら「効果はaである」という検定仮説のP値のグラフを描けば、P値が推定のための道具でもあることは明らかです。
Thread image
15
#統計 色々言っていますが、個人的にP値の解説において最も優先するべきだと思っていることは、ゼロ仮説θ=0のP値だけではなく、一般の仮説θ=a (aは任意の数値)のP値全体を考えること。

これは「もう〇〇はやめよう」(例「統計的有意と言うのはやめよう」)の型の提案と違ってプラス面しかない。
16
#統計

モデルは二項分布+その正規分布近似。
データの数値は20回中6回当たりが出た。
グラフは仮説「当たりが出る確率はpである」のP値のグラフ。

仮説を決めるpを動かして、P値≥0.05(仮説「当たりは出る確率はpである」は有意水準5%で棄却されない)となるpの値の全体を集めると95%信頼区間になる。
Thread image
17
#統計

P値と信頼区間の表裏一体性(双対性)の定式化と証明

18
#統計 P値≥5%のとき「モデルの下でデータの数値とパラメータpの値の相性が良い」と言い、P値<5%のとき「相性が悪い」と言うことにすると、95%信頼区間はモデルの下でデータの数値と相性が良いパラメータpの値全体の集合になる。

「相性が良い」程度のことしか言えないことにすれば過信を抑制できる。
19
分岐スレッド
20
Actions
Visual Editor
Update Thread
What You Can Do
  • Download as PDF
  • Save to Notion
  • Export as Markdown
  • Visual Editor
Create Free Account

Includes 7-day Premium trial