@genkuroki: #統計 【ざっくりいえば、p値(p-value)は「ある結論...
@genkuroki
27 views
Mar 03, 2025
1
#統計 【ざっくりいえば、p値(p-value)は「ある結論が、実はただの勘違いである可能性」と解釈できる。(小声でいうと、小さい方がうれしい)】
という説明は、杜撰なP値の説明そのものに見えました。「ざっくり」は言い訳にならない。
具体例による説明の試みは悪くないと思いました。
解説に続く
という説明は、杜撰なP値の説明そのものに見えました。「ざっくり」は言い訳にならない。
具体例による説明の試みは悪くないと思いました。
解説に続く
View Tweet
2
#統計 統計学を教える仕事をする人は
統計的有意性とP値に関するASA声明
biometrics.gr.jp/news/all/ASA
には目を通しておいた方が無難。
これを読めば、P値に関する実践的に十分な説明と解釈法が得られます。
ただし添付画像への追記部分に注意することも必要。
統計的有意性とP値に関するASA声明
biometrics.gr.jp/news/all/ASA
には目を通しておいた方が無難。
これを読めば、P値に関する実践的に十分な説明と解釈法が得られます。
ただし添付画像への追記部分に注意することも必要。
3
#統計 「統計的有意性とP値に関するASA声明」の翻訳者の佐藤俊哉先生による素晴らしい講義動画もよく紹介されています。これも統計学を教える仕事をする人は視聴しておいた方がよい。教科書に誤りが書いてあることを明瞭に説明している。教科書通りに講義をしてはいけない。
youtu.be/vz9cZnB1d1c?si…
youtu.be/vz9cZnB1d1c?si…
View Tweet
4
#統計 P値は、大雑把には、
観察されたデータの数値以上に極端な値が、検定したい仮説の下でのモデル内確率分布に従って生成される確率もしくはその近似値。
尤度の定義は、
観察されたデータの数値と同じ数値が、モデル内確率分布に従って生成される確率またはその密度。
混同させる説明が多い。
観察されたデータの数値以上に極端な値が、検定したい仮説の下でのモデル内確率分布に従って生成される確率もしくはその近似値。
尤度の定義は、
観察されたデータの数値と同じ数値が、モデル内確率分布に従って生成される確率またはその密度。
混同させる説明が多い。
5
#統計 P値も尤度(ゆうど)も、
観察されたデータの数値とモデル+パラメータの値の設定の相性の良さ(compatibility)の指標
として使われます。
「相性の良さ」の代わりに「整合性」や「適合度」のように言ってもよい。「相性の良さ」は過信を防ぐための言い方。
観察されたデータの数値とモデル+パラメータの値の設定の相性の良さ(compatibility)の指標
として使われます。
「相性の良さ」の代わりに「整合性」や「適合度」のように言ってもよい。「相性の良さ」は過信を防ぐための言い方。
6
#統計 「統計的有意性とP値に関するASA声明」でも他の真っ当なすべての解説でも、P値<αという条件による安易な2値的判断をしてはいけないということになっています。
「統計的有意性」で結論を出すこと自体が有害であるというコンセンサスがすでにあるようにも見える。
biometrics.gr.jp/news/all/ASA
「統計的有意性」で結論を出すこと自体が有害であるというコンセンサスがすでにあるようにも見える。
biometrics.gr.jp/news/all/ASA
7
#統計 P値と尤度(ゆうど)の違いが明瞭であるような説明をしていない場合はアウト。
P値が、現実においてではなく、検定したい仮説の下でのモデル内確率分布で計算した確率であることが分からない説明もアウト。
統計的有意性(P値<α)によって科学的結論を出すことに否定的でない説明もアウト。
P値が、現実においてではなく、検定したい仮説の下でのモデル内確率分布で計算した確率であることが分からない説明もアウト。
統計的有意性(P値<α)によって科学的結論を出すことに否定的でない説明もアウト。
8
#統計 例えば「回帰係数に関する帰無仮説β₁=0のP値が有意水準未満ならば統計的に有意なのでβ₁≠0であるという結論を出してよい」が正しいと考える生徒には、統計学の単位を出してはいけないと思います。
最初に試験を実施するべきなのは大学の先生達だと思います。
最初に試験を実施するべきなのは大学の先生達だと思います。
9
#統計 P値は、β₁=0のような検定したい仮説だけではなく、モデル全体(β₁=0については回帰モデル全体)と観察データの数値の相性の良さ(整合性、適合度)の指標の1つです。
P値は、検定したい仮説だけではなく、モデル全体を評価している指標であることが忘れられがちなので注意が必要。
P値は、検定したい仮説だけではなく、モデル全体を評価している指標であることが忘れられがちなので注意が必要。
10
#統計 P値や信頼区間の使い方(もしくは誤用の仕方)に関する決定的な解説がGreenlandさんの講演スライド
biostatistics.ucdavis.edu/sites/g/files/…
にあります。これの発見が遅れて時間を無駄にした。
添付画像はそのp.75の翻訳。
biostatistics.ucdavis.edu/sites/g/files/…
にあります。これの発見が遅れて時間を無駄にした。
添付画像はそのp.75の翻訳。
11
#統計 小さなP値が得られたときには、通常、検定したい仮説だけではなく、「モデルが間違っている」(調整するべき(してはいけない)変数で調節していない(している)ことなども含む)や「データの取得法に問題があった」の可能性も疑ってみるのが普通でしょう。
12
#統計 『ロスマンの疫学第2版』の第8章の解説も非常に有用です。これも統計学を教える仕事をする前に目を通しておくと良いと思います。
宝くじで大当たりしてP値がほぼ0になっても、宝くじがフェアに運用されているという帰無仮説の正しさははびくともしないでしょう。
宝くじで大当たりしてP値がほぼ0になっても、宝くじがフェアに運用されているという帰無仮説の正しさははびくともしないでしょう。
View Tweet
14
#統計 実はグラフの見た目的には色々微妙で要注意なことも分かる。過信は危ない。
1つ上のグラフを作成するために使った #Julia言語 のコード
↓
github.com/genkuroki/publ…
線形回帰の一般論
↓
1つ上のグラフを作成するために使った #Julia言語 のコード
↓
github.com/genkuroki/publ…
線形回帰の一般論
↓
View Tweet
16
#統計 もちろん無条件でいつでもt検定を使えるわけではありません。
しかし、残差のQQプロットを描いたり、正規性検定をしたりしたがる人達の多くは多分基本的なことを誤解しているだろうとは言えます。
しかし、残差のQQプロットを描いたり、正規性検定をしたりしたがる人達の多くは多分基本的なことを誤解しているだろうとは言えます。
17
#統計 基本:統計学の使い方については、
大学の講義
も
定評ある教科書
も
査読済み出版論文
も
学術雑誌の方針
の内容も必ずしも正しくないので、
権威に従う、権威を信じる
という方針の勉強の仕方は失敗する可能性が高い。
大学の講義
も
定評ある教科書
も
査読済み出版論文
も
学術雑誌の方針
の内容も必ずしも正しくないので、
権威に従う、権威を信じる
という方針の勉強の仕方は失敗する可能性が高い。
18
「ざっくりいえば」という言い方をしたのでよいという言い訳はダメであると最初から述べています。
あと、「統計的有意性とP値に関するASA声明」から引用したP値の説明はP値の定義ではありません。ざっくりした説明にすぎません。
さらに、P値の解釈の仕方も引用してざっくり説明しています。
あと、「統計的有意性とP値に関するASA声明」から引用したP値の説明はP値の定義ではありません。ざっくりした説明にすぎません。
さらに、P値の解釈の仕方も引用してざっくり説明しています。
View Tweet
19
こちらにもリンク。
ざっくりした説明の内容は、巷に蔓延っているP値の誤用の典型例でしょう。
帰無仮説単体とP値が結びついているのではなく、モデル全体に結びついていることが分かるように説明しないと、「統計的有意性とP値に関するASA声明」のざっくりした説明との整合性がなくなります。
ざっくりした説明の内容は、巷に蔓延っているP値の誤用の典型例でしょう。
帰無仮説単体とP値が結びついているのではなく、モデル全体に結びついていることが分かるように説明しないと、「統計的有意性とP値に関するASA声明」のざっくりした説明との整合性がなくなります。
View Tweet
20
#統計 投稿を消したようなので文脈が不明にならないようにスクショを引用。
私も赤で印を付けた部分は、P値ではなく、αエラー率の説明をしているようにも見えました。
こういう説明を学生にしてはいけないと思います。
私も気を付けよう。
私も赤で印を付けた部分は、P値ではなく、αエラー率の説明をしているようにも見えました。
こういう説明を学生にしてはいけないと思います。
私も気を付けよう。
View Tweet
21
22
#統計 ASA声明では
1. P値は[観測]データ[の数値]と特定の統計モデル(訳註: [検定したい]仮説も統計モデルの要素)が矛盾する程度[小さい方が矛盾する程度が強い]をしめす指標のひとつである。
と、P値は検定したい仮説単体ではなく、モデル全体に結び付いていると説明しています。これ重要。
訂正版
1. P値は[観測]データ[の数値]と特定の統計モデル(訳註: [検定したい]仮説も統計モデルの要素)が矛盾する程度[小さい方が矛盾する程度が強い]をしめす指標のひとつである。
と、P値は検定したい仮説単体ではなく、モデル全体に結び付いていると説明しています。これ重要。
訂正版
View Tweet
23
#統計 添付画像は上で引用したP値の解釈に関する原則1の終わりの部分です。
P値が、検定したい仮説単体ではなく、P値の計算に使われた仮定の全体(モデル)に結び付いている値であることを強調しているからこそ、こういう結論を容易に述べることができるのです。
biometrics.gr.jp/news/all/ASA
P値が、検定したい仮説単体ではなく、P値の計算に使われた仮定の全体(モデル)に結び付いている値であることを強調しているからこそ、こういう結論を容易に述べることができるのです。
biometrics.gr.jp/news/all/ASA
24
#統計 以下のリンク先で引用翻訳したGreenlandさんの講演スライドにあった図では、P値だけではなく、CI=信頼区間もモデルM全体に結び付いていることを忘れてはいけないことが強調されているとみなせます。
信頼区間もP値と同様に危険な道具で使い方には注意が必要です。
信頼区間もP値と同様に危険な道具で使い方には注意が必要です。
View Tweet
25
#統計 以上の説明を読めば、P値の真っ当な説明のときに「対立仮説を示すために帰無仮説をP値<αによって否定する」という背理法との類似を強調する説明はやめた方が良いこともわかります。続く
26
#統計 P値から分かることは、データの数値とモデルの相性の良さ(整合性、適合度)だけで、モデルの一部分であるパラメータの値に関する仮説に関する判断にはさらに別の議論が必要になる。
「P値を使えばαの危険率で検定したい仮説の成否を判定できる」という主張も実践的には完全に間違っています。
「P値を使えばαの危険率で検定したい仮説の成否を判定できる」という主張も実践的には完全に間違っています。
View Tweet
27
#統計 最近出版されたしまりす本(「統計的有意性とP値に関するASA声明」の翻訳者の佐藤俊哉さんの著書)もみんなで読む価値があると思います。
試し読みのために公開されている第1話にP値に関する説明があります。
こういう新しい本でP値に関する真っ当な考え方をみんなで身に付けて行けば良い。
試し読みのために公開されている第1話にP値に関する説明があります。
こういう新しい本でP値に関する真っ当な考え方をみんなで身に付けて行けば良い。
View Tweet
28
#統計 最新しまりす本と、Greenlandさんの講演スライド biostatistics.ucdavis.edu/sites/g/files/… の内容はかぶっている部分が結構あって、両方読んでおくと色々安心な感じがします。
少なくともそこに書かれていることが孤立した個人の特殊な考え方ではないことが分かります。
少なくともそこに書かれていることが孤立した個人の特殊な考え方ではないことが分かります。
29
#統計 このスレッドの目標は(実際に読めば分かるように)誤りを指摘することではなく、
P値に関する良い解説のありかを紹介すること
です。内容的には一度理解してしまえば全然大したことがない話なのですが、標準的な誤用を誤用でないことにするために頑張ろうとすると当然分からなくなる。
P値に関する良い解説のありかを紹介すること
です。内容的には一度理解してしまえば全然大したことがない話なのですが、標準的な誤用を誤用でないことにするために頑張ろうとすると当然分からなくなる。
30
#統計 #Julia言語
P値に関する誤解のある一部分は、単独のP値ではなく、P値関数の概念を理解すればかなり消えると思う。
添付画像②は①に対応するP値関数です。横軸は仮説としてのβ₁の値で縦軸がP値です。β₁=0の縦線も追加してあり、P値関数との交点が仮説β₁=0のP値。
github.com/genkuroki/publ…
P値に関する誤解のある一部分は、単独のP値ではなく、P値関数の概念を理解すればかなり消えると思う。
添付画像②は①に対応するP値関数です。横軸は仮説としてのβ₁の値で縦軸がP値です。β₁=0の縦線も追加してあり、P値関数との交点が仮説β₁=0のP値。
github.com/genkuroki/publ…
















