#統計 森元良太『統計学再入門』(2024年9月30日)の信頼度の簡易確認。
添付画像はその本のスクショに私が赤を入れたもの。
ベイズ本人であることの証拠が皆無の怪しげな肖像画が引用されている
だけではなく
リチャード・プライスがジョージ・プライスになっていた!
#統計 その本の副題は「科学哲学から探る統計思考の原点」。「統計学」の文脈で「哲学」という言葉を見たら要注意。
添付画像はその本のp.90より。
モーメントE((X-μ)ʳ)が(Σ(Xᵢ-μ)ʳ)/nであることになってしまっている。(Σ(Xᵢ-μ)ʳ)/nはXのモーメントそのものではなく、その推定量です。
#統計 確率変数が従う分布のパラメータそのものとパラメータの推定量を厳密に区別することは、統計学入門で最初に学ばなければいけない基本中の基本であり、その本の著者がそのレベルをクリアできていない可能性を疑ってしまいました。
#統計 数学に弱くても、歴史的な文献を地道に読んでそのまとめを本に書いてくれることはとてもありがたいことなので、数学に弱いことが原因で生じる初歩的な事柄に関する誤解の確認についてはもっと数学が強い人を頼った方が良いと思いました。
#統計 森元『統計学再入門』p.92
n個の観測値でのPearsonのχ²統計量
と
自由度nのχ²分布でのP値
で同じ記号nが使われている。
段落間で記号を共有していないなら誤りではないが、こういう説明の仕方はやめた方がよい。
新たに出てきた記号には説明をつけて、直前の記号との関係にも触れるべき。
#統計 【標本と母集団の隔たり】の「母集団」の意味が曖昧に見える。正しい意味は「数学的フィクションであるモデル内での仮想的な母集団」です。確率変数としてのK. Pearsonのχ²統計量は数学的フィクション内の確率変数。
「母集団」と言われると現実の母集団をイメージする人が多いので要注意。
#統計 χ²検定のP値は
①現実の母集団に関する数学的なモデルを設定する。
②そのモデル内でχ²分布に(近似的に従う)χ²統計量を定義する。
③そのχ²統計量の値が現実の観察で得た標本の値(データの数値)から計算される値よりも大きくなる確率を(近似的に)求める。
という手続きで得られます。続く
#統計 その確率(P値)は、①で設定したモデル(数学的フィクション)と現実の観察で得たデータの数値の相性の良さ(compatibility)もしくは整合性や適合度の指標として使われます。
どこからどこまでが数学的フィクション(=モデル)の中での話なのかを明瞭に説明しないと、モデルと現実を混同します。
#統計 『統計学再入門』p.127
帰無仮説有意性検定でも、Neyman-Pearson的な複合対立仮説を考えることが普通です。
例えばモデルのパラメータθに関する
帰無仮説「θ=a」の両側検定の対立仮説「θ≠a」
の実体は
{ 仮説「θ=b」| b≠a }
という無数の仮説達の集合(複合仮説)です。
#統計 母平均μに関する
帰無仮説「μ=15」
の両側検定での対立仮説は
対立仮説「μ≠15」
とよく書かれますが、対立仮説の実体は「μ=11」「μ=19」…のような無数の対立仮説達の集合
{ 仮説「μ=b」| b≠15 }
で、これを略して「μ≠15」と書いています。
#統計 Neyman-Pearsonの基本問題は、検定法Mをうまく取って、対立仮説の集合に含まれる仮説Kの検出力
power_M(K)=仮説Kの下で帰無仮説が棄却される確率
をKについて一様にできるだけ大きくすることです。
無数の単純対立仮説達を同時に考える点が数学的にややこしい。NPの補題一発で解決しない。
#統計 帰無仮説有意性検定の典型例は、帰無仮説「差はゼロである」と対立仮説「差はゼロでない」の検定です。そのとき、
Neyman-Pearsonの理論と違って
その場合の対立仮説は「差はゼロでない」の1つだけである
と考えてしまう人は
対立仮説の概念をまるっきり何も理解していない
ことになります。
#統計 『統計学再入門』p.157から、Pearson (1955)の翻訳引用部分を孫引き
Pearsonの主張を素直に受け取れば、Neyman-Pearsonの仮説検定が、帰無仮説と対立仮説の片方の採択を強制するかのような解釈は全くのナンセンスで議論する必要がないということになる。しかし、この本では延々と議論している。
#統計 Neyman-Pearsonの仮説検定の結果が帰無仮説と対立仮説の片方の採択を強制するかのような解説がもしも正しいなら、Neyman-Pearsonの仮説検定の考え方は科学的にクズであることは議論しなくても明らかです。
ところが、わざわざ長々と議論したがる人達がいる。続く
#統計 そして、Neyman-PearsonのPearsonの論文(1955)を見ると、Neyman-Pearsonの仮説検定の結果は最終的な判断を与えるものではなく、ユーザーの意思決定を助ける道具に過ぎないという常識的に見える考え方が書いてあります。
こういう常識的で合理的な考え方を深掘りして行く方が建設的でしょう。
#統計 NPの仮説検定のまともな使い方を示唆しているPearson (1955) やそれを引用しているNeymanの高弟のLehmannの論文(1993)には、固定された水準での二分法の結果だけではなく、P値を報告する方が良いと書いてあることなどから、「NP vs. Fisher」の不毛な対立図式を語る必要はもうないと思います。
#統計 nature(2019)の統計的有意性に反対する非常に穏健で常識的な内容の記事の出版を主導したのは、超大物のSander Greenlandさんです。検索すればツイッターでも署名を募っていたことが分かります。すごいパワー!
そのGreenlandさんの考え方については講演スライド(2022)が非常にわかりやすい。
#統計 nature(2019)の統計的有意性に反対する記事の共著者の一人であるGreenlandさんは自分が関与した論文では「有意」(significant)という用語を決して使わないように気を付けて来たと言っています。
「有意」の語を避けたければGreenlandさんの論文を参考にすれば良いでしょう。
#統計 「有意」(significant)という語の使用を避けるべきだと言っているGreenlandさんはP値がどのような意味で有用な道具であるかについても非常に詳しく説明しており、非常に建設的です。