@genkuroki: #統計 #教育 モデルの確率分布DにおけるAの確率Pの使い方...

@genkuroki
26 views May 16, 2025
1
#統計 #教育 モデルの確率分布DにおけるAの確率Pの使い方として「確率分布Dにおける事象Aの意外さの数値化」を考える場合には、

確率Pに対応する情報量S=-log₂Pについても触れておく

という方針は悪くない。

このSにはsurprisal valueという名前もつけられている。
umsl.edu/~fraundorfp/eg…

続く
2
#統計 #教育 教育実践時には「生徒の多くは対数を苦手」という条件に配慮する必要があります。

コイン投げで何回連続して表が出たことに相当するかで確率の小ささ(意外さ)を測るという言い方ならば対数の使用を迂回できます。続く
3
#統計 #教育 例えば、確率P=1は0回続けて表が出る確率に等しく、意外さは0です。

確率P=3%は、5回続けて表が出る確率(1/2)⁵=0.03125に近いので、surprisal valueの意味での意外さはおおよそ5になります。

確率P=5%の意外さはコイン投げ約4.3回分に相当する。
4
#統計 #教育 以上の意味での「意外さ」の概念の教育が必要だと思われる理由は、統計学でP値について教えたときに、P値の小ささがどの程度の意外さを意味するかを正しく評価できるように有用だと思われるからです。

このあたりのことはSander Greenlandさん達がよく言っていることでもあります。
5
#統計 まとめ: 確率の小ささを意外さの指標として使う予定がある場合には、確率をコイン投げで何回続けて表が出た場合に相当するかの回数の値に変換して、意外さの値(surprisal value)として使うと良い。
6
#統計 P値は「モデルの確率分布とデータの値の相性の良さの指標」であり、surprisal value -log₂Pの意味でのP値の小ささが「モデルの確率分布から見たデータの値の意外さの指標」だと解釈できるものになっています。
7
#統計 尤度も「モデルの確率分布とデータの相性の良さの指標」とみなせるのですが、取り扱い方はP値とは全然違う。

例えば、モデルが連続分布の場合には、尤度の値は座標系に依存するので、座標不変なP値と違って尤度単体の絶対的な大きさを見ても意味のある情報は得られません。尤度比が必要。
8
#統計 さらに、P値の取り扱いで技術的に重要なのはnuisance parametersの分だけモデルの確率分布がただ一つに決まらないという問題への対処なのですが、同じ問題の尤度での対処のためには事前分布を使ってベイズ法を使うことが一つの標準的方法になっています。続く
9
#統計 モデルが十分にシンプルで標本サイズが十分大きな場合には、尤度関数からP値を最尤法の漸近論を使って作ることができます。

このように尤度関数はベイズ法でもP値法でも使われています。

そしてそのどれもが、モデルの確率分布とデータの値を比較して相性の良さを見る方法になっています。
10
#統計 ただし、P値の小ささはモデルでのパラメータの値に関する仮説の側から見たデータの値の意外さの指標になっていますが、事後分布での裾野の確率の小ささは事前分布とデータの値の側から見た裾野部分を指定するパラメータの値に関する仮説の意外さの指標になっています。
Actions
Visual Editor
Update Thread
What You Can Do
  • Download as PDF
  • Save to Notion
  • Export as Markdown
  • Visual Editor
Create Free Account

Includes 7-day Premium trial