#統計 統計学入門の講義で注意するべきことについてのスレッド
最も注意が必要なことは、
検定によって帰無仮説が棄却されても
それをそのまま現実の問題に関する解答だとみなしてはいけない
とはっきり教えることだと思います。
検定による帰無仮説の棄却は数学的フィクションに過ぎない。続く
#統計 例えばリンク先で紹介したNHK高校講座のように統計学を教えてはいけない。
NHK高校講座では、片側P値が5%未満になっただけで【やっぱりこのコイン、細工されていたんだなあ】と判断して良いかのように教えていますが、これは全くのデタラメです。続く
#統計 おそらく大学においても、P値が5%未満になっただけで【やっぱりこのコイン、細工されていたんだなあ】と判断して良いかのように教えて来た先生達は数え切れないくらいいると思います。
これは日本だけではないと思われるので、大変に深刻な問題です。続く
#統計 P値が事前に決めておいた有意水準の5%を切っていれば帰無仮説を否定するという判断を現実において下して良いという考え方はまるっきりのデタラメで、デタラメだと分からない人は科学的にまともな考え方をできていない。
Neyman-PearsonのPearsonもそういうデタラメを否定しています。
↓
#統計 しかし、検定法について棄却領域の言葉で説明する講義を行ったときに、「検定によって帰無仮説が棄却されること」と、「現実における判断として帰無仮説を棄却すること」を混同させずに済ますことは無理だと思います。
だからそういう教え方をしてはいけないと結論せざるを得ない。
#統計 「検定によって帰無仮説が棄却されたこと」は数学的設定内部にのみ通用する数学的フィクション扱いする必要があります。
そういう数学的フィクションの結果を、現実の問題で活かすことは別問題になります。
でも、そういう教え方が初学者に通用するはずがない。
#統計 統計学の入門的講義での検定法の解説を「帰無仮説を棄却」「統計的に有意」「有意差あり」という二分法の言葉で行うことは、学生に誤解させて科学的にデタラメな考え方をさせてしまうリスクが大きいので避けるべきだとおもいます。
それでは二分法なしに教える方法はあるのか?続く
#統計 最初から二分法の言葉を使わずに、実質的に検定法と同等のことを教える方法はあります。
それは統計ソフトがアウトプットしてくれるP値について教えるという方針です。有意水準を設定しない限り、二分法は現れません。続く
#統計 P値を主軸に講義をするときの重要ポイントは、
仮説HのP値は統計モデル+仮説Hの組み合わせとデータの値の相性の良さ(compatibility)の指標の1つである
と教えることです。P値についてはこの解釈の仕方さえ知っていれば、計算法の詳細を忘れても実用的に利用できます。
#統計 P値が満たすべき性質は、
仮説Hを満たす統計モデルの確率分布に従って生成された仮想的なデータから計算された仮説HのP値は0から1の間の一様分布に近似的に従う
という条件です。この条件がP値の実用性を支えています。
一様分布に近似的に従うことはコンピュータでチェックできれば十分。
#統計 仮説HのP値の仮説Hの下での近似的一様分布性より、S=-log₂(P値)とおくとき次のように言えます:
統計モデル+仮説Hを信じている人にとって
偏りのないコイン投げでS回続けて表が出たのと
同じ程度に意外なデータの値が得られたことになる。
Sを意外度と呼びます。
#統計 有意水準を設定していなくても、P値単体だけで意味を持つことを直観的に把握する方法として、コイン投げのたとえを使うという教育テクニックは結構昔から知られていたようです。
#統計 P値の小ささを表す(S値)=-log₂(P値)は、統計モデル+仮説の立場からデータの値の意外さを測る連続的な指標になっています。連続的な指標として扱うことは非常に重要。
例えばP値が4.9%の場合と5.1%の場合では科学的にほぼ同じ結論を出すことが要請されます。5%の閾値による二分法は否定される。
#統計 学生向けの講義では、すでに存在する非科学的な慣習の類は、はっきり明瞭に否定する必要があります。
科学よりも慣習に基く権威の側を優先してしまうようだと、非常にまずいことになります。ここは絶対に譲れない点だと思います。
#統計 以上では、検定法に関する数学的な理論(特にLehmannの有名な教科書に書いてあるNeyman-Pearson流の仮説検定の理論)を一切否定していないことにも注意して下さい。
Lehmannの教科書も有意水準を設定せずにP値を報告することを認めています。
#統計 一般に、たとえ現実にそのまま応用できないとしても、数学的フィクションに関する数学的理論の研究は非常に重要です。
有害なのは、数学的フィクションと現実の混同。
モデルと現実の混同(model reification)は多くの統計学入門の解説に共通する病なので注意が必要。
#統計 具体的なP値の構成については、仮説θ=aの両側P値と仮説θ≤a(もしくはθ≥a)の片側P値について説明しておけば実用的には十分。
常にモデルにパラメータθを入れておくことはゼロ仮説主義(nullism)の病対策のために重要。
信頼区間の構成でも必須。続く
#統計 パラメータθに関する95%信頼区間は、仮説θ=aのP値が5%以上になる数値a全体の集合として定義できます。
パラメータθの点推定値は、仮説θ=aのP値が最大値の1になる数値aだと定義できます。
要するにP値は推定のための道具にもなっています!
#統計 以上のストーリーの利点は、コンピュータがアウトプットして来るP値のcompatibilityとしての解釈の仕方さえ理解できれば、P値から得られる信頼区間や点推定値についてもcompatibilityで解釈できるようになり、信頼区間の解釈問題も自動的に解決することです。