✨ Visual Editor
close
warning

Thread Truncated

Only the first 20 tweets are shown to ensure high-quality rendering and prevent image size issues.

arrow_forward
135°

40px
16px

16px
黒木玄 Gen Kuroki
@genkuroki
#統計 東京大学出版会の『統計学入門』を警告抜きに他人に勧めるような人は統計学を全然理解していない人の可能性が高く要注意です。

あちこちにおかしな説明が地雷のように敷設されている本です。

例えば、『統計学入門』でのWelchのt検定での自由度の扱いもなぜか整数化しており、おかしいです。
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 東京大学出版会『統計学入門』での統計学における基本概念(信頼区間、尤度、最尤法、パラメトリック、…)の解説はことごとく不適切なのですが、ついさっき、

 よく使われているWelchのt検定さえ
 まともに解説されていない

ことに気付きました。

この本を他人に勧めるときには警告が必要。
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 以前からなぜかWelchのt検定での使う自由度を四捨五入などによって整数にすることにこだわる酷い解説があることは知っていましたが、東京大学出版会の『統計学入門』にもそういう酷い説明があったんですね。

この本で勉強した人はどこで恥をかくことになるか予測不可能かもしれません。
黒木玄 Gen Kuroki
@genkuroki
#統計 私自身はやる気になれないのですが、東京大学出版会の『統計学入門』については、

 読者が注意するべき不適切な説明のリスト

を誰か作った方が良いと思います。

この本は多くの人が読んでいるので、すでにそういうリストを作った人がいても不思議ではないです。是非とも公開して欲しいです。
黒木玄 Gen Kuroki
@genkuroki
#統計

 不適切な説明が多いことを承知で読む

のと、

 そうとは知らずに
 内容をそのまま受け入れてしまう読み方を
 不幸にもしてしまって、
 この本の説明はあちこちとても酷いことを後で知って
 がっかりする

のでは、その後のやる気が大きく違って来ると思います。
黒木玄 Gen Kuroki
@genkuroki
#統計 『統計学入門』における「対立仮説」(p.235)と「検出力」(p.251)の説明も不明瞭もしくは不適切です。その説明で理解できたと感じる人が論理的に考えていないことになると思います。

よく分からない説明については正直に「分からない」ことを認めるべき。それくらいまずい説明。続く
黒木玄 Gen Kuroki
@genkuroki
#統計 例えば、平均パラメータμに関して、

帰無仮説 H₀: μ=15
対立仮説 H₁: μ≠15

という両側検定の設定を考えましょう(『統計学入門』p.237)。

問題:対立仮説はμ≠15という数式で表される単独の仮説であるか?

この問題に即答できないと対立仮説について理解したことになりません。

続く
黒木玄 Gen Kuroki
@genkuroki
#統計 答えは「いいえ」です。両側検定の設定における対立仮説は単独の仮説ではありません。

帰無仮説μ=15の両側検定の設定における対立仮説の正体は、

 15以外の数値aで決まる仮説μ=aの
 全体で構成された仮説の集合

になります。

この設定は検出力の話に繋がって行きます。続く
黒木玄 Gen Kuroki
@genkuroki
#統計 実際、『統計学入門』p.251には添付画像のように、検出力の説明のところで「複合仮説」という用語が説明されています。

両側検定や片側検定における対立仮説は単独の仮説ではなく、複数の仮説からなる複合仮説になります。

こういうことが分かるような説明になっていないと思います。
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 帰無仮説μ=15の両側検定の検定法の検出力は、15以外の任意の数値aごとに決まる仮説μ=aごとに決まります。

検出力の定義は、μ=aと設定された統計モデル内で生成されたデータにその検定法を適用したときに帰無仮説μ=15が棄却される確率です。

つまり、検出力はaの函数になる。続く
黒木玄 Gen Kuroki
@genkuroki
#統計 aの函数である検出力はできるだけaについて一様に大きくなって欲しいわけです。

しかし、両側検定の場合にはその意味でベストな検定法は存在しない。

一方、片側検定ではaの動く範囲が15未満または15より大きいの片方に制限されるので、上の意味でベストの検定法を尤度比検定として作れます。
黒木玄 Gen Kuroki
@genkuroki
#統計 このように、複数ある対立仮説を決めるパラメータ値aごとに決まる検出力をできるだけ高くしたいという要求をしたとき、両側検定と片側検定でがaを動かす範囲が違うので、そこで両側検定と片側検定の違いが生じるわけです。
黒木玄 Gen Kuroki
@genkuroki
#統計 こういうことは、

 複合仮説としての対立仮説



 検出力を高くしたいという要請

の関係について考察して初めて理解できることです。

両側検定の対立仮説をμ≠15と書かれる単独の仮説だと誤解させるような説明はやめるべきです。
黒木玄 Gen Kuroki
@genkuroki
#統計 以上を読めば、

帰無仮説 μ=15
対立仮説 μ≠15

は、対立仮説が「μは15でない」という単独の仮説であることを意味せず、対立仮説は数値a≠15に関するμ=aという仮説全体であることを理解できると思う。

この辺は多くの人が誤解しており、そにせいで両側検定を理解できなくなっていると思う。
黒木玄 Gen Kuroki
@genkuroki
#統計 以上で説明した複合仮説が出てくる仮説検定については、超有名な教科書の初版

Lehmann, Testing Statistical Hypotheses, 1959 (初版)

でクリアに説明されています。

twilog.org/genkuroki/sear…
黒木玄 Gen Kuroki
@genkuroki
#統計 講義で「普通は両側検定を使う」「帰無仮説がμ=μ₀のとき両側検定の対立仮説はμ≠μ₀になる」(←不適切な説明)と習った人が、検出力では「帰無仮説μ=μ₀、対立仮説μ=μ₁の場合には~」と説明されて、最も普通の両側検定はどこに行ったんだとなる。😅

このスレッドでこの不満を解消したつもり。
黒木玄 Gen Kuroki
@genkuroki
#統計 そういう概念的なことに限らず、正規分布モデルを使った検定や区間推定が、全然正規分布でない母集団分布にどれだけ適用可能かに一切触れていない点は、統計学の実践的な応用時には非常に困った状態を作り出すことに貢献していると思います。
黒木玄 Gen Kuroki
@genkuroki
#統計 竹内啓『数理統計学−データ解析の方法』の第19章には添付画像のように「正規分布の仮定の意味」の簡単な説明があります。

しかしそこに書いてあることだけで実践に役に立つレベルに理解には至らないと思います。コンピュータを使って、非正規母集団の場合に関する数値実験の経験が必要。
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 竹内啓『数理統計学−データ解析の方法』は古い本でかつ入門レベルの易しい本ではないのですが、色々面白く読めるように書かれていると個人的には思います。
黒木玄 Gen Kuroki
@genkuroki
#統計 下から7行目【ところで,第1の議論は実際には危険である】について

例えば、正規分布から少し違う母集団分布に、正規分布モデルを使った分散の区間推定を適用すると誤差が大きくなり易く危険です。

それとは対照的に、正規分布モデルを使った平均の区間推定は誤差が小さくなり易いです。
Generated by Thread Navigator
100%
workspace_premium Upgrade
Press + S to quick-export