✨ Visual Editor
close
warning

Thread Truncated

Only the first 20 tweets are shown to ensure high-quality rendering and prevent image size issues.

arrow_forward
135°

40px
16px

16px
黒木玄 Gen Kuroki
@genkuroki
#統計 解説の内容が間違っていると思いました。

正規分布でなければt検定は使えないという考え方は間違っています。

Mann-WhitneyのU検定は無条件では使えません。多くの場合に脆弱で危険な検定法になります。

MWのU検定は中央値を比較するための方法ではありません。

datastudy.gonna.jp/mann-whitney/
Thread imageThread imageThread image
黒木玄 Gen Kuroki
@genkuroki
#統計 非常に残念なことに、多くの人達が無条件では使えないMann-WhitneyのU検定を気軽に使う誤りを犯し続けています。詳しい解説については、𝕏で

from:genkuroki Mann-Whitney 脆弱
from:genkuroki Mann-Whitney 粕谷

を検索してみて下さい。私の定番の話題の1つ。

フローチャート統計学の呪縛。
黒木玄 Gen Kuroki
@genkuroki
#統計 手法が前提としている仮定からの逸脱への脆弱性を機にするならば、Mann-WhitneyのU検定のような方法の脆弱性にも気を使うべきです。

MWのU検定は脆弱で危険な検定法なのに残念ながら普及してしまった。

MWのU検定の代替となるより頑健な検定法にBrunner-Munzel検定があります。
黒木玄 Gen Kuroki
@genkuroki
#統計 余談

外れ値を扱う練習問題として

inference.org.uk/itprnn/book.pd…

にあるSeven Scientistsの問題は有名(添付画像)。

私の解答例(外れ値を含む統計モデルを適当に作る)は

nbviewer.org/gist/genkuroki…

nbviewer.org/gist/genkuroki…

にある。外れ値問題には統計モデリングで解決するという選択肢もある。
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 これは酷すぎる。

* 正規分布でなければt検定を使えないという考え方は誤り。

* 正規母集団で等母分散なら標本サイズが総数10未満でもStudentのt検定は使える。

参考: 非正規母集団のときにWelchのt検定が使えるための標本サイズの下限はケースバイケースで大きく変わる。続く
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 論外に酷い。

* Mann-WhitneyのU検定=Wilcoxonの順位和検定は脆弱であることを無視すれば連続変数でなくても使える。

* 2×2の分割表で標本サイズが小さいときにFisher検定を使うと検出力がかなり犠牲になる。所謂コクランルールは過剰に保守的で好ましくない。
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 何よりも酷いのは、差をどのように測るかが違えば検定法間の互換性はなくなるはずなのに、単に「差」とだけ書いてあり、異なる差の測り方をする本質的に異なる検定法を並べて紹介している。

何の差を測りたいかでどの検定法を使うかを決めるべき。

要するに、この表の作り方自体が酷い。
Thread image
黒木玄 Gen Kuroki
@genkuroki
#統計 上の場合には総数30となっているのですが、「サンプルサイズ30あれば十分」的なデマが世界的に広まっているのではないかという話が以下のリンク先スレッドにある。
黒木玄 Gen Kuroki
@genkuroki
#統計 2×2の分割表について、コクラン先生が「保守的過ぎる」と批判的な意見を表明しているルールがコクランルールの名の下に普及しているという問題を以下のリンク先スレッドで扱っています。

Fisher検定とPearsonのχ²検定は標本サイズではなくトレードオフで使い分けるべき。
黒木玄 Gen Kuroki
@genkuroki
#統計 既視感があったが、その通りだった。

伝統と権威を無批判に受け入れずに、論理的に再構成して正しいことを確認してから受け入れるということをやらないとダメ。

偉い人が言っていたり、みんな言っているという理由で正しいということにはならない。当たり前の話。
黒木玄 Gen Kuroki
@genkuroki
#統計

新谷歩 2022

(1) P値と仮説検定
med-statacademy.com/storage/movief…

(2) オッズ比とリスク比
med-statacademy.com/storage/movief…
これは多分大丈夫

(3) リスクの計算
med-statacademy.com/storage/movief…

続く
黒木玄 Gen Kuroki
@genkuroki
#統計 続き

新谷歩 2022

(4) 正しい統計検定手法の選び方
med-statacademy.com/storage/movief…

(5) 正しい比較とは? ~リンゴとミカンを比べていないだろうか?~
med-statacademy.com/storage/movief…

(1)P値と仮説検定
(4)正しい統計検定手法の選び方
の2つの内容は明らかにまずい。
黒木玄 Gen Kuroki
@genkuroki
#統計

新谷歩さん曰く【P<0.05⇒差がないという帰無仮説を棄却できる→差があると言える】 med-statacademy.com/storage/movief… (2021)

佐藤俊哉さん曰く【「有意な結果(P≤0.05)は帰無仮説が誤りであり、棄却すべきであることを意味する」も誤解なんです】youtu.be/vz9cZnB1d1c?t=… (2017)

正しいのは後者。
Thread imageThread image
黒木玄 Gen Kuroki
@genkuroki
#統計 アメリカ統計学会がASA声明を出しても、京大の佐藤俊哉先生の講義がYouTubeで公開されても、ある種の専門家達は統計学の使い方に関する伝統的かつ慣習化された誤りを教え続ける。
黒木玄 Gen Kuroki
@genkuroki
#統計 2×2の分割表でもχ²検定のコクランルールの説明で引用されている論文を確認すると、そのルールについてコクラン先生は「過剰に保守的であり、検出力の低下を引き起こす」と述べていた。その意見は正しい。

コクラン先生の警告を無視して、コクランルールという名称で現在も教えられている。
黒木玄 Gen Kuroki
@genkuroki
#統計 Neyman-PearsonのPearsonさんは1955年の論文でNeyman-Pearson流の仮説検定の結果を最終決定とみなすことは誤りだと言っているのに、現在でも多くの教科書がNP流の仮説検定では機械的に2値的決定を下すかのように説明している。
黒木玄 Gen Kuroki
@genkuroki
#統計 Neyman-PearsonのNeymanさんの弟子のLehmannさん(NP流の仮説検定に関する超有名な教科書を書いた)も、固定された有意水準に関する仮説検定の結果ではなく、P値の具体的な値を報告するべきだと言っています。LehmannさんはFisher流とNP流の違いの主張の多くが誤解であると論じている。
黒木玄 Gen Kuroki
@genkuroki
#統計 Neyman-PearsonのPearsonさんやNeymanの高弟のLehmannさんはFisher流とNP流の検定の違いに関する戯画化された説明を明瞭に否定しているのに、ある種の専門家達は現在も違いを強調し続けている。
黒木玄 Gen Kuroki
@genkuroki
#統計 アメリカ統計学会や佐藤俊哉先生やCochran先生やNeymann-PearsonのPearsonさんやNeymanさんの高弟のLehmann先生などが何を言っても効き目がない。

まさに、付ける薬がない。

学問の世界でここまで酷い世界は珍しいと思います。
しかも実学に関する話題。
黒木玄 Gen Kuroki
@genkuroki
#統計 Rothman先生やGreenland先生も何を言っても効き目がない。
Generated by Thread Navigator
100%
workspace_premium Upgrade
Press + S to quick-export