Hi,👋 we have updated the app and fixed multiple bugs. We are lacking funds, request to free user not to use Adblock. Ads are non intrusive. 😊

@genkuroki: #統計 医療統計の分野では、❌正規母集団でなければt検定...

@genkuroki
30 views Apr 10, 2025
1
#統計 医療統計の分野では、

❌正規母集団でなければt検定をつかえない。

という酷い教え方のせいで、

❌ノンパラメトリック検定ならばいつでも使える。

という極めて有害な誤解に誘導され、実際に安易にノンパラ検定を使って論文を書いてしまう科学的に有害な人達を増やして来た。

大問題。
2
#統計

best-biostatistics.com/stat-test/w-te… の添付画像の部分を見て、【日本の生物統計の第一人者の大橋靖男先生】について検索してみた。

論理を蔑ろにしてかつ権威に頼る議論の仕方は、非科学的という形容がふさわしいやり方の典型例になる。続く
Thread image
3
#統計 【日本の生物統計の第一人者の大橋靖男先生】については、以下を発見できた。

正規でなければt検定を使えないという誤解によって、常に使用可能なわけではないノンパラメトリック検定に安易に誘導することになる有害なフローチャートを引用していた。

これはアウト!

google.com/search?q=%22%E…
Thread image
4
#統計 他の事例

丹後俊郎『統計学のセンス』(1998)でのWilcoxonの順位和検定(=Mann-WhitneyのU検定)の勧め方(再掲)

Studentのt検定が図の(b)(c)の場合に信頼できなくなったりするという理由でWの順位和検定を勧めている!

これは致命的な誤り!

(b)(c)の場合にWの順位和検定を使ってはいけない。
Thread image
5
#統計 Welchのt検定を最初から使えば良いのに、等分散性を使うStudentのt検定を持ち出す伝統もあきれたものだと思います。

丹後さんの本では、よりにもよって、等分散でない場合にWilcoxonの順位和検定を勧めるという極めて有害な行為をしている。

これは相当に酷い。
Thread image
6
#統計 粕谷氏曰く【しかし、不等分散のときに好 んでU検定を使っている例がかなりあるようです。】(註:Wilcoxonの順位和検定はMann-WhitneyのU検定に等しい)
kasuya.ecology1.org/stats/utest01.…

おそらく、丹後氏のような致命的な誤解をしている人達がかなりいるのでしょう。
7
#統計 警告: kasuya.ecology1.org/stats/utest01.… を読むと、

❌等分散であればMann-WhitneyのU検定=Wilcoxonの順位和検定を使える。

と誤解する危険性があるので注意してください。

等分散性は十分条件ではありません。
8
#統計 Welchのt検定の論文 doi.org/10.1093/biomet… は1947年に出版されているのに、なぜか使用可能条件が厳しいStudentのt検定を紹介する傾向がある。

同様に、Brunner-Munzel検定の論文 researchgate.net/profile/Edgar-… は2000年に出版されているのに、なぜか今もWilcoxonの順位和検定を勧める傾向がある。
9
#統計 Brunner-Munzel検定の検定統計量は、本質的にMann-WhitneyのU検定(Wilcoxonの順位和検定と同等)の検定統計量と本質的に同じ。違うのは検定統計量の分散の推定の仕方。

MWのU検定では2つの母集団分布が等しいという超絶強い仮定を使って検定統計量の分散を見積もるが、BM検定はそうではない。
10
#統計 Welchのt検定がStudentのt検定の上位互換になっていることと、Brunner-Munzel検定がWilcoxonの順位和検定=Mann-WhitneyのU検定の上位互換になっていることは似ています。

しかし、安易にBM検定を勧めることも科学的に有害。違いの指標選択に無頓着に「有意差を出す」という発想自体が有害。
11
#統計 母集団分布1,2に従う確率変数をX,Yと書くとき、Welch及びStudentのt検定では

母平均の差 = E[X] - E[Y]

を違いの指標として使います。Brunner-Munzel検定やWilcoxonの順位和検定では

Y側の勝率=P(X<Y)+P(X=Y)/2

と1/2の差を違いの指標として使います。

全然違う「違い」をみています。
12
#統計 検定法を変えると異なる「違い」を計測することになるので、検定法を選択する場合には、自分の目的のためにはどのような「違い」を計測することが適切であるかについてよく考えておく必要があります。

こういう当たり前の考え方をせずに、とにかく有意差を出せばよいとするのはおかしいです。
13
#統計 当たり前の科学的に常識的な考え方を蔑ろにする行為はやめるべきです。

そして、偉くなった先生達が当たり前の科学的に常識的な考え方を蔑ろにしていることを発見したら、言葉を濁さずに明瞭に否定することも必要だと思います。

それをできない人達は権威に負けており、科学的ではない。
14
訂正【大橋靖男先生ではなく、大橋靖雄先生】

謝罪

15
#統計 ノンパラメトリック検定に関する解説はおかしなものの方が多数派で、しかもまともに訂正される気配が感じられない。

どうして同業者達が訂正させる方向に動かないのか?

私は誤りを指摘してくれる人達にいつも助けられています。

そういう世界になっていないように見える。

事例

16
以下の件も訂正される気配が感じられない。

誤りを認め、どこが誤りだったかを正確に説明して、訂正版の文に差し替える、というプロセスを見てみたい。

そもそも誤りだと思っていないのか、誤りだと認識しているが訂正の仕方がわからないのか、全てが不明。

事例

17
#統計 Mann-WhitneyのU検定のU統計量は、

h(x,y)=if x<y then 1 else if x=y then 1/2 else 0

とおいたときの、2つの標本X₁,…,XₘとY₁,…,Xₙに関する

U=Σh(Xᵢ,Yⱼ)

です。このとき、

p̂ = U/(mn)



Y側の勝率=P(X<Y)+P(X=Y)/2

の不偏推定量になっている。
18
#統計 Mann-WhitneyのU検定では上のUとmn/2の差を扱い、Brunner-Munzel検定ではp̂=U/(mn)と1/2の差を扱います。

このことから、それらの検定は、本質的に、大きな値が勝つ(引き分けなら1/2勝)というルールのゲームでの勝率を扱っていることが分かります。

続く
19
#統計 Mann-WhitneyのU検定のU統計量やBrunner-Munzel検定のp̂が何であるか知っていれば、それらの検定について

❌中央値の差の検定である

と言えるはずがない。

⭕️勝率と1/2の差の検定である

のように言いたくなるはず。

MWのU検定を「Uが何であるか」さえ理解せずに使っているのではないか?
20
#統計 このスレッドの件で印象が悪い点は、t検定やWilcoxonの順位和検定(=Mann-WhitneyのU検定)のような特別に高級な話題とは言えそうもない基本的な事柄について、集団でおかしな考え方を継続的に教え続けていることです。

しかも指摘しても慌てて訂正しようとする人が見当たらない。
21
#統計 この件について何がつらいか?

Mann-WhitneyのU検定=Wilcoxonの順位和検定に関する解説をチェックするたびに、社会的に統計学の専門家とみなされる立場の人が相当に杜撰な解説をしていると気付いてしまうこと。

見つけた事例を全部紹介しているわけではない。

精神的につらい。
22
ブロックが原因で文脈をたどり難くなることを防ぐためのスクショによる引用。


Thread image
Thread image
Thread image
23
これも文脈をたどり易くするためのリンク。


24
#統計

❌t検定の前にF検定をやるかどうか

おそらく、そのt検定は等分散の仮定から得られるStudentのt検定のことだと思います。

「F検定→t検定」という流れは多重検定になるので好ましくないです。

⭕️F検定をやらずに、常にWelchのt検定を使う

と良いというのが現代の常識だと思いました。
25
【正規分布に従わない母集団ってどんなケース?】

現実の母集団は大抵正規分布に従っていません。しかし、

⭕️正規母集団でなくても多くの場合にt検定を使える(使えない場合もある)。

よくある誤解は

❌正規母集団でなければt検定をつかえない。

この誤解は大学の先生がよく広めているので要注意。
26
#統計 分岐にリンク

Welchのt検定での自由度について大雑把に説明してすませたければ、

* Welchのt検定で使うt分布の自由度は複雑な式で定義され、2つの標本のサイズがm,nのときmin(m-1, n-1)以上m+n-2以下になる。

のように説明しておけば良いと思う。

min(m-1, n-1)以上になる。
27
#統計

epirhandbook.com/jp/stat-tests.…
疫学のための Rハンドブック
18 基本的な統計的検定

の解説も色々アウト。詳しくは添付画像を参照。

いつもの初歩的な誤りです。

どうしてこういう杜撰なものが出回りまくって訂正されないのかが大問題。
Thread image
Thread image
28
これは深刻な問題。

歳を食って頭が硬くなった人が伝統に従って(伝統の内容自体がデタラメであるがゆえに)デタラメな解説を行い続けるということだけなら、そういうこともあるだろうなと思います。

しかし、頭脳がまだ衰えていない若い人達まで悪しき伝統に従ってしまうのはどうしてなのか?
29
#統計 よく見る

❌正規母集団でなければt検定は使えない。
❌Mann-WhitneyのU検定ならいつでも使える。

という説明は初歩的なデタラメ。

Welchのt検定は正規性からの逸脱にかなり頑健だが、MWのU検定は脆弱なので安易に使うと危ない。

世界的に普及している解説の側が酷いデタラメなことに注意!
30
#統計 特に、Mann-WhitneyのU検定を気軽に使う傾向は相当に危ない。

MWのU検定は、「2つの母集団分布は等しい」という帰無仮説の検定なので、母分散、母歪度、母尖度、などのどれかが等しくないと、無用に有意差が出易くなったり、出難くなったりする。
You're reading 30 of 104 posts

Create a free account to read the full thread.

Sign Up Free
Actions
Visual Editor
Update Thread
What You Can Do
  • Download as PDF
  • Save to Notion
  • Export as Markdown
  • Visual Editor
Create Free Account

Includes 7-day Premium trial