@genkuroki: #統計 この本の写真や図の分量はすごいです!編集執筆には膨大...

@genkuroki
38 views Feb 03, 2026
1
#統計 この本の写真や図の分量はすごいです!編集執筆には膨大な手間がかかっている!

ただし、私個人の立場では、モデルの仮定が強過ぎるせいで脆弱で危険な方法になるMann-WhitneyのU検定について、「実践的には危険なので使うな」と警告していない点などが致命的に見えてしまう。

改訂希望!
2
#統計 医療関係者達は、Studentのt検定やMann-WhitneyのU検定のようなモデルの仮定が無用に強過ぎる脆弱で危険な検定法を使うように教育されて来ており、悲惨なことになっている。

その現状を否定するように改訂してくれると助かります。

そのレベルで綺麗な図を大量使用する本は容易には作れない!
3
#統計 この動画にびっくりして、中原治『基礎から学統計学』のKindle版を購入しました。同じような体裁の教科書は普通の手間では絶対に作れない。すごい!

しかし、2022年出版なのに、伝統的な(ゆえにダメな)スタイルで2016年のASA声明に反する内容になっていてもったいない。改訂版が欲しいです!
4
#統計 中原治『基礎から学ぶ統計学』の第9章「P値」のp.194には【P値を得たら、まず最初に、0.05との大小の比較を行ってください】と書いてあります。さすがにこれはある得ない。

この本で勉強した人はP値を確実に誤用すると思います。

こういう記述をことごとく訂正したバージョンが欲しい。
Thread image
5
#統計 中原治『基礎から学ぶ統計学』は「有意差あり/なし」と結論するあの悪しき帰無仮説有意性検定(NHST)のスタイルで書かれており、とても残念。

しかも「有意差あり(P<0.05)」のようにP値の具体的な値を報告しないスタイルがデフォルト。一応具体的な値を報告する流儀も紹介していますが。
Thread image
6
#統計 初学者にとって精神的に受け入れ易いビジュアル的に非常に優れた本を執筆する特別なスキルと膨大な手間をかける情熱を持っている人達が、統計学教育における悪しき伝統と慣習(科学的有害なスタイル)に忠実であったりすることによって、社会的に巨大な損失が生じているのではないか?
7
#統計 最近の関連スレッド

統計学の伝統と慣習に基く誤用については、Sander Greenlandさんの講演スライドの解説が非常に整理されていて読み易いです。

nullism (ゼロ主義)、dichotomania (二分法への執着)、model reification (モデルと現実の混同)
8
#統計 1つのスレッドにまとまっていないせいで、一般読者が探して読むのが大変なので、読者の便のために著者の中原治さんからのコメントを画像でまとめて引用しておきます。

私による返答は後でします。

私と中原さん以外の人達のコメントも欲しいところ。
Thread image
9
#統計 引用【「有意差の有無に言及する必要はない」とのことですが、具体的な文面が思いつけません】

統計的有意性の廃止を提案した超有名な論文 Amrhein-Greenland-McShane Nature 2019と関連の論文を読んでいないということでしょうか?

読んでいないならその辺りから解説することになります。続く
10
#統計 「有意」(significant)の語を使わない報告の仕方の例

Sander Greenlandさんは40年間ずっと自分が共著者に含まれる報告で"significant"の語を使うことを拒否し続けて来た。

具体的な報告の仕方にも触れている。続く
11
#統計 「有意」(significant)の語を使わない報告の仕方の例

McShaneさん達のガイドラインがまさにそのような報告の仕方の詳しい説明になっています。

McShaneさんは統計的有意性も廃止の提案論文nature 2019の共著者の一人です。
12
#統計 "P < 0.05"のスタイルの報告の仕方は最近の10年間のあいだに非常に厳しく非難されて来ました(既出のGreenlandさんの諸発言などを参照)。

【t分布やF分布の臨界値の値が載ってる数表しかない】ことを理由にP値を計算できないなら、別の数表を用意すれば良いだけのこと。続く
13
#統計 添付画像はStudentのt検定の例

自由度dfは暗算で、t値は電卓で求められる。

t分布の両側P値の数表(添付画像①)から、それらに対応する値を読み取れば両側P値を近似計算できる(②)。

P値=0.045とP値=0.055で正反対の結論を出すことは不合理なのでそれで十分。続く

github.com/genkuroki/publ…
Thread image
Thread image
14
#統計 電卓でdf=8, t=-3.073234まで求めた後には、上記の数表を利用しても良いし、Google ColabのRで

2*(1-pt(3.073234, 8))

を求めても良い。これでもP値が求まる。添付画像はiPhoneでのスクショ。

colab.research.google.com/drive/1h-f2Mpc…
Thread image
15
#統計 他にもWolframAlphaに

2*(1 - cdf(TDistribution(8), 3.073234))

と入力してもP値が求まる。

WolframAlphaは高級電卓としても利用し易い。続く

wolframalpha.com/input?i=2*%281…
Thread image
16
#統計 「有意差あり(P<0.05)」と報告して許されること自体が科学的にかつ社会的に有害。そのように報告しても良いかのように教わった学生は運が悪過ぎだと思います。

初学者の段階では、ゼロ仮説のP値、点推定値、信頼区間の3点セットを(最悪でも信頼区間)を報告するように教わりたいものです。続く
17
#統計 可能ならば「差がない」の型のゼロ仮説のP値だけではなく、他の重要な検定仮説(例えば事前の予想値や定説値)のP値も報告したり、複数の水準の区間推定も報告すれば、リンク先のガイドラインに近付く。続く
18
#統計 教育の現場では「生徒にどうやってP値や信頼区間を計算してもらうか」が大問題です。これは実際非常に頭が痛い問題です。

全員に自分のパソコンにRなどの環境を作ってもらうのは大変。

Google ColabがR対応していることや、電卓の延長として使えるWolframAlphaは非常な助けになります。続く
19
#統計 最終手段として、P値などを計算するための適切な数表を配布して、電卓と共に使ってもらうという手段もあります。続く
20
#統計 結論

* 学生に「有意差あり(P<0.05)」のように報告しても良いかのように誤解させてはいけない。

* 適切な数表の配布、WolframAlphaの利用、Google Colabの利用などによって、「P<0.05か否か」の判定だけではなく、P値そのものを求めてもらうことは可能。
21
#統計 関連スレッド

統計学を始めて習う人達には

* P値の誤用についてのASA声明(2016)
* 「有意差あり/なし」と書くスタイルの廃止と代替案について書かれたAmrhein-Greenland-McShane Nature 2019

の内容に配慮した教育が必須。

現実には統計学入門で科学的におかしな考え方を教え込んでいる。
22
#統計 統計学入門で学生の心に科学的に有害な考え方を注入している場合は実に多い。特に

【P値を得たら、まず最初に、0.05との大小比較を行ってください】

は完全にアウト。こういう教育に洗脳されて実際にそうしてしまっている科学的にダメな人達は相当に沢山いるように見える。
23
#統計 Sander Greenlandさん曰く

【統計学は、伝統的な方法論を神聖化し、学術的な数学的・哲学的訴えによってそれらを擁護し、公衆への情報提供に対する害を軽視することによって衰退してきた】

biostatistics.ucdavis.edu/sites/g/files/…

github.com/genkuroki/publ…
Thread image
24
#統計

【統計学は意味論や日常言語を無視または軽蔑し、その代わりに「有意性(significance)」や「信頼(confidence)」を保証する欺瞞的なジャーゴンを好んだ。研究が信仰の巨大跳躍抜きでそれらに近いものを何も提供しない場合でさえそうした】

github.com/genkuroki/publ…
Thread image
25
#統計 悪しきフィードバックループ!

【• 学生は、正解を保証するために暗記用の明確な実践ルールを求める
• 教員は、採点の容易さを求める
• 研究者は、受理されうる報告書を提出するためのルールを求める
• 査読者や編集者は、査読と出版の意思決定の容易さを求める】

github.com/genkuroki/publ…
Thread image
26
#統計 学生、教員、研究者、学術雑誌の編集者や査読者達で構成されたフィードバックループは、科学研究や社会的な科学コミュニケーションを蔑ろにする手抜きを維持発展させて来た。

「有意差あり/なし」の二分法は手抜きのために広く受け入れられ、大変なことになっている。

github.com/genkuroki/publ…
Thread image
27
#統計 統計学を教える仕事はGreenlandさんが指摘している「破壊的なフィードバックループ」に巻き込まれることを意味しています。

科学研究的にも社会的な科学コミュニケーション的にも有害でない教え方をするためには、フィードバックループに全力で抵抗する必要がある。

github.com/genkuroki/publ…
Thread image
28
#統計 統計学を教える仕事をする側が、Sander Greenlandさんが指摘している科学的にも社会的にも有害な破壊的フィードバックループに抵抗することには、社会的に地位や金銭面では何のメリットもなく、むしろデメリットしかない。

これが酷い統計学教育が固定される仕組み。

github.com/genkuroki/publ…
Thread image
29
#超算数 𝕏で仲間に色々教えてもらったおかげで私は過去100年以上の算数教育の伝統と慣習が現代の算数教育の内容を教科書レベルで悲惨なものにしていることについて詳しくなったのですが、「フィードバックループによる悪しき伝統と慣習の維持」が大問題であることは統計学教育と共通しています。
30
#統計 等分散性(等母分散性)という強い条件を仮定するStudentのt検定だけではなく、等分布性という強い条件を仮定するMann-WhitneyのU検定(WMW検定)は脆弱で危険な使用するべきではない検定法であることについてはリンク先のグラフを参照。
You're reading 30 of 101 posts

Create a free account to read the full thread.

Sign Up Free
Actions
Visual Editor
Update Thread
What You Can Do
  • Download as PDF
  • Save to Notion
  • Export as Markdown
  • Visual Editor
Create Free Account

Includes 7-day Premium trial