３群以上で比較する前に必ず読もう！普通には検定できないって知ってますか？

2022.02.04

３群以上で比較する

ふっふっふ

ど、どうしたんですか？

ｔ検定を覚えたんで、たくさんの群を一緒に比較しまくっているんです

それ、だめですよ

…え？

それ、ダメですよ（２回目）

目次

３群以上の比較には特別な方法を使おう
なぜ３群以上の比較には特別な方法が必要なの？
３群以上または３時点以上の比較の方法
どことどこに差があるかその後の検定を使おう
まとめ（時間のない人はココだけ）

３群以上の比較には特別な方法を使おう

３群以上の比較を行うには、スチューデントのｔ検定や符号付順位和検定、フィッシャーの正確検定といった基本的な統計手法を覚えておく必要があります。基本的な統計手法は下記関連記事を参考にしてください。

世の中には３つ以上に分かれることがある

さて、基本的な統計手法では２つのグループを比較していましたが、世の中には３つ以上に分かれることだってあります。

このように３つ以上のグループにおいて、平均値や中央値、割合といった値を比較するにはどうすればいいでしょうか？

３群以上いた時の組み合わせのパターン

すでにスチューデントのｔ検定やフィッシャーの正確検定のような２群間の比較ができるのであれば、各組み合わせで検定を繰り返せばできそうな気がします…。

例えば３群であれば３パターンの組み合わせがあるので、２群間比較を３回行う。４群であれば全部で６回行えばすべての組み合わせを比較できるような気がします。

すべてのグループ間の平均値の差を検定したい

でも、この方法はダメなんです。

まず、必ず覚えてほしいことがあります。それは…

３群以上の比較の場合、２群間比較の検定を繰り返してはいけない！ということです。

３群以上の比較には、特別な検定手法を用いることになります。

なぜ３群以上の比較には特別な方法が必要なの？

では、特別な検定手法の詳細を紹介する前に、なぜなぜ３群以上の比較には特別な方法が必要なのかみていきましょう。

P値と有意水準のおさらい

まずはP値と有意水準について、おさらいしましょう。

P値とは検定結果が間違っている確率です。そして有意水準は、その間違いをどこまで許してあげるかの基準です。

有意水準5％（P<0.05）とは、検定を100回やったら95回は正しいけど５回は間違えるよってこと。まぁ５回なら偶然ってことにしてあげるよってことです。

さて、確率の問題です。

正しい確率が95％のことを３回やって、全部正しい確率っていくつになるかわかりますか？

全部、正しい確率を計算してみる

正しい確率が95％を３回やるということは、0.95×0.95×0.95で計算できます（そういうもんです）。

つまり、正しい確率が95％のことを３回やって全部、正しい確率は85.7％になるんですね。

裏を返せば、３回やって少なくとも１回以上間違っている確率は14.3％になります。

あれ？やばくないですか？有意水準は5％なので、5％までは偶然ってことにして大目に見てましたが、14.3％も間違っている確率があるのであれば、ちょっと許容できないですよ！！

やればやるほど間違える確率は高くなる

実は、有意水準5％で検定をやればやるほど間違える確率は高くなっていきます。

比較する群が2群の時は、組み合わせは1つしかないので、１回以上間違える確率は5％でした。これが有意水準5％ということです。

でも、３群では14.3％に、4群では26.5％、5群にいたっては組み合わせが10パターンになり、1回以上間違える確率も40.1％とすさまじことになってしまっています。

２×２以上のクロス集計表でも同じ

これは２×２以上のクロス集計表でも同じことになります。

その他、対応のある検定で【過去】【現在】【未来】の３時点で比較しても、同じような問題が発生します。

この検定の繰り返しによる間違える確率の増大問題を解決するために、３群以上または３時点以上の比較には特別な検定手法が必要になってくるんですね。

３群以上または３時点以上の比較の方法

それでは３群以上または３時点以上の比較方法について見ていきましょう。

３群以上で比較する時はこうする

３群以上の比較を行う場合は２stepに分かれて検定を行います。

１st stepは、全体で見ます。全体のどこかに違いがあるかを検定していくことになります。

２nd stepは、１st stepでもし違いがあれば、繰り返しの検定により間違える確率が大きくならないよう調整しながら、どことどこに差があるかを検定していきます。

３群以上の比較の流れ

では、具体的に見ていきましょう。

１st stepでは、対応あり・なし、パラメトリック・ノンパラメトリック、名義尺度の検定により検定手法が分かれています。この検定ではP値は１つしか出ません。このP値が0.05（5%）未満であれば、全体の中のどこかに差があることがわかります。

全体の中のどこかに差があるかがわかれば、２nd stepでどことどこに差があるかを求めます。これをその後の検定（Post-hoc検定）や多重比較検定と呼びます。

３群以上の検定のイメージ

２群間の比較を行う基本的な統計と３群以上の検定の関係のイメージ図です。

例えば、一元配置分散分析は、パラメトリックで対応のない２群間の平均値の比較のスチューデントのｔ検定の３群以上バージョンのようなものです。

新しい統計の名前が色々出てきて、うげぇってなるかもしれませんね。

でも、クラスカル・ウォリス検定はマンホイットニーのU検定、反復測定分散分析は対応のあるｔ検定、フリードマン検定は符号付順位和検定の３群または３時点以上バージョンだと思えば、そんなに難しくないんじゃないですか？

ちなみに、フィッシャーの正確検定は３群以上でも使えるので、３群以上でもフィッシャーの正確検定です。マクネマー検定の３時点以上バージョンがコクランのQ検定にあたります。

どことどこに差があるかその後の検定を使おう

その後の検定の種類

３群以上または３時点以上の比較方法と、それぞれのその後の検定の種類を図にまとめました。

新しい名前がいっぱいですね…。

順番に見ていきましょう！

その後の検定でできること

まず、その後の検定でできることを確認しておきましょう、

その後の検定では、どことどこに差があるか調べるために、組み合わせの数で調整したP値を求めることができます。

ただし、組み合わせが多いほどP値は大きくなる＝つまり有意差が出にくくなります。５群以上になると、かなりの人数がいるか、はっきりとした差がないと有意差が出にくくなります。

検出力（P値が小さくなる＝有意差が出やすい）

差を見つける力を検出力といいます。簡単に言えば、どの方法がP値が小さくなるかということですね！

とりあえず、Bonferroni法（ボンフェローニ法）は、簡単に計算できてどの手法でも使えるけど、有意差が出にくい方法ということを覚えておきましょう。ただ、簡単なので結構論文とかにも使われたりしています。

それぞれの手法の記事で、おすすめのその後の検定を紹介しているので、ここでは深く考えなくてOKです。

ただ、Steel法とDunnett法だけは、使い方が少し違うので、最後にそこだけ確認しておきましょう。

すべての組み合わせでP値を計算

まず、Bonferroni法、Holm法、Tukey法、Steel-Dwass法です。これは、すべての組み合わせでP値を計算します。

対照との比較のP値を計算

それに対し、Dunnett法とSteel法は対照群を１つ決めて、そことの差を検定します。上の図の例では、【対照×A】と【対照×B】のみ検定し、【A×B】は検定しません。

そのため組み合わせの数が減り、P値が小さくなりやすいです（有意差が出やすい）。

もちろん、P値が小さくなるので使うのではなく、研究の目的として【A×B】が必要ない場合に使うようにしましょうね！

まとめ（時間のない人はココだけ）

見出し

３群または３時点以上の検定は専用の検定手法を用いる

一元配置分散分析
クラスカル・ウォリス検定
反復測定分散分析
フリードマン検定
フィッシャーの正確検定
コクランのQ検定

また、EZRで行う３群以上の検定を含む高度な統計解析の方法は下記カテゴリーから学べます。

EZRの高度解析

EZRで行う高度な統計解析法について紹介します。３群の比較に用いる手法や線形回帰などがまとまっています。各検定手法には、すべてサンプルデータや練習問題があります

タイトルとURLをコピーしました