サルでもわかるし実践できる符号付順位和検定の紹介です。
サルとちんぱんが符号付順位和検定をわかりやすく紹介してくれてます。YouTubeを見れば10分足らずであなたも解析できるようになります。
こんなに簡単に検定できます
実際にYouTubeで検定している部分だけを見る場合はここから。でもサルとちんぱんが喜ぶから最初から見てあげてね。
サルでもわかる符号付順位和検定
動画の内容を簡単にテキストで紹介しておきます。動画の概要確認や資料としてお使いください。
バナナ鑑定士のサルは、毎年バナナに独自でグレードを付けているそうです。
毎年15のバナナ農園からバナナのもらって鑑定しています。
サルは去年と比べて今年のバナナがおいしくなったか気になっているみたいですね。
ヒストグラムにしてみました。
グラフを見ると、今年の方がSとAグレードに分布が偏っているようにも見えます。
ただ、これだけでは差がありそうな、なさそうな気がします。
続いて中央値を計算するために、グレードを順位に置き換えてみました。
順位に置き換えたので、中央値が出せます。
それぞれ順番にならべて真ん中にくる値が中央値です。
去年のバナナは2、今年は3なので、中央値にも差がありそうな気がします。この差が偶然かどうか検定で確かめてみたいと思います。
順序の変化の検定について
変化の検定なので、2時点以上のデータが必要です。つまり同じグループで2回以上測定する必要があるということですね。
3時点以上の変化やグループ間の比較は別の手法になります。
平均値が出せる間隔・比例尺度のデータで、正規性が確保できる(サンプルサイズが30以上)であれば対応のあるt検定を使いましょう。そうでなければ符号付順位和検定を使います。
順序しか出せない順序尺度のデータは、符号付順位和検定を使うことになります。
ここで、対応のあるt検定の名前にもある「対応」についてみてみます。
といってもとても簡単で、対応なしがグループ間比較、対応ありがグループ内変化になります。
対応の有無で検定手法が異なり、スチューデントのt検定の対応あり版が、対応のあるt検定となります。
同じように、マンホイットニーのU検定の対応あり版が、符号付順位和検定になります。
この4つの検定は、セットで覚えておくといいでしょう。
対応についてもう少し詳しく知りたい人は下記をどうぞ。
とりあえず検定手法の使い分けを覚えておきましょう。
対応のある2時点の変化の比較で、平均値が出せる間隔・比例尺のデータだが、サンプルサイズが30未満の場合や、順序しか出せない順序尺度のデータは符号付順位和検定を使います。
ヒトの場合の符号付順位和検定を使う例を出しておきます。
SARU統計で実際に対応のあるt検定をやってみる
動画では実際にSARU統計を使って符号付順位和検定を実施しています。
ネットにつながるパソコンやスマホがあれば他に用意するものはなにもありません。よかったら実際にSARU統計を使ってみてください。
結果です。SARU統計では論文のような表が結果として出力されます。そのほか、Rの実際の出力も出るので、RやEZRの勉強にもなったりします。
出力結果には平均値のデータも出ていますが、バナナのグレードは順序尺度なので、平均値を出すのは不適切です。結果は中央値を使いましょう。
バナナのグレードの中央値は、去年は2.0、今年は3.0であり、有意に今年が良かった(P = 0.025)といった結果となります。
去年より今年の方がバナナはおいしくなったみたいですね。