
SARU統計は、統計ソフトRが使える無料のオンラインツールです。Excel等のデータさえあればコピペですぐに解析できます。また、サルのために作られているので簡単・無料です。計算はすべてRで行われているので論文や学会発表にも使えます。この記事にサッと目を通して解析しちゃおう!
サルでもわかるし実践できるマンホイットニーのU検定の紹介です。
サルとちんぱんがマンホイットニーのU検定をわかりやすく紹介してくれてます。YouTubeを見れば10分足らずであなたも解析できるようになります。
こんなに簡単に検定できます

実際にYouTubeで検定している部分だけを見る場合はここから。でもサルとちんぱんが喜ぶから最初から見てあげてね。
サルでもわかるマンホイットニーのU検定
動画の内容を簡単にテキストで紹介しておきます。動画の概要確認や資料としてお使いください。

サルとちんぱんはどちらもバナナが好きなようです。でもどっちが好きなんでしょうか?
好き嫌いは数値ではないので比較しにくいです。

なので、嗜好を段階評価にしました。
これを順序尺度といいます。順序尺度は数値データはありませんが、順番はわかる尺度です。

サル界隈とちんぱん界隈から10匹ずつ集めて、バナナの嗜好性を調査しました。
このままでは比較しにくいのでグラフを書いてみます。

グラフを見る限り、サルのほうが大好きに分布が偏っています。差がありそうな、なさそうなちょっとまだわからないですね。

次に中央値を計算してみます。
大嫌いから大好きまで、1~5の順番を付けました。

そして、数値に置き換えて、中央値を計算します。
中央値はデータを順番に並べて真ん中にくる値です。
サルが4.5、ちんぱんが3.5と、中央値を見てもサルの方がバナナを好きなような気がします。
ただし、検定をしないとこの差が偶然なのかどうか判断することができません。
順序の分布の差の検定について

順序が出せるデータは順序の差の検定を行えます。
バナナの本数のように足したり割ったりできる間隔・比例尺度のデータも順序がだせます。もちろん平均値も出せるのでスチューデントのt検定のような平均値の差の検定も選択に入ります。
また、バナナの嗜好のように、順序のみわかるデータでも検定することができます。
ただし、はい・いいえのような名義尺度のデータでは検定できません。

まず、平均値が出せるデータは、できるだけパラメトリック検定を使いましょう。
正規性や等分散性がなかったり、サンプルサイズが足りない場合はパラメトリック検定が使えないので順序の差の検定を使います。
順序しか出せないデータは、パラメトリック検定が使えません。
そして、2グループ間の比較であればマンホイットニーのU検定となります。3グループ以上の比較やグループ内の変化の比較は検定方法が異なります。

とりあえず、これを覚えておきましょう。
2グループ間の比較で、平均値が出せるがサンプルサイズが足りずパラメトリック検定が使えない場合や順序しか出せないデータの比較をしたいときはマンホイットニーのU検定を使いましょう。

ヒトの場合のマンホイットニーのU検定を使う例を出しておきます。
SARU統計で実際にマンホイットニーのU検定をやってみる
動画では実際にSARU統計を使ってマンホイットニーのU検定を実施しています。
ネットにつながるパソコンやスマホがあれば他に用意するものはなにもありません。よかったら実際にSARU統計を使ってみてください。

結果です。SARU統計では論文のような表が結果として出力されます。そのほか、Rの実際の出力も出るので、RやEZRの勉強にもなったりします。
今回は5件法という調査方法なので平均値を出すこともできます。もちろん中央値で結果を書いても問題ありません。詳しくは以下の記事から。
サルのバナナの嗜好の平均値は4.1±1.1であり、ちんぱんの3.3±1.2と比較して有意な差はなかった(P = 0.117)という結果となります。
ただし、P値はサンプルサイズに大きく影響を受けます。サンプルサイズが増えると有意差がでたりするんですね。なので、差がなかったという結論というよりは、今回の結果からでは差があるかわからなかったといったニュアンスになるので注意しましょう。
まとめ
