サルでもわかるし実践できる対応のあるt検定の紹介です。
サルとちんぱんが対応のあるt検定をわかりやすく紹介してくれてます。YouTubeを見れば10分足らずであなたも解析できるようになります。
こんなに簡単に検定できます
実際にYouTubeで検定している部分だけを見る場合はここから。でもサルとちんぱんが喜ぶから最初から見てあげてね。
サルでもわかる対応のあるt検定
動画の内容を簡単にテキストで紹介しておきます。動画の概要確認や資料としてお使いください。
去年のサルはバナナを10本しか食べられませんでしたが、今年は15本も食べられるようになりました。
サルは1年間で成長するのでしょうか?
サル界隈から30匹のサルに協力してもらい、データを取得しました。
増えたサルも減ったサルもいてこのままではサル界隈が変化したのかわかりにくいです。
そこで表にまとめて平均バナナを計算してみました。
去年は13.1本、今年は15.0本なので成長しているようにも見えます。
ただ、たまたま選んだ30匹のサルに偶然差があっただけかもしれません。そこで平均値の変化の検定で確かめてみたいと思います。
平均値の変化の検定について
四則演算ができるデータ、バナナの本数のようなものは平均値を計算して比較することができます。
一方、はい・いいえのような名義尺度や、段階評価のような順序しかわからない順序尺度のデータは平均値を出すことができないので、平均値の変化の検定は使えません。
変化の検定なので、2時点以上のデータが必要です。つまり同じグループで2回以上測定する必要があるということですね。
3時点以上の変化やグループ間の比較は別の手法になります。
また、データに正規性があれば今回のテーマの対応のあるt検定を、正規性がなければ符号付順位和検定を使うことになります。
正規性はサンプルサイズが30以上あれば問題ないとされています。もしくはシャピロ=ウィルク検定で確かめることもできますが、この方法は問題が指摘されています。
ここで、対応のあるt検定の名前にもある「対応」についてみてみます。
といってもとても簡単で、対応なしがグループ間比較、対応ありがグループ内変化になります。
対応の有無で検定手法が異なり、スチューデントのt検定の対応あり版が、対応のあるt検定となります。
同じように、マンホイットニーのU検定の対応あり版が、符号付順位和検定になります。
この4つの検定は、セットで覚えておくといいでしょう。
対応についてもう少し詳しく知りたい人は下記をどうぞ。
とりあえず検定手法の使い分けを覚えましょう。
対応のあるデータで2時点の比較を行う場合で、サンプルサイズが30以上あれば正規性がなくても対応のあるt検定を使いましょう。
サンプルサイズが足りない場合は、符号付順位和検定を使うことになります。
ヒトの場合の対応のあるt検定を使う例を出しておきます。
SARU統計で実際に対応のあるt検定をやってみる
動画では実際にSARU統計を使って対応のあるt検定を実施しています。
ネットにつながるパソコンやスマホがあれば他に用意するものはなにもありません。よかったら実際にSARU統計を使ってみてください。
結果です。SARU統計では論文のような表が結果として出力されます。そのほか、Rの実際の出力も出るので、RやEZRの勉強にもなったりします。
2時点の比較なので表のタイトルがTimeになっていますね。これは論文に書くときはなくても大丈夫です。
バナナを食べられる本数の平均値は去年は13.1±2.5本、今年は15.0±3.5本であり、有意に今年が多かった(P = 0.021)といった結果となりました。
統計的にはサルは成長したことになりますが、約2本の変化が重要であることを示しているわけではありません。実は差がものすごく小さくても統計的に有意差があることはよくあります。統計的な有意差と研究的な意味のある差は分けて考える必要があります。
研究的に意味のある差かどうかは研究者が背景や先行研究などから考察することになります。