
読み込んだデータが、そのまま解析に使えるとは限りません。「BMIを計算したい」「年齢を年代別に分けたい」「特定の条件の人だけを解析したい」といった場合、この「データ管理」機能を使います。
SARU統計では、Excelを使わずにブラウザ上で手軽にデータの前処理(クリーニング)を行うことができます。
この機能でできること
- 変数の作成: 計算式を使って新しい項目を作ります(例:BMI)。
- グループ化: 数値を区切ってカテゴリにします(例:年齢→年代)。
- 絞り込み: 条件に合うデータだけを残します(例:女性のみ)。
- 整理: 変数名の変更、並べ替え、欠損値の処理など。
1. 👁️ データセット画面へ
現在読み込んでいるデータの中身を表形式で確認できます。
- 確認: データが正しく読み込まれているか、空欄(欠損値)がないかなどをチェックします。
- プレビュー: 動作を軽くするため、データ量が多い場合は先頭の100行のみが表示されます。
2. ➕ 変数作成
既存の変数を使って計算を行い、新しい変数を作成します。
使い方
- **「新しい変数名」**を入力します(例:
BMI)。 - **「計算式」**を入力します。変数リストから選択して挿入することもできます。
- 例:
体重 / (身長/100)^2
- 例:
- **「変数を作成」**ボタンを押します。
💡 使える計算式
- 四則演算:
+,-,*(掛け算),/(割り算) - べき乗:
^2(2乗) - 関数:
log()(対数),sqrt()(平方根) など
3. 📊 グループ分け
年齢や検査値などの連続した数値を、区切ってグループ(カテゴリ)にします。
使い方
- **「対象の変数」**を選びます(例:
年齢)。 - **「分割方法」**を選びます。
- 等間隔: 値の範囲を等しく分割します。
- 等頻度: 各グループの人数がだいたい同じになるように分割します。
- 任意の境界値: 自分で区切りを指定します(例:
20, 40, 60と入力すると、〜20、20〜40、40〜60、60〜 に分かれます)。
- **「グループ変数を作成」**ボタンを押します。
4. ✂️ 絞り込み(フィルタ)
特定の条件に合致するデータだけを残し、それ以外を削除します。
使い方
- **「削除条件」**を入力します。
- 例:
性別 == "男性"(男性以外を削除=男性のみ残す) - 例:
年齢 >= 65(65歳以上のみ残す)
- 例:
- **「フィルタを適用」**ボタンを押すと、条件に合わない行が削除されます。
5. 🔄 置換・順序
カテゴリ変数の「値の書き換え」や「表示順序の変更」を行います。
- 値の書き換え:
0→なし、1→ありのように、分かりやすい名前に変更できます。 - 順序の変更: グラフや表に出力される順番を並べ替えることができます。特に、コクラン・アーミテージ検定やヨンクヒール・タプストラ検定などの傾向をみる検定では、この順序が解析結果に直接影響するため非常に重要です(例:軽症→中等症→重症)。
6. ⚙️ 変数管理
- 変数名の変更: 分かりにくい変数名をリネームできます。
- 変数の削除: 解析に使わない不要な列を削除して、データをスッキリさせることができます。
7. 🗑️ 欠損値処理
データに含まれる空欄(NA:欠損値)を処理します。 多くの統計解析では、欠損値が含まれていると計算ができないため、事前にこの機能で削除しておくとスムーズです。
- 全変数対象: データセット内のどこかに欠損がある行をすべて削除します。
- 指定変数のみ: 特定の変数に欠損がある行だけを削除します。
⚠️ 重要な注意点
ここで行った編集は、ブラウザ内の一時データにのみ反映され、元のExcelファイルが書き換わることはありません。 編集後のデータを保存したい場合は、サイドバーのボタンから操作します。
- 💾 保存: 現在のデータセットをブラウザ内に「上書き保存」または「新規保存」します。
- 📥 出力: 新しいExcelファイルとしてパソコンにダウンロードします。


