データ機能の紹介|変数の編集と加工

読み込んだデータが、そのまま解析に使えるとは限りません。「BMIを計算したい」「年齢を年代別に分けたい」「特定の条件の人だけを解析したい」といった場合、この「データ管理」機能を使います。

SARU統計では、Excelを使わずにブラウザ上で手軽にデータの前処理(クリーニング)を行うことができます。

この機能でできること

  • 変数の作成: 計算式を使って新しい項目を作ります(例:BMI)。
  • グループ化: 数値を区切ってカテゴリにします(例:年齢→年代)。
  • 絞り込み: 条件に合うデータだけを残します(例:女性のみ)。
  • 整理: 変数名の変更、並べ替え、欠損値の処理など。

1. 👁️ データセット画面へ

現在読み込んでいるデータの中身を表形式で確認できます。

  • 確認: データが正しく読み込まれているか、空欄(欠損値)がないかなどをチェックします。
  • プレビュー: 動作を軽くするため、データ量が多い場合は先頭の100行のみが表示されます。

2. ➕ 変数作成

既存の変数を使って計算を行い、新しい変数を作成します。

使い方

  1. **「新しい変数名」**を入力します(例:BMI)。
  2. **「計算式」**を入力します。変数リストから選択して挿入することもできます。
    • 例: 体重 / (身長/100)^2
  3. **「変数を作成」**ボタンを押します。

💡 使える計算式

  • 四則演算: +-* (掛け算), / (割り算)
  • べき乗: ^2 (2乗)
  • 関数: log() (対数), sqrt() (平方根) など

3. 📊 グループ分け

年齢や検査値などの連続した数値を、区切ってグループ(カテゴリ)にします。

使い方

  1. **「対象の変数」**を選びます(例:年齢)。
  2. **「分割方法」**を選びます。
    • 等間隔: 値の範囲を等しく分割します。
    • 等頻度: 各グループの人数がだいたい同じになるように分割します。
    • 任意の境界値: 自分で区切りを指定します(例:20, 40, 60 と入力すると、〜20、20〜40、40〜60、60〜 に分かれます)。
  3. **「グループ変数を作成」**ボタンを押します。

4. ✂️ 絞り込み(フィルタ)

特定の条件に合致するデータだけを残し、それ以外を削除します。

使い方

  1. **「削除条件」**を入力します。
    • 例: 性別 == "男性" (男性以外を削除=男性のみ残す)
    • 例: 年齢 >= 65 (65歳以上のみ残す)
  2. **「フィルタを適用」**ボタンを押すと、条件に合わない行が削除されます。

5. 🔄 置換・順序

カテゴリ変数の「値の書き換え」や「表示順序の変更」を行います。

  • 値の書き換え0 → なし1 → あり のように、分かりやすい名前に変更できます。
  • 順序の変更: グラフや表に出力される順番を並べ替えることができます。特に、コクラン・アーミテージ検定ヨンクヒール・タプストラ検定などの傾向をみる検定では、この順序が解析結果に直接影響するため非常に重要です(例:軽症→中等症→重症)。

6. ⚙️ 変数管理

  • 変数名の変更: 分かりにくい変数名をリネームできます。
  • 変数の削除: 解析に使わない不要な列を削除して、データをスッキリさせることができます。

7. 🗑️ 欠損値処理

データに含まれる空欄(NA:欠損値)を処理します。 多くの統計解析では、欠損値が含まれていると計算ができないため、事前にこの機能で削除しておくとスムーズです。

  • 全変数対象: データセット内のどこかに欠損がある行をすべて削除します。
  • 指定変数のみ: 特定の変数に欠損がある行だけを削除します。

⚠️ 重要な注意点

ここで行った編集は、ブラウザ内の一時データにのみ反映され、元のExcelファイルが書き換わることはありません。 編集後のデータを保存したい場合は、サイドバーのボタンから操作します。

  • 💾 保存: 現在のデータセットをブラウザ内に「上書き保存」または「新規保存」します。
  • 📥 出力: 新しいExcelファイルとしてパソコンにダウンロードします。
タイトルとURLをコピーしました