任意のExcelファイルやCSVファイルから重回帰分析で標準偏回帰係数やVIFを求める方法について紹介します.
標準偏回帰係数やVIFはExcelでも計算可能ですが,より簡単に行うために統計解析アプリ(StaatApp)を用いた手順で説明します.
》アプリ(Windows版)の購入
》統計解析アプリStaatAppとは
動画で紹介

データの読込・操作
① アプリの起動からデータ入力
ダウンロードした「StaatApp_for_Multiple」の起動からデータの読込までの基本操作は以下のページで解説しています.
読み込ませたサンプルデータ(Excelファイル)は以下のようになります.

② データの操作方法
読み込んだデータの操作方法(データクレンジング)は以下のページで紹介しています.
重回帰分析の実行方法
① 重回帰分析の選択
メニューバーから「多変量解析」→「重回帰分析」を選択します.
※ ☀マークが実行可能な統計解析です.基本統計量の算出や散布図行列の作成も可能です.

② 目的変数の選択
重回帰分析用のウィンドウが表示されたら,目的変数のコンボボックスからの対象とする変数名を選択します.
③ 説明変数の選択
説明変数は変数一覧に表示されてる変数名をクリックして選択します.
ダミー変数を選択する際は,多重共線性の問題を回避するために”1列分”を除いて選択します.例ではダミー変数はありません.

④ 解析の実行
設定が完了したらツールバーの「解析実行」ボタンをクリックして重回帰分析を実行します.実行結果は以下のように画面右側に表示されます.

出力結果はツールバーの「CSV出力」ボタンから出力可能です.以上がStaatAppを用いた重回帰分析の方法です.
補足① 結果の見方
出力結果と簡単な説明は以下になります.
出力項目 | 概要 | 解釈例 |
サンプルサイズ | 各変数の観測数 | 例では10人のデータを用いたため,n=10 |
自由度調整済み決定係数 | 回帰式の当てはまり度 | 0.94..という値は非常に当てはまりがよい |
偏回帰係数 | 該当する変数の影響度 | 年齢の偏回帰係数は11.53..であり,正の影響を与える |
t(検定統計量) | 偏回帰係数の検定統計量 | 大学(偏差値)は2以上であり,統計学的に有意な偏回帰係数 |
p値 | 偏回帰係数の検定のp値 | 通勤時間(分)はp<0.05であるため,統計学的に有意でない |
標準偏回帰係数 | 変数間で影響度を比較する指標 | 扶養人数に対して,年齢の値が大きいため影響度が大きい |
VIF | 多重共線性の指標 | 全ての変数が10未満のため,問題はない |
重回帰分析の詳しい解説や各指標値の意味については,以下のページで解説しています.
補足② 統計アプリStaatAppとは
StaatAppは計算仮定が複雑な解析手法を,誰でも手軽に素早く行なうことができるアプリです.StaatAppの詳細は以下のページをお読みください.
補足③ アプリの仕様について
アプリではPythonのScipyライブラリに含まれる,statsmodelsモジュールを用いて重回帰分析を行っています.statsmodelsはPythonで統計解析を行なう際に最も一般的なモジュールです.
以下の公式ドキュメントに詳細な仕様が記載されています.
補足④ 起動時に発生するエラーについて
StaatAppを起動した際に,以下の画面が表示されて起動しない場合があります.

原因は起動しているユーザ名に日本語が含まれているためです.対応方法は以下のページで紹介しています.