StaatAppで判別分析を行う方法を紹介します.SaatAppではCSVファイルやExcelファイルを読み込み,クリック操作だけで判別分析を行うことができます.
StaatAppについては以下をご覧ください.
アプリの基本操作
StaatApp基本操作(データの入出力など)は以下のページで解説しています.
分析例として用いるサンプルデータ(タイタニック号データ)は以下のようになります.
判別分析の実行(モデルの作成)
メニューバーから「多変量解析」→「判別分析」を選択して判別分析用ウィンドウを表示します.
判別分析用ウィンドウが表示されたら,目的変数と説明変数の設定を行います.
ダミー変数を説明変数に選択する際は,多重共線性の問題を回避するために1列分を除いて選択します.
設定項目に入力が完了したら,ツールバーの「モデル作成」ボタンをクリックします.画面右側の「解析結果」に判別分析の結果が出力されます.
関数ごとの指標値はポップアップボタンをクリックすることで以下のように表示することもできます.
“正準相関”は正準判別相関係数を意味します.
「結果2」のタブをクリックすると,説明変数ごとの標準化判別係数を確認することができます.
「描画」ボタンをクリックすると,関数1と関数2に対する判別得点のグラフが作成されます.
判別得点は目的変数のカテゴリー数が3以上の場合のみ作成できます.
予測精度の評価(応用)
作成したモデルに対して,予測精度の評価を行う場合は「評価」タブで行います.事前にテストデータをモデル作成とは別のデータに入力しておき,「テストデータの選択」で対象のデータを選択します.
「算出」ボタンをクリックすると以下のように各評価指標と混合行列が表示されます.
※ テストデータには説明変数で選択した変数名(列名)を含む必要があります.
分類問題の評価指標と混合行列は以下のページで解説しています.
予測値の算出(応用)
作成したモデルを用いて予測値の算出を行います.「予測」タブから「予測用データの選択」を行い「算出」ボタンをクリックします.
※ 予測用データには説明変数で選択した変数名(列名)を含む必要があります.
予測用データに対して,判定結果と予測確率が算出されます.
自動考察
判別分析の解析結果について自動考察を行なうと,モデルの適合度と説明変数ごとの統計量,標準化判別係数について,以下のような考察結果を得ることができます.
補足① 統計アプリStaatAppとは
StaatAppは計算仮定が複雑な解析手法を,誰でも手軽に素早く行なうことができるアプリです.StaatAppの詳細は以下のページをお読みください.
補足② アプリの仕様について
アプリではPythonのscikit-learnライブラリを用いて判別分析を行っています.scikit-learnはPythonで統計解析・機械学習を行なう際に最も一般的なモジュールです
以下の公式ドキュメントに詳細な仕様が記載されています.