統計アプリ

【StaatAppで行う】判別分析

StaatAppで判別分析を行う方法を紹介します.SaatAppではCSVファイルやExcelファイルを読み込み,クリック操作だけで判別分析を行うことができます.

StaatAppについては以下をご覧ください.

》統計解析アプリStaatAppとは

アプリの基本操作

StaatApp基本操作(データの入出力など)は以下のページで解説しています.

》StaatAppの基本操作

分析例として用いるサンプルデータ(タイタニック号データ)は以下のようになります.

判別分析のサンプルデータ

判別分析の実行(モデルの作成)

メニューバーから「多変量解析」→「判別分析」を選択して判別分析用ウィンドウを表示します.

判別分析の選択

判別分析用ウィンドウが表示されたら,目的変数と説明変数の設定を行います.

》目的変数・説明変数の選び方

ダミー変数を説明変数に選択する際は,多重共線性の問題を回避するために1列分を除いて選択します.

変数の選択

設定項目に入力が完了したら,ツールバーの「モデル作成」ボタンをクリックします.画面右側の「解析結果」に判別分析の結果が出力されます.

判別分析の結果

関数ごとの指標値はポップアップボタンをクリックすることで以下のように表示することもできます.

“正準相関”は正準判別相関係数を意味します.

累積寄与率・正準判別相関係数の結果

「結果2」のタブをクリックすると,説明変数ごとの標準化判別係数を確認することができます.

標準化判別係数

「描画」ボタンをクリックすると,関数1と関数2に対する判別得点のグラフが作成されます.

判別得点のグラフ作成例

判別得点は目的変数のカテゴリー数が3以上の場合のみ作成できます.

予測精度の評価(応用)

作成したモデルに対して,予測精度の評価を行う場合は「評価」タブで行います.事前にテストデータをモデル作成とは別のデータに入力しておき,「テストデータの選択」で対象のデータを選択します.

》SaatAppを用いたテストデータの作成

「算出」ボタンをクリックすると以下のように各評価指標と混合行列が表示されます.

※ テストデータには説明変数で選択した変数名(列名)を含む必要があります.

判別分析の予測精度の評価

分類問題の評価指標と混合行列は以下のページで解説しています.

》分類問題の評価指標

予測値の算出(応用)

作成したモデルを用いて予測値の算出を行います.「予測」タブから「予測用データの選択」を行い「算出」ボタンをクリックします.

※ 予測用データには説明変数で選択した変数名(列名)を含む必要があります.

判別分析の予測値の算出結果

予測用データに対して,判定結果と予測確率が算出されます.

自動考察

判別分析の解析結果について自動考察を行なうと,モデルの適合度と説明変数ごとの統計量,標準化判別係数について,以下のような考察結果を得ることができます.

判別分析の自動考察結果

》自動考察機能について詳しく

補足① 統計アプリStaatAppとは

StaatAppは計算仮定が複雑な解析手法を,誰でも手軽に素早く行なうことができるアプリです.StaatAppの詳細は以下のページをお読みください.

》統計解析アプリStaatApp

統計解析アプリStaatApp

補足② アプリの仕様について

アプリではPythonのscikit-learnライブラリを用いて判別分析を行っています.scikit-learnはPythonで統計解析・機械学習を行なう際に最も一般的なモジュールです

以下の公式ドキュメントに詳細な仕様が記載されています.

・scikit-learn(線形判別分析)