任意のExcelファイルやCSVファイルのデータ分析を行う統計解析アプリ(StaatApp)を用いた,Cox比例ハザード回帰の方法について紹介します.
予測モデルを使用した生存曲線の作成も行うことができます.
》アプリ(Windows版)の購入
》統計解析アプリStaatAppとは
データの読込・操作
① アプリの起動からデータ入力
ダウンロードした「StaatApp_for_Cox_proportional_hazards」の起動からデータの読込までの基本操作は以下のページで解説しています.
読み込ませたサンプルデータ(Excelファイル)は以下のようになります.

② データの操作方法
読み込んだデータの操作方法(データクレンジング)は以下のページで紹介しています.例ではカテゴリーデータ(性別・結婚)が含まれるため,ダミー変数に変換する必要があります.
Cox比例ハザード回帰の実行方法
① Cox比例ハザード回帰の選択
メニューバーから「その他」→「生存時間解析」→「Cox比例ハザード回帰」を選択します.
※ ☀マークが実行可能な統計解析です.基本統計量の算出や散布図行列の作成も可能です.

② 目的変数の選択
Cox比例ハザード回帰用のウィンドウが表示されたら,目的変数のコンボボックスからの経過時間データとイベント発生データとする変数名(列名)を選択します.
③ 説明変数の選択
説明変数は変数一覧に表示されてる変数名をクリックして選択します.
ダミー変数を選択する際は,多重共線性の問題を回避するために”1列分”を除いて選択します.

④ 解析の実行(比例ハザード性の検証)
設定が完了したらツールバーの「解析実行」ボタンをクリックして比例ハザード性の検証を実行します.実行結果は以下のように画面右側に表示されます.

出力結果はツールバーの「CSV出力」ボタンから出力可能です.
④ 解析の実行(Cox比例ハザード回帰)
「解析項目」から「Cox比例ハザード回帰」を選択して,「実行」ボタンをクリックします.

予測した生存曲線の作成
Cox比例ハザード回帰で作成したモデルを用いて,生存曲線の予測を行います.事前にアプリで解析が実行されていることが前提条件となります.
① 予測用データの作成
アプリに読み込ませる予測用のデータを作成します.予測用データは入力データと同様にExcelなどを用いて以下のように作成します.
収入 | 年齢 | 性別_女性 | 結婚_既婚 |
580 | 32 | 1 | 0 |
430 | 28 | 0 | 0 |
※ 列名を解析実行時に選択した列名と一致させる必要があります(順不同).
※ カテゴリーデータは事前にダミー変数に変換して入力してください.
② 予測用データの読み込み
予測グラフタブの「ファイル選択」ボタンをクリックして,予測用データを読み込みます.読み込まれたデータが表示されます.

③ グラフ作成
「グラフ作成」ボタンをクリックすると,以下のように生存曲線が作成・表示されます.

グラフ出力先を選択した状態で,グラフ作成を行うとグラフ画像が”graph.png”というファイル名で自動保存されます.
補足① Cox比例ハザード回帰とは
Cox比例ハザード回帰とは,生存時間データのための重回帰分析です.生存時間データは生存曲線で表され,イベント発生までの時間を示すデータになります.Cox比例ハザード回帰を行うことで,生存時間データに影響を与えている要因(共変量)を調べることや生存曲線を予測するモデルを作ることができます.
Cox比例ハザード回帰についてや,結果の見方は以下のページで詳しく解説しています.
補足② 統計アプリStaatAppとは
StaatAppは計算仮定が複雑な解析手法を,誰でも手軽に素早く行なうことができるアプリです.StaatAppの詳細は以下のページをお読みください.
補足③ アプリの仕様について
アプリではPythonのlifelinesライブラリを用いて生存時間解析を行っています.lifelinesはPythonで生存時間解析を行なう際に使用される一般的なライブラリです.
以下の公式ドキュメントに詳細な仕様が記載されています.
➔ Cox比例ハザード回帰公式ドキュメント(lifelines)
補足④ 起動時に発生するエラーについて
StaatAppを起動した際に,以下の画面が表示されて起動しない場合があります.

原因は起動しているユーザ名に日本語が含まれているためです.対応方法は以下のページで紹介しています.