Excel

コクランのQ検定

コクランのQ検定とは

マクネマー検定とは対応のある場合の3つ以上の2値変数に対する検定です.対応のある場合に,3群以上の変数間の割合に差があるかどうかを判定するために行います.→ 2値ではない場合

検定統計量はカイ二乗分布に従います.

以下の図がコクランのQ検定の考え方になります.社会人5人に対する調査結果の例です.

コクランのQ検定の考え方

コクランのQ検定は整然データに対して検定を行います.上記のような整然データから各列・行の合計値(2値データを1/0に変換した合計値)を求めます.

各列の合計値の差は要因(国)による効果を示しており,各行間の合計値の差は誤差(回答者)による効果を示します.検定統計量は誤差の効果に対する要因の効果で求めることができます.

検定統計量は要因の効果が大きくなるほど値が大きくなり,カイ二乗分布の限界値(上限)より大きい場合に有意差があると判定します.

棄却域の考え方

具体例で有意差がある場合,「旅行に行きたい国に差がある」といった結論を得ることができます.

コクランのQ検定の手順

コクランのQ検定は以下の手順で行います.

① 仮説の設定
 帰無仮説は「各群(各変数)の母集団の比率に差がない」,対立仮説は「各群(各変数)の母集団の比率に差がある」として設定します.

③ 有意水準の決定
 有意水準α=0.05または0.01として設定します.一般的にはα=0.05で設定されます.

④ 検定統計量の算出
 手元のデータから検定統計量求めます.

⑤ p値の算出
 検定統計量からp値を算出します.

⑥ 有意差判定
 ・p値<有意水準であれば,帰無仮説は棄却されて対立仮説を採択 → 「各群の母集団の比率に差がある」
 ・p値\(\geq\)有意水準であれば,帰無仮説は棄却されない → 「各群の母集団の比率に差があるとは言えない」

仮説検定の考え方や用語については,以下のページで解説しています.

》仮説検定とは

例題で用いるデータと仮説の設定

例題では以下のサンプルデータを用います.7人の社会人に対して行った,「4ヶ国のどこに旅行に行きたいか」という質問の回答結果になります.

コクランのQ検定の例題用データ

帰無仮説は「4ヶ国の旅行人気に差がない」となり,対立仮説は「4ヶ国の旅行人気に差がある」と設定します.

有意水準α=0.05で行います.

Excelを用いた計算手順

Excelを用いたp値の計算手順について説明します.

以下のような表を作成して,検定統計量とp値を求めます.(説明のためハワイ→A,台湾→B,,,と変換しています)

Excelを用いたコクランのQ検定の計算例

各セルの入力式は以下のようになります.

 ・C10:=SUM(C3:C9)
 ・G3:=SUM(C3:F3)
 ・G10:=SUM(G3:G9)
 ・H3:=G3^2
 ・H10:=SUM(H3:H9)
 ・K3:=(C10+D10+E10+F10)/K2
 ・K4:=(K2*(K2-1)*((C10-K3)^2+(D10-K3)^2+(E10-K3)^2+(F10-K3)^2))/((K2*G10)-H10)
 ・K5:=CHIDIST(K4,K2-1)

計算手順と入力式について説明します.

① 2値データを入力する
 カテゴリーデータを”1”と”0”に変換した表を作成します.

② 各行の合計値と合計値の2乗を求める【G3-9】【H3-9】
 作成した表の行ごとの合計値と,求めた合計値を2乗した値を求めます.

③ 各列の合計値を求める【C-H10】
 ②で求めた値の列ごとの合計値を求めます.

④ 各群の列合計値の平均値を求める【K3】
 各群の列合計値の平均値を求めます.K2セルのkには群数(変数の数)を入力しておきます.

⑤ 検定統計量Tを求める【K4】
 検定統計量Tを求めます.検定統計量は以下の式で求めることができます.

コクランのQ検定の検定統計量の計算式

 Riはi列の合計値,Sjはj行の合計値になります.

⑥ p値を求める【K5】
 検定統計量からp値を求めます.ExcelではCHIDIST関数を用いてカイ二乗分布のp値を求めることができます.

 CHIDIST関数の引数:CHIDIST(“検定統計量”,”自由度”)

 自由度は群数-1で求めることができます.

例題ではp値は0.0384…となり有意水準未満であるため帰無仮説は棄却され,「4ヶ国の旅行人気に差がある」といった結論を得ることができます.

》正しく理解したい!p値とは

補足① データの前提条件

コクランのQ検定を行う際の扱うデータの前提条件について紹介します.

① 対応のある場合
 コクランのQ検定は対応のないグループ(別個体)のデータに対しては用いることができません.対応のない場合は,独立性の検定を行う必要があります.

》対応のある・対応のないとは

② 3群以上の場合
 コクランのQ検定は3群以上の差の検定になります.2群の差の比較を行なう場合は,マクネマー検定を行います.

③ 2値データ(質的変数)
 2値データに対して行います.3値以上の順位データなどに対して比較を行なう場合は,フリードマン検定を行います.扱うデータが量的データである場合は,対応のある一元配置分散分析を行います.

》統計学におけるデータの種類

補足② 多重比較との関係性

コクランのQ検定では,3つ以上グループがある場合にどのグループとどのグループが異なるかまでは判断することができません.これらのことを判断したい場合は,「多重比較」という分析を行います.

》徹底解説!多重比較