ウェルチのt検定とは
ウェルチのt検定とは,等分散性が仮定できない場合の平均値の差の検定です.
等分散性とは比較する2群の分散(=データのばらつき具合)の一致度です.2群の等分散性が仮定できない,つまり分散の一致度が高くない場合は対応のないt検定が行えないため,ウェルチのt検定を行います.
等分散性を確認する方法としては,F検定があります.対応のないデータに対してはまずF検定を行い,等分性によって行うt検定を行う選択するというのが一般的な流れになります.しかし,現在ではこの流れにも様々な考え方あるためより詳しく知りたい方は補足④をお読みください.
ウェルチのt検定の検定統計量t‘は以下の式で求めることができます.
\(\bar X\)は各群の標本平均,\(\hat\sigma^2\)は各群の不偏分散となります.対応のないt検定の検定統計量との違いは合弁分散を用いない点です.
ウェルチのt検定の手順
ウェルチのt検定は以下の手順で行います.
① 仮説の設定
帰無仮説は「2群の母平均に差がない」,対立仮説は「2群の母平均に差がある」として設定します.
② 有意水準の決定
有意水準α=0.05または0.01として設定します.一般的にはα=0.05で設定されます.
③ 検定統計量の算出
t’値を検定統計量として求めます.
④ p値の算出
検定統計量からp値を算出します.Excelではデータから直接p値を求めることができます.
⑤ 有意差判定
・p値<有意水準であれば,帰無仮説は棄却されて対立仮説を採択 → 「2群の母平均に差がある」
・p値\(\geq\)有意水準であれば,帰無仮説は棄却されない → 「2群の母平均に差があるとは言えない」
仮説検定の考え方や用語については,以下のページで解説しています.
t検定を行なうなら専用ソフトで!
統計アプリStaatAppを用いれば,Excelを用いるより簡単にウェルチのt検定の検定統計量やp値,効果量を算出することができます.
t検定の結果を図示する際に用いられるエラーバーもクリック操作だけで,作成することができます.基本機能は全て無料で,有料版ではマンホイットニーのU検定などのノンパラメトリック検定や多重比較が可能です.
お気軽にダウンロードしてお使いください.
》StaatAppで行う仮説検定
》統計解析アプリStaatApp
例題で用いるデータと仮説の設定
例題では以下のサンプルデータを用います.それぞれ異なる大学生の授業Aと授業Bのテストの点数の結果になります.
帰無仮説は「2つのテストの難易度(平均点数)に差がない」となり,対立仮説は「2つのテストの難易度(平均点数)に差がある」と設定します.
有意水準α=0.05で両側検定を行います.
Excelを用いたp値の計算(データ分析ツールの実行)
実際のExcel画面を用いてp値の計算手順を説明をします.使用しているExcelのバージョンはOffice2016になります.
ウェルチのt検定で使うツールを選択するために,「データ」タブの「データ分析」をクリックします.
次に出てきた「データ分析」ウィンドウから,「t検定: 分散が等しくないと仮定した2標本による検定」をクリックして「OK」を選択します.
「t検定: 分散が等しくないと仮定した2標本による検定」における入力項目について説明します. 入力例は以下のようになります.
「変数1入力範囲(1)」「変数2入力範囲(2)」では事前に入力したデータのセルを選択します.データの範囲を選択する際に,ラベル(一行目の項目名)まで選択して「ラベル(L)」にチェックを入れます.
「二標本の平均値の差(H)」は”0”を入力します.
「α(A)」では,t検定の有意水準を入力します.最も一般的に使用する有意水準5%とする場合は,”0.05”を入力します.
「出力先オプション」では「出力先(O)」を選択して,任意のセルを選択してください.同じシート内の空白のセルを選択すると出力結果が見やすいです.
以上の項目を入力して「OK」をクリックすると,出力指定したセルに以下の表が作成されます.
作成された表のうち,両側検定を行うので「P(T<=t) 両側」の行を見ます.これは,両側検定におけるp値を示しており,今回の結果は0.0105..であることが分かります.
p値<有意水準α=0.05であるため2群の母集団に有意差はあり,帰無仮説は棄却され対立仮説が採択されます.よって「授業Aと授業Bのテストの難易度は異なる」といった結論が得られます.
※ 表中の”t”は検定統計量,”t境界値 両側”は両側検定における限界値になります.
以上が,Excelを用いたウェルチのt検定の手順になります.
補足① 片側検定の方法
片側検定の方法を解説します.
片側検定は,2つのグループの大小を明らかにしたい場合に行います.例題では帰無仮説は両側検定と同じ,「授業Aと授業Bのテストの難易度に差はない」とした際に,対立仮説は「授業Bのテストは授業Aのテストより難しい(=母平均が小さい)」とします.
片側検定において対立仮説を設定する場合は,予め2群の平均値を比較することでどちらのグループの値が大きくまたは小さくなりそうかを予測しておきます. (統計学的な作法としては,データを収集する段階から明らかにしたい仮説を設定しておくことが良いとされています.)
分析ツールの実行方法・設定内容は両側検定と同じです.片側検定では出力された「P(T<=t) 片側」の行の結果を用います.
片側検定におけるp値は0.0052..であり,有意差α=0.05より小さいことが分かります.よって帰無仮説は棄却され,対立仮説の「授業Bのテストは授業Aのテストより難しい」 といった結論になります.
以上が,片側検定の場合の手順になります.
補足② 効果量の求め方(Excelを用いた方法)
仮説検定の結果として重要な効果量の求め方について,Excelを用いて解説します.
ウェルチのt検定の効果量は様々な方法で計算することができますが,ここではCohen’s dという効果量で解説します.
Statistical Power Analysis for the Behavioral Sciences by Jacob Cohen (1988)
Cohen’s dは以下の式で求めることができます.
\(\bar X\)は各群の標本平均,nA,nBはサンプルサイズ,sA,sBは標本標準偏差になります.Excelではデータ分析ツールの結果を利用して以下のように求めることができます.
※ C16セルの入力式:=ABS((G5-H5)/SQRT(((G7-1)*G6+(H7-1)*H6)/(G7+H7)-2))
Cohen’s dは検定統計量であるt値を利用して,以下の式でも簡単に求めることができます.
Cohen’s dの値の目安としては次のようになります.
【効果量dの目安】 小:0.2 中:0.5 大:0.8
例題において効果量は大きいため,授業Aと授業Bのテストの難易度には大きな差があると言うことができます.
補足③ 用いるデータの前提条件
ウェルチのt検定を行う際に,用いるデータの前提条件について説明します.
① 対応のないグループ
ウェルチのt検定は対応のあるグループ(同一個体)のデータに対しては用いることができません.対応のある場合は,対応のあるt検定やウィルコクソンの符号順位検定を行います.
》対応のある・対応のないとは
》対応のあるt検定
》ウィルコクソンの符号順位検定
② 正規分布に従う
t検定はパラメトリックな検定になります.用いるデータが正規分布に従うと仮定できる場合に使うことができます.正規分布でない場合は,ノンパラメトリック検定であるマンホイットニーのU検定を行います.
補足④ F検定(等分散性の検定)を行うべきか
2群の平均値の差を比較する際は,等分散性を確認するためにF検定を事前に行うことが一般的と説明しました.しかし,現在の統計学では等分散性に関わらず,ウェルチのt検定を行うといった意見も強いです.
つまり,対応のないデータで正規性がある場合は全てウェルチのt検定を行うということです.
この理由としてはF検定で棄却されない場合に等分散性があると言い切れないことと,F検定とt検定で2回検定を行うことで誤差が増える(第一種の過誤)ことの2つがあります.