徹底解説

アンケート調査の計画・分析

はじめに

本ページは主にアンケート調査の方法・分析方法について,非常に詳しく解説されている下記2つの文献を参考に作成しました.これらの内容をより実践的に解説するためにGoogleFormsの具体例を用いています.また,図解化することで気軽に読める内容となっています.

アンケート調査を行いたいけど何から考えればよいかわからない,調査結果はあるけどどのように分析すればよいかわからないという方はぜひ最後まで読んでみてください.

※ 途中からは有料コンテンツになりますが,専門書と比較してかなり安価となっています.

アンケート調査の手順

アンケート調査の大まかな流れは,アンケート調査の計画,調査書の作成,アンケートの実施,アンケート結果の分析・報告に分けることができます.この中で最も重要かつ疎かにされがちなのが,アンケート調査の計画・作成になります.

アンケート調査の計画・作成ではアンケートの目的や質問内容,調査方法を検討します.計画・作成段階で重要なのが最終的な成果物を作成するために,必要な分析や報告形式を考慮することです.

Discordでのご相談時によくありがちなのが,『参考文献と同じ手法で分析を行いたいが,実施したアンケート結果ではその分析手法を行うことができない』といった問題です.データの分析方法には手法ごとの制約条件があり,計画段階で考慮していないといざ分析する際に行うことができないといった致命的な問題が発生してしまいます.

そういったアンケート調査での失敗を防ぐために,このページでは計画段階や作成時に必ず考えるべきことを重点的に解説しています.

アンケート調査の計画

アンケート調査の計画では目的・方法・対象の3つを検討します.検討する際のポイントや注意点を解説します.

① 目的の整理
アンケート調査の目的(仮説の検証・実態の把握)

アンケート調査を行う上でまず整理するのがアンケート調査の目的です.アンケート調査の目的は仮説の検証と実態の把握の2つに分類されます.

例えば「副業をしている人と副業をしていない人の年収に差があるのか」という仮説を設定して,その仮説が正しいのかを調べるためにアンケート調査を行う場合は仮説の検証になります.仮説の検証ではアンケート調査実施後に,検証を実施するための分析が必要になります.そのため計画段階でどのような手法で分析を行いたいかを決めて,その分析手法を行うことができるようにアンケート調査を行う必要があります.

単純に副業している人の割合を調べたい場合などは,実態の把握になります.アンケート調査の目的が実態の把握である場合は,収集した結果をグラフや表を用いて整理すればよい場合が多いため,仮説の検証ほど厳密に計画を考える必要はありません.

② 調査方法の検討

アンケート調査には様々な方法があり各方法でメリット・デメリットが存在します.例えば,特定の店にくるお客さんに対してアンケートを実施する店頭調査や,イベントに参加した人に対して実施する集合調査などがあります.

最も簡単に実施できるのがウェブ調査になります.インターネット上にアンケート用のサイトを作成し,そのサイトにアクセスを促して回答を得るという方法です.アンケート用のサイトはGoogle Formsを利用することで無料で作成することができます.

ウェブ調査のメリット・デメリット

但し,手軽に行うことができるウェブ調査ではインターネットを用いるという性質から,高齢者などサイトにアクセスすることができない人・年代からの回答を得ることができません.全世代を対象にアンケート調査を行いたい場合は,郵送調査を組み合わせて行うといった方法も有効です.

③ 調査対象の検討

調査対象の理想はアンケート調査の目的を達成するために調べたい集団全員になります.ただし調べたい集団が大きくなるほど,全員に対してアンケート調査(全数調査)を行うためのコストは大きくなります.そこでアンケート調査や統計学で用いられる方法が標本抽出(サンプリング)になります.

サンプリングとは

サンプリングとは本来調査したい対象全員(母集団)から,一部の人を回答者(標本)として抽出する統計学的な作業のことです.サンプリングを行うことで回答者数を減らすことができ,アンケート調査のコストを小さくできます.

サンプリングを行う場合に注意したいのが選択バイアスです.選択バイアスとはサンプリングが正しく行われず,特定のデータだけを抽出した際に起きるバイアスです.アンケート調査の場合では「アンケートの回答者を調査者が何らかの基準で選択した場合にデータに偏りが生じる」という意味になります.選択バイアスはアンケート調査の結果を大きく歪ませる可能性があるため,正しい結果を得るためには極力排除するべきです.

》バイアスとは
》サンプリング方法

サンプリングをする際に気になるのが「何人から回答を得ればよいのか?」です.統計学的に言うとサンプルサイズ n をどう設定するかという問題です.よく行われるサンプルサイズの決め方には以下の2つがあります.

・標本から母集団の予測をする精度を用いる方法
・分析で実施する仮説検定の検出力を用いる方法

どちらの方法も統計学の細かい知識が必要になるのでここでの説明は割愛します.その変わりに邪道ではありますが,「データ分析が実施(計算)できるサンプルサイズ」という観点から言うと n = 30というのが目安になります.ほとんどの分析方法は30人程度のデータがあれば計算を行うことができます.

ただしあくまでも計算が行えるというだけで,アンケート調査の目的から考えて適切なサンプルサイズかは別問題です.

質問項目の作成

アンケート調査の計画が完了したら,実際アンケートで用いる質問項目を作成します.質問文を作成する上で気をつけたいのが,質問の順番や表現によって回答に影響を与える(情報バイアス)ということです.

① 2つのことを聞いていないか

1つの質問で2つ以上のことを聞いている質問を,ダブルバーレル質問と言います.

例えば「あなたは副業やバイトを行っていますか?」という質問があるとします.この質問では回答者が”副業”または”バイト”のどちらに対して回答を行えばよいかわからなくなってしまいます.またこの質問から得られた結果は,”副業”または”バイト”のどちらに対して行った回答かがわからなくなってしまいます.

回答者と分析者の2者の観点から,ダブルバーレル質問は避けるべきです.

ダブルバーレル質問への対応方法

ダブルバーレル質問は質問内容を分割することで対処することができます.

② 回答を誘導していないか

例えば「あなたは副業に賛成ですか?」という質問があるとします.この質問で得たい回答は「賛成」「反対」である場合に,”賛成ですか”という質問は「賛成」という回答を誘導している可能性があります.

「賛成」「反対」という回答を並列で扱うためには,以下のように質問文を修正した方が望ましいです.

 例1 「あなたは副業に賛成ですか?反対ですか?」
 例2 「あなたは副業について次のどちらの意見ですか?」

例のような”賛成ですか”という質問以外にも,”○○は好きですか?”という質問も”〇〇は好きですか,嫌いですか?”という表現にした方が望ましいです.

③ 否定文を使用していないか

例えば「あなたは副業をしていないですか?」という質問があるとします.この質問では「はい」と回答した場合は”副業をしていない”ことを意味しますが,「はい」という回答は肯定の意味から”副業をしている”人からの誤回答を生みやすいです.

質問文に否定が含まれている場合はなるべく取り除いた表現にするべきです.例であれば「あなたは副業をしていまか?」という表現に変えた方が回答者にとって優しいです.

④ 順序は適切か

質問の順序は回答結果に影響を及ぼす可能性があります.前に置かれた質問が後続の質問に影響を及ぼすことをキャリーオーバー効果と言います.

例えばよく起こりがちなキャリーオーバー効果の例が以下のような質問文です.

 「Q1.2020年の厚労省の調査では副業経験者が社会人の約10%に達したことを知っていますか?」
 「Q2.あなたは副業に興味がありますか?」

この順番で質問を読んだ場合,あなたはQ2の質問にどう答えるでしょうか?「はい」と回答するとアンケート作成者の誘導に乗っている気がして「いいえ」と回答したくなる人がいるのではないでしょうか.

キャリーオーバー効果を完全に除くことは難しいですが,できるだけ防ぐために以下のような対応がされます.

キャリーオーバー効果の対処方法

質問間に因果関係がない場合でも,後に置かれた質問はそれまでの質問の影響を受ける可能性があるため,アンケート調査の中で重要な質問はできるだけ前に設置することが望ましいです.

回答方式

同じ質問内容でもアンケートの回答方式によって,得られるデータが異なるため回答方式の選択は非常に需要な工程になります.アンケート結果を用いて実施したい分析方法が決まっている場合は,その分析方法を行うことができる回答方式にする必要あります.

回答方式には以下のような種類があります.

① 選択回答方式
② 評価尺度回答方式
③ 順位回答方式
④ 数値入力方式
⑤ 文字入力方式 ※本ページでは解説していません.

解説で用いるGoogle Forms

ここからはそれぞれの回答方式について,Google Formsの設定例を用いながら解説します.加えてそれぞれの回答方式から得られるデータの種類や分析方法についても解説します.

例題として以下のページにある「副業に関する調査」を用います.解説内容を読む際は実際のGoogle Formsと照らし合わせながらお読みください.

》副業に関する調査(Google Forms)

選択回答方式

選択回答方式とは2つ以上の選択肢の中から選ぶ回答方法です.選択回答方式の中でも特に,以下のような1つだけ選択をする回答方式を単数回答(SA, Single Anser)と言います.

Google Formsでは「ラジオボタン」もしくは「プルダウン」を選択することで単数回答の質問項目を作ることができます.

GoogleFormsにおけるラジオボタンを用いた選択回答方式の例①
GoogleFormsにおけるラジオボタンを用いた選択回答方式の例②

複数の選択肢を選ぶことができる回答方法を複数回答(MA, Mulitiple Anser)と言います.複数回答では回答数を制限する場合と制限しない場合があります.

回答数に制限がある場合,例えば「3つ選んでください」とした場合は回答者は相対評価(選択肢を比較して上位3つ)で選びます.回答数に制限がない場合は絶対評価(選択肢ごとに判断)で選びます.

Google Formsでは「チェックボックス」を選択することで複数回答にすることができます.また,回答数に制限を行う場合は質問項目右下の「︙」マークから「回答の検証」をクリックすることで回答数に制限を行うことができます.

GoogleFormsのチェックボックスを用いた複数回答の例

単一回答と複数回答の使い分けについてデータ分析の観点から考えると,単一回答がもっともおすすめな方式です.複数回答で特に制限無しの場合はサンプルサイズに対してデータ数を増やすことができますが,アンケート結果のデータ整理・分析が難しくなります.

上記のように選択肢をいくつ用意すればよいか不明な場合もあります.例として5つの選択肢を設定していますが,副業の種類は無数にあります.このような場合は基本的に「その他」の選択肢を入れるようにしましょう.何を選択肢に設定するかは事前調査の結果や既往研究を参考にすることが望ましいです.

選択回答方式で得られるデータは統計学的にはカテゴリーデータ(名義尺度)と言います.カテゴリーデータとは,同じ値かどうか以外の意味を持たないデータです.

選択回答方式で得られるデータの種類

カテゴリーデータは情報量が少ないため,分析に用いることができる解析手法が限定的というデメリットがあります.そのため選択回答方式で得られたデータはこのあと紹介するリッカート尺度などで得られたデータと組み合わせて分析することも多いです.

》統計学におけるデータの種類

選択回答方式の分析方法

カテゴリーデータの基本は同じ選択肢で集計を行いその割合を図示・分析します.

① 集計方法
カテゴリーデータの集計方法

選択回答方式から得られたデータは選択肢ごとにカウントすることで,全回答に対する割合が求められるためアンケート結果がわかりやすくなります.特に質問項目ごとに集計を行う方法を単純集計と言います.選択回答方式で得られたデータに対してまずは単純集計を行いましょう.

単純集計が1つの質問項目で集計を行うのに対して,2つの質問項目で同時に集計を行う方法をクロス集計と言います.クロス集計を行うことで2つの質問項目間の関係性を調べることができます.例えばクロス集計表からは「副業を行っていない」かつ「SNS運用に興味がある」人は5人いることがわかります.

分析方法で紹介しますがクロス集計を用いることで,”仮説の検証”をするための様々な統計解析を行うことができるのもクロス集計のメリットです.

》クロス集計表について詳しく

② グラフ作成
選択回答方式のグラフ作成例

単純集計を行ったら結果を図示すると視覚的にアンケート結果の理解・伝達をすることができます.特に選択肢の数が2つもしくは3つの場合は円グラフが適しています.

円グラフの使い方の基本として,3Dの円グラフは割合が見にくくなるため避けた方がよいです.図のような平面上のシンプルなグラフが好ましいです.見せ方のこつとしては主張したい選択肢の色を目立たせるとよいです.

選択肢が4つ以上ある場合は横棒グラフがよく用いられます.横棒グラフでは回答数が多い選択肢を上に配置するようにします(降順棒グラフ).「その他」の選択肢がある場合は,回答数が他の選択肢より多くても最下段に配置します.

③ 分析方法

選択回答方式の中でも1つの質問項目に対しては仮説検定を行います.仮説検定とは統計学的に”差があるか”を判断する分析方法です.

例えばアンケート調査を実施する前に,アンケート対象の母集団に副業促進の施策を行ったとします.その効果を調べるためにサンプリングを行い,アンケート調査を実施したとします.このとき上記のアンケート結果であった場合,副業促進の施策に効果があったかをどのように判断すればよいでしょうか.

統計学的な基準に従って”効果があった=選択肢に差があった”ことを判断する方法が仮説検定になります.仮説検定にはデータの種類によって様々な方法がありますが,今回のような選択回答方式で選択肢が2つの場合は二項検定,3つ以上の場合は適合度の検定(カイ二乗検定)を実施します.

》仮説検定とは

2つの質問項目に対して集計を行ったクロス集計には専用の分析方法があります.

例えばQ1とQ2の回答を用いて「副業していることと副業の興味には関連性があるか?」という仮説を独立性の検定(カイ二乗検定)やクラメールの連関係数という指標を用いて判定することができます.

「副業していることと副業の興味の関係性を視覚的に判断したい」場合はコレスポンデンス分析という方法を行います.

》クロス集計表の分析方法
》独立性の検定

複数回答の分析方法

選択回答方式の中での複数回答の場合は単数回答と異なる集計・分析を行う必要があります.

① 集計方法
複数回答で得られたデータの集計方法

複数回答で得られたデータは,選択肢ごとに列を分けて選択された場合”1″,選択されていない場合は”0″を入力します.このように名義尺度のデータを”1″と”0”を用いて表現した値をダミー変数と言います.ダミー変数を用いることで,後続の集計やグラフ化,データ分析が実施しやすくなります.

》ダミー変数とは

② グラフ作成
複数回答のグラフ作成例

グラフは単数回答の選択肢が4つ以上の場合と同様に,横棒グラフを用います.単数回答の場合との違いは目盛りを全回答に対する割合で表現することです.単数回答の場合と違い,選択肢ごとの回答数≠回答者数となるため割合で表現した方が好ましいです.

③ 分析方法

複数回答専用の分析方法(仮説検定)として,コクランのQ検定があります.

コクランのQ検定では選択肢ごとの回答数に”差があるか”を調べることができます.

》コクランのQ検定

コクランのQ検定では全選択肢の中でどの2つの選択肢に差があるかを調べることができません.特定の2つの選択肢に違いがあるかを調べたい場合は,クロス集計を行ってからマクネマー検定を行います.

マクネマー検定は独立性の検定(カイ二乗検定)と類似した手法ですが,同一人物が複数回答した場合などの対応のある場合に行うクロス集計表の分析方法です.

》マクネマー検定

コクランのQ検定はマクネマー検定はどちらの”差があるか”を調べる分析手法です.選択肢間に関連性があるかを調べたい場合は,相関係数という統計学的な指標を用いることで判定することができます.さらに応用的な分析方法としては多変量解析という方法があり,どの選択肢がどの選択肢に影響を与えているかを調べたり,類似した回答傾向にある人をグルーピングすることができます.

》相関係数
》多変量解析

ここからは有料ページとなります.

選択回答方式以外の作成例や分析方法について解説しています.また具体例を用いてアンケート作成から分析・結果の解釈まで一連の方法も紹介しています.ページ内容の詳細は右サイドバーの目次をご覧ください.