目的別フローチャート
グラフは使用するデータの種類や目的によって,最適な種類を選択する必要があります.
ビジネスや学術研究,様々な場面で用いられる12種類のグラフをどのように選択するべきかまとめたフローチャートが下記になります.
フローチャートの見方については,次節より解説しています.
フローチャートの見方
データの種類
データの種類とは,「1,2,67」など数えることができる値か,「女性,男性」など数えることができない文字列かといった分類になります.詳しくはデータの尺度とはで記載しています.
例えば,データの種類が数量データでかつ時系列データである場合,折れ線グラフが最適なグラフとなります.
カテゴリーデータの場合,データが持つ情報量が少ないため,選択できるグラフは円グラフもしくは積み上げ棒グラフに限られます.
分布の表示
分布の表示とは各データポイントを,どのような配置されているか,偏りがあるかを示す必要があるか,という観点になります.
学術研究や実務におけるデータ分析の場面では,分布を示すためにグラフを用いることが多く,ヒストグラムや散布図は頻繁に使用されます.
変数の数
データ分析における変数とは,「データ項目」といった意味になります.例えば,「年齢」「年収」といったデータが被験者(サンプル)に対してある場合,変数の数は2になります.1つのグラフで同時にいくつの変数を表示したいかによって,使用するグラフは異なります.
例えば,レーダーチャートであればn角形とすることで,n個の変数を1つのグラフで示すことができます.変数が3つであれば,バブルチャートを用いることでデータの分布を含めて示すことができます.
並列に表示
並列に表示とグラフを複数個表示するのに適しているかどうかです.複数個表示することで,2つ以上の変数を並べて表示することができます.
例えば,アンケートなどで「性別」「職業」「血液型」など複数の回答結果(カテゴリーデータ)を並べて表示したい場合は,円グラフより積み上げ棒グラフの方が適しています.
グラフ一覧
データの種類や変数の数によってグラフを一覧化した表が下記になります.基本的にはExcelなどの表計算ソフトで作成することができますが,一部のグラフはStaatAppなどの統計解析ソフトもしくは,専用のグラフ作成ツールを用いる必要があります.
グラフ名 | データの種類 | 変数の数 | Excel | StaatApp |
棒グラフ | 数量 | 1 | ◯ | – |
折れ線グラフ | 数量(時系列) | 1 | ◯ | ◯ |
円グラフ | カテゴリー | 2~ | ◯ | ‐ |
積み上げ棒グラフ | カテゴリー | 2~ | ◯ | ‐ |
散布図 | 数量 | 2 | ◯ | ◯ |
バブルチャート | 数量 | 3 | ◯ | ◯ |
ヒストグラム | 数量 | 1 | ◯ | ◯ |
箱ひげ図 | 数量 | 1 | ◯ | ◯ |
バイオリンプロット | 数量 | 1 | – | ◯ |
ストリッププロット | 数量 | 1 | – | ◯ |
エラーバー | 数量 | 1 | ◯ | ◯ |
ヒートマップ | 数量 | 1 | ‐ | ◯ |
レーダーチャート | 数量 | 3~ | ◯ | ‐ |
※ グラフ名をクリックすると,解説ページに遷移します.
統計解析アプリStaatApp
StaatAppは計算仮定が複雑な解析手法を,誰でも手軽に素早く行なうことができるアプリです.折れ線グラフやバブルチャート,エラーバーは無料版機能で作成できるのでお気軽にダウンロードしてお使いください.
》StaatAppで行うグラフ作成
》統計解析アプリStaatApp
グラフの紹介
ここからは普段あまり聞き慣れないグラフについて紹介します.
積み上げ棒グラフ
積み上げ棒グラフは複数のカテゴリーデータの割合を表示するグラフです.アンケートなどの複数回答を一括で表示する場合に最適です.目安として円グラフが4つ以上になる場合は,積み上げ棒グラフを用いた方が見やすくなります.
バブルチャート
バブルチャートは散布図に加えて,プロットの大きさで3つ目の数量データを示します.プロットの色を分けることで,4つ目の変数(カテゴリーデータ)を示すこともできます.
ヒストグラム
ヒストグラムとは量的データの分布を表すグラフになります.1つ1つの棒(ビン)の面積は階級ごとの度数を意味します.
質的データの度数を表す場合によく用いられる棒グラフとの違いは,棒の横幅に意味があるかどうかです.棒グラフは棒の高さのみで度数を表現するのに対して,ヒストグラムは面積で度数を表現します.
箱ひげ図・バイオリンプロット・ストリッププロット・スウォームプロット
箱ひげ図・バイオリンプロット・ストリッププロット・スウォームプロットは,それぞれヒストグラムと同様にデータの分布を示すために使用されます.ヒストグラムとの違いは複数のデータを横並びで比較する場合に,これらのグラフが用いられることが多いです.
特に最近の傾向として,全てのデータを示すことができるストリッププロットが用いられることが多いです.
エラーバー
エラーバーとはデータのばらつきを示す棒状のグラフになります.図のように,棒グラフの上部に付けて図示することが多いです.
学術論文においてt検定などの仮説検定の結果を示すために,使用されることが多いです.