徹底解説

ロングデータとワイドデータ

ロングデータ・ワイドデータとは

ロングデータとは,複数の観測値が別々の行として記録され,特定の変数列がその観測値の種類や時点(キー)を示す形式です.社会人3人の年収の例では,各観測時点ごとに行として縦長のデータ構造となっています.ロングデータは縦持ちデータと表現されることもあります.

ワイドデータとは,それぞれの被験者や項目ごとに一つの行が確保され,様々な変数や時点での観測値が列として並べられる形式です.社会人3人の年収の例では,各観測時点ごとに列として横長のデータ構造となっています.ワイドデータは横持ちデータと表現されることもあります.

ワイドデータはロングデータと比較して,一つの被験者や項目の情報を一目で見ることができる点がメリットです.

データ分析で使用されるデータ形式

ワイドデータは,データの見やすさからメリットがありますが,実際にデータ分析で利用しやすいデータ構造はロングデータになります.

現在使用されているデータ分析ツールや統計パッケージ(RやPython)では,ロングデータが求められることが多いです.

ワイドデータからロングデータへの変換

データ分析の実務では,ワイドデータからロングデータへの変換が必要となることが多々あります.例えば,以下のようにExcelなどの表形式で入力したワイドデータについて考えてみます.

ワイドデータのサンプルデータ

ロングデータに変換するためには,新しく年(キー)を入力する変数列と年収(値)を入力するでデータ列を作成する必要があります.このような作業を列を積み重ねるという意味で,スタッキングとも言います.

サンプルデータ程度の量であれば,スタッキングは比較的簡単にできますが,データ量が多い場合は手間がかかります.

統計解析アプリStaatAppでは,ワイドデータ⇔ロングデータの変換をクリック操作だけで行なうことができます.StaatAppでデータ形式の変換を行なう場合,ホーム画面から「データ操作」→「ロングデータに変換」を選択して,ロングデータ変換機能を表示します.

StaatAppのロングデータ変換機能を選択

変換対象の列の選択,新しく作成する列の列名(キーと値)の入力を行って「実行」をクリックするとワイドデータに変換されます.

ロングデータに変換機能
変換後のデータ

データ変換機能は,無料版機能で利用可能なのでお気軽にダウンロードしてお使いください.

》統計解析アプリStaatAppとは

統計解析アプリStaatApp

補足 整然データ

データ分析を行なう上では,データの形式に加えて整然データを満たしていることも非常に重要です.

整然データ(Tidy Data)とは,データの形状が特定の構造に従って整理されているデータのことを指します.整然データの基本的な原則は以下の3つになります.

 ① 各変数は1列(1つのカラム)を形成する
 ② 各観察結果は1行を形成する
 ③ 各タイプの観測ユニットは1つのテーブルを形成する

詳細は以下のページをお読みください.

》整然データとは