パネルデータ分析
パネル・データ(英: panel data)とは、時系列データとクロスセクションデータを合わせたデータであり、同時に多数の個人、地域、事業所などを観察する一方で、複数の観察時点では同一の観察対象を維持するものである。自然科学のみならず、社会学、経済学等の社会科学における統計的な分析にも使用される。
パネルデータの例
[編集]バランスド・パネル | アンバランスド・パネル | |
---|---|---|
上記の例では、個人間のクロスセクション・データと期間ごとの時系列データからなる2つの例が示されている。ここでは、個人の特徴が所得(income)・年齢(age)・性別(sex)で示されている。左側の例での個人1と個人2については、データ期間が2003年・ 2004年・2005年の3期間示されており、これをバランスド・パネルと呼ぶ。一方、右側は、個人2のみ2003年・ 2004年・2005年の3期間のデータ含まれるものの、個人1は2003年・ 2004年の2期間、個人3は2004年の1期間のみであり、アンバランスド・パネルと呼ばれる。
パネルデータを用いた回帰分析
[編集]パネルデータは以下のような形式をとる。
ここで、 は各個人を示し、そして、 は期間を示す。
パネル・データを用いた回帰分析は一般的に以下のように示すことができる。
この式の通り、誤差項 が、 と に分離されていることがパネル・データ分析の特質の1つである。
これは主に 固定効果モデルとランダム効果モデルと呼ばれるモデルにてパラメータを推定する。
固定効果モデルは、
であり、 は個人に特有であり、時間を通じて変化しない一定な効果(例えば、クロスカントリー比較でのパネルデータであれば、地理的条件や気候など)である。
これに加えて、ランダム効果モデルとは、
そして、
となり、即ち、 誤差項の構成要素が互いに独立であることを意味する。
参考文献
[編集]- 北村行伸「パネルデータの意義とその活用―なぜパネルデータが必要になったのか」(PDF)『日本労働研究雑誌』第551号、独立行政法人労働政策研究・研修機構、2006年、6-16頁。
- 山口一男「パネルデータの長所とその分析方法:常識の誤りについて(パネル講演)」(PDF)『季刊家計経済研究』第62号、公益財団法人家計経済研究所、2004年、50-58頁。
関連項目
[編集]- 計量経済学
- 固定効果モデル
- ランダム効果モデル
- 慶應義塾大学パネルデータ設計・解析センター - 文部科学省の共同利用・共同研究拠点に指定されている。
- 東京大学社会科学研究所 社研パネル調査プロジェクト
外部リンク
[編集]- 北村行伸 (2004年). “第1講 パネルデータ分析の考え方” (PDF). 上級パネルデータ分析(II). 一橋大学経済研究所. 2012年6月30日閲覧。
- 松浦寿幸. “Stata によるパネルデータ分析” (PDF). 2012年6月30日閲覧。
- “Panel Study of Income Dynamics - Home” (英語). 2012年6月30日閲覧。
- “KLIPS” (朝鮮語). 2018年3月27日時点のオリジナルよりアーカイブ。2019年1月2日閲覧。
- “Pairfam: Study” (英語). 2012年6月30日閲覧。