京都大学大学院経済学研究科准教授 山﨑潤一
はじめに
- 主に自分の修士の学生向け用にマニュアルが必要だと思ったのですが、他の学生の方にも参考になるかもなので、公開しておきます。
- 想定している読者: これから経済学の実証論文、特にミクロ計量経済学を使って実証論文を書くよ、という人向け。博士の人も最初の部分は参考になるかもしれません。僕の指導を受けたい(といってもまだ僕は正式に指導学生は持てませんが)人はmust readです。学部生だと全てをこなすのは難しいと思いますが、意識をするだけでもいいかと思います。
- 何かコメントあったらtwitterででもここのコメント欄にでもどうぞ。
- 常にベータ版: 有益なリンクなどを追加して更新していこうと思います。
- ざっくりいうと以下の順番に並んでいます
- 研究アイディア関係
- 文献収集関係
- データ収集、分析関係
- 執筆・図表関係
研究アイディアの練り方
あくまで一例ですが、こんな感じで僕は考えることが多いです。これらの要素が揃えば揃うほど良い論文だと思いますが、最初から(特に学部の段階で)それを揃えるのは難しいとは思うので、どれかを切り口にして考えてみると良いと思います。因果推論の基礎的知識を前提した説明もありますが、それに限らずヒントにはなると思います。
- データdrivenのケース
- こんな見慣れないデータがあるぞ
- 他の似た研究では使われていないぞ
- このデータで新しく言えることはなんだろう
- それが経済学的(もしくは社会一般にとって)になぜ重要なのだろう?
- コンテクストdrivenのケース
- こんなことが起きた(ている)ぞ (例: 幕末の開国
- その結果何が起きるだろうか? (閉鎖経済からの移行、価格の変動
- それは経済学的(もしくは社会一般にとって)に重要なのだろうか? (貿易理論のテストに使える
- もしくはそれは何かを綺麗に識別するのに使えるだろうか?(DID, IV, RDなどの検討)
- セオリーdrivenのケース
- こんな理論があるぞ
- 経済学的(もしくは社会一般にとって)に重要そうだぞ
- この理論は本当だろうか?あまり今まではテストされていないぞ
- もしくは特定のXという状況だと違う予測になるぞ
- もしくはそれを使って何か予測をしよう
- それをテストできるデータ/コンテクストを探そう
- イシューdrivenなケース
- こんな社会問題があるぞ
- これを知ることができれば、政策提言などにつながるぞ
- それを知るにはどういうデータや識別戦略が必要だろうか?
- (僕はあまりこういうタイプの研究をしてないですし、経験や知識の蓄積がある程度必要だとは思いますがこういうのもあるぞということで)リテラチャーdrivenのケース
- 既存の実証論文たちはこんなことを言ってるぞ
- でもなんか疑問に思うぞ、本当は今まで分析されてない別のチャネルが重要じゃないだろうか/こういう視点で見れば論文によって一見違う結果をうまく説明できるぞ
- そのポイントを分析可能なデータや状況はないだろうか。もしくはどういう実験(RCT)をすれば良いのか。それに比べて手元の状況はどういう欠点があるのか。
- (似たことですが)インドでの実証研究ではこういう結果が出ているけど、これは中国では理論的にhogehogeな理由で真逆に結果が出そうだぞ
- このhogehogeという理由が中国内でも地域によってバラツキにあれば、地域別に分析して効果が真逆に出るとより説得的な感じがするぞ
ちなみに色々思考を広げすぎると論文が書けなくなるので、因果関係の特定を前提とするならば、例えばDifference-in-Differencesができるコンテクストを探す、という一歩目をまずは踏み出すというのが修論だとfeasibleかもと思います。
重要性の訴え方
重要性の訴え方に関しては、「〇〇の市場はXXX円だ」のように現実との関連で訴えかける時もありますし、「〇〇は経済学で基本的なコンセプトでそれを使った予測は多いが、実証論文は少ない」みたいにあくまで学術的に訴えかける時もあります。色々な論文を読むことでその辺り吸収できると思います。
これらを考えてくることに慣れると、最初に論文のアブストラクト(とできればリテラチャーサーベイ)を考えて、「もし計画が100%うまく行ったらこんな論文になる」というのを書いてみます。これで面白くなさそうだったり、シャープなことが言えないのであれば、多分そのプロジェクトはやめた方がいいです。実際は計画通りにデータが取れなかったりするので、ここで微妙だったらさらに微妙になる確率が高いと思います。もちろんやっているうちに色々アイディアが出ることもありますが、時間は有限なので最初の一歩を間違えないことも大事だと思います。
良い仮説とは?
できればですが、結果次第で「論文になるかどうか」が変わらないようにするのが理想です。例えばAがBに与える影響を調べるときに、理論的チャネルによってはその正負どちらかわからないので調べる、といったスタンスで望めば「あれ?正のはずなのにおかしいな」と書けなくなることも減るでしょうし、有意性がなくても本当に効果がほぼゼロならそれから学べることはあります(参考論文)。避けるべきはサンプルサイズが小さくてStandard Errorがおおきく何もpreciseに推定できずにCI が広がり有意にならないといった状況で、効果がゼロになることではないように思います。もちろん例えば効果が正に出た方が論文のインパクトが大きいことはあり得ますが、それは結果論なので始めるときにはそれほど気にすることはなくて、「これは問う価値があるリサーチクエッションだ」とドンと構えておけばいいんじゃないか、と僕は思ってます。卒論修論だと論文を書く技術の習得が目的の一つだと思うので、特に当てはまると思います。