マイケル・ロス(松尾昌樹・浜中新吾訳)『石油の呪い』吉田書店.

レプリケーションの手引き

 

はじめに

この手引きは『石油の呪い』に掲載された計量分析結果を自分の手で再現してみたい読者向けに書かれたものである。

想定している読者としては「本書を読んで計量分析に関心を持ち、使用されたデータを使って計量分析をしてみたくなった」方々である。

(主に訳者の松尾と浜中が担当する講義「中東地域研究」「中東地域研究演習」(宇都宮大学)「中東政治論」(龍谷大学)「中東・アフリカ地域の政治A(関西学院大学)の受講者をターゲットにしている)

 

データの所在

『石油の呪い』36頁にあるように、本書で分析されたデータファイルはハーバード大学のDataverseというサイトに寄託されている。 

https://dataverse.harvard.edu/dataverse/mlross

 

ロスが寄託した9つのデータのうち、本書に関係するのは Replication data for: The Oil Curse”である。

ここから2つのデータファイルと計量分析用コード(プログラム)3つのファイルをダウンロードすることができる。

 

レプリケーション(分析再現)

ここではR言語を用い、ロス(2017)の分析再現を行う。

R言語は統計解析を得意とするフリーのPC言語である。

PC言語なのでプログラミングを必要とするのだが、一行づつコマンドを入力して使用することもできる。

 

R言語のインストールから入門までのインストラクションはこちらのサイトが優れているので、一読いただきたい。

 「全人類がわかる統計学->R言語入門

 

R言語の使用にあたってはR-Studioを併用すると使いやすくなる。

 

松尾昌樹による改良版レプリケーション・コード(こちらの利用を推奨する)

Table 2.1  Table 2.2

Table 3.1  Table 3.3  Table 3.4&3.5  Table 3.6  Figure 6.9  ロスの分析に含まれる誤り Table 3.7 

Table 5.4 New

 

浜中が作成したレプリケーション・コード (R-Studio, *は改良版あり)

第2章47頁用コード (2.1)*

第3章96頁用コード(表3.1*

第3章105頁用コード (3.3)*

第3章113頁用コード (3.6)*

第3章124頁用コード (3.7)*

第3章133頁用コード (3.11)

第4章150-152頁用コード(表4.1〜表4.3

第4章170頁用コード(表4.7

第5章187頁用コード(表5.1

第5章 218頁用コード (5.4)*

 

R-Studioのアイコンをダブルクリックすると、R-Studioと連携したRが起動する。

レプリケーション・コードを動かすには、dplyrパッケージやpglmパッケージ, texregパッケージを追加でダウンロードする必要があるので、その作業を先に行う。

メニューのToolsInstall Packages..をクリックするとダイアログボックスが出てくるので、そこに(dplyrパッケージなら)dplyrと入力してインストールを始める。

 

あとはDLしたデータとコードを読み込んで(ファイルオープンのアイコンからファイルを探してダブルクリック)、コードの画面で「Run」アイコンを押せば、247頁の結果が再現できる。

(コードでは読み込んだデータの初期名はxとしてある。異なる名前で読み込まれた場合は適宜修正)

現時点だと所得別平均の結果はテキストとは同じにならない。

 

松尾の研究によれば、浜中コードは等分散でないことを前提としているためであり、等分散オプションを使うと同じ結果になる。

 

以降は随時、追加していく予定。

 

ロスが分析を行った統計解析ソフトウェアStata(バージョン11以上)を利用できる読者でないと、現時点で補遺にある分析結果の完全なレプリケーションを行うことは容易ではない。

データセットはオリジナルのStataフォーマット形式だけでなく、他のフォーマット形式でもダウンロード可能である。

計量分析用コードはStata用なので、他のソフトウェアで走らせる場合はコードを移植(書き換え)しなければならない。

なおコードの移植ができるようなユーザーであれば、この手引きのような情報は全く不要だと考えられる。

よってレプリケーションを行う前に、所属大学のPCラボにStataが導入されているかどうかを確認し、導入されていればStataを使ってレプリケーションを試みることになる。

 

Stataを使ったことがない読者のためにガイドしておくと、データファイルをダブルクリックすれば、Stataが立ち上がってデータを勝手に読み込んでくれる。

しかしdoファイル(コード)をダブルクリックすると別のStataが立ち上がってしまうので、分析再現が自動的になされるわけではない。

そこでデータファイルを読み込んだStataのメニューから、 ウインドウ(W)doファイルエディタ→新規doファイルエディタと進み、doファイルエディタを立ち上げる。

そしてdoファイルエディタのファイルアイコンを使ってdoファイルを読み込めばよい。

読み込んだ後、メニューの実行アイコンを押せば、分析結果が再現される。