見出し画像

「実証研究マネジメントのためのツールキット」ガイダンス(経セミ・シリーズ連載)

実証研究マネジメントのためのツールキット」という短期集中・シリーズ連載が、『経済セミナー』2021年10・11月号からスタートし、非常にご注目いただいています!(続く12・1月号では、第2回を掲載しました)

現時点でのラインナップは以下の通りです:

  • 第1回は、GitとGitHubによる研究プロジェクト管理と実践例の紹介

  • 第2回は、Dockerによる作業環境の構築と実践的なワークフローの紹介

本連載では、本誌掲載の記事本体とは別に、非常に充実したウェブ付録が提供されています。以下のウェブサイトでまとめてご案内しておりますので、ぜひチェックしてみてください!!

★サポートサイトのトップ(画像をクリックすると飛べます!)

著者は、クラウド名刺管理サービス(Eightなど、すっかりおなじみですね!)を提供するSansan株式会社の研究開発部門(DSOC R&Dに所属する以下の3名の方々です。

西田貴紀(にしだ・たかのり)
一橋大学大学院経済学研究科修士課程修了。専門は計量経済学、労働経済学。

Juan Martínez
慶應義塾大学大学院経済学研究科博士課程修了。専門は
労働・教育・開発経済学。

小松尚太(こまつ・しょうた)
東京大学大学院農学生命科学研究科農業・資源経済学専攻修士課程修了。専門は農業経済学と開発経済学。

3名ともSansan株式会社技術本部DSOC R&Dに所属

この3名が、なぜこのような連載を始めようと思ったのか?
そのモチベーションと伝えたいメッセージ、そして3名が皆さまにお届けしたいと考えているコンテンツについては、本連載第1回の冒頭にまとめられています。

そこで、このnoteでは、まずその部分をご紹介したうえで、第1回と第2回のウェブ付録の紹介や、関連する参考資料などをリンク付きでご案内します!


■ 「本連載を始めた理由」(連載第1回より)

「数カ月前に自分が行った分析を再現できない」
「共同研究者やリサーチアシスタントから共有してもらったコードが回らない」
「手元で回した分析結果が、共同研究者間で異なっている」

実証分析を扱う共同研究で、上記のような経験をした人はいないだろうか。経済学において、研究プロジェクトの長期化や研究チームの大規模化が進む中、こうした問題はより顕在化してきているように思われる。今後、円滑な研究プロジェクトの遂行には「再現性」と「コラボレーション」が鍵になる。アメリカ経済学会(American Economic Association:AEA)では再現のとれるコードの公開を促しており、実証研究において再現性を担保することの重要性を説いている(AEAの以下のサイトを参照)。

筆者らは、クラウド名刺管理サービスなどを提供するSansan株式会社の研究開発部に在籍し、データ分析を主な業務とする、いわゆるテック企業のデータサイエンティストである。ソフトウェアエンジニアと協業することも多いが、彼らはチームで開発を進めるのが普通であり、プロジェクト管理についてさまざまなツールを活用し、多くのノウハウを蓄積している。筆者らも彼らとの協業の中で、そのノウハウが経済学の研究プロジェクト一般にも役立つのではないかと考えるようになった。

そこで、本連載では筆者らが実証研究を進めるうえでのプラクティスを紹介する。
まず、第1回となる本稿では、コードを共同で管理する方法として「Git/GitHub」の活用方法を紹介する。
第2回では、「共有してもらったコードが回らない」といった問題を解決すべく、「Docker」を使った環境構築の方法について触れる。
そして第3回では、共同研究のプロジェクト管理のプラクティスとして、アジャイル開発の一種であるスクラム開発について紹介する(なお、アジャイル開発とはソフトウェア開発の進め方の一種で、短期間の開発サイクルを繰り返すことで仕様変更などに臨機応変に対応する開発手法である。スクラム開発は、アジャイル開発の一種のフレームワークである)。
本連載はあくまで筆者らのプラクティスを紹介するもので、まだまだよい方法があるに違いない。連載を通じて、読者の皆さんもご自身のプラクティスを発信され、活発に意見交換されることを願っている。


■ 連載記事をサポートするウェブ付録

以上のように、この連載はSansanでエンジニアの方々とも日々協働しつつデータ分析や研究開発業務に取り組む3名が、その過程で活用している実証研究の進め方に役立つツールやノウハウの一部を紹介するものです。より一層円滑にプロジェクトを進めていくための一助となれば幸いです。

冒頭でもお知らせした通り、本連載では非常に詳細なウェブ付録を提供しています。ここでは、第1回(Git/Github)、第2回(Docker)の付録の内容を簡単にご紹介します。
誌面では解説しきれなかったツールの導入に関する解説など、とても丁寧なフォローアップをいただいています。まずはウェブ付録からでも、ぜひチェックしてみてください!

第1回 Git/GitHubによるプロジェクト管理

第1回の付録では、Git/GitHubの使い方のチュートリアルの紹介や、研究プロジェクトの生産性を向上させる Git/GitHub の使い方を、読みやすいBookdown形式で紹介中です。
内容は随時更新される予定ですが、現時点での最新版の主な目次は以下の通りです。

主な目次(2021年9月26日バージョン)
1 Useful resources

 1.1 Git/GitHubの使い方に関するチュートリアル
 1.2 GitのGUIツールについて
2 Git/GitHubを用いて論文を執筆する
 2.1 論文作業のワークフロー
 2.2 LaTeX の作業環境の整備
3 継続的インテグレーションで、ワークフローを自動化する
 3.1 論文・スライド用の tex ファイルを自動的にコンパイルし、最新版が常に見られるようにする
 3.2 分析用のDo fileを修正したあとコードを回し、分析結果を自動的にアップデートする
 3.3 作成している R のパッケージに修正を加え、単体テストを自動的に走らせる
4 ブランチ戦略
 4.1 Git Flow
 4.2 Git Flow のメリット
 4.3 研究プロジェクトにおける git-flow の活用?

第2回 Dockerによる作業環境構築

第2回のウェブ付録では、「実証研究のためのDockerの使い方」にフォーカスして、本誌掲載記事内に掲載できなかった情報や、本誌で解説した内容を実践する際に役立つ補足情報などを提供しています。
こちらも内容は随時更新される予定ですが、現時点での最新版の主な目次は以下の通りです。

■主な目次(2021年11月22日バージョン)
1 Dockerを使い始めるには

 1.1 PCにインストールする
 1.2 オンラインでの利用
2 Docker Volumes
3 Docker Compose
4 練習問題
 4.1 Hello World
 4.2 牛を喋らせる
5 実証研究での実用例
6 有料ソフトの利用
 6.1 Matlab
 6.2 ArcGIS Notebook Server
 6.3 Stata

■ 参考資料の紹介!

連載の中では、Git/GithubやDockerの導入や使い方等々に関する参考資料、参考図書などもご紹介いただいています。ここではその一部をざっとご紹介したいと思います。

Git/Githubについて

Git/GitHubの使い方により慣れたい場合は、以下のMicrosoftによるチュートリアルが参考に。Microsoft accountを持っていれば、Gitのコマンドの使い方の演習も無料で行うことができます。

  • Gitでのバージョンコントロールの概要:

  • GitHub の基礎 - 管理の基本と製品の機能:

  • 初心者向けの参考書籍:

湊川あい著・DQNEO 監修(2021)『わかばちゃんと学ぶ Git使い方入門(改訂 ⚒版)』シーアンドアール研究所
湊川あい著・DQNEO 監修(2021)『わかばちゃんと学ぶ Git使い方入門(改訂2版)』
シーアンドアール研究所。
Chacon, S. and Straub, B.(2014)Pro Git
Chacon, S. and Straub, B.(2014)Pro Git, Apress.

Dockerについて

  • Docker ドキュメント日本語化プロジェクト

初心者向けの参考書籍:

小笠原種高(2021)『仕組みと使い方がわかる Docker& Kubernetesのきほんのきほん』マイナビ出版
小笠原種高(2021)『仕組みと使い方がわかる Docker& Kubernetesのきほんのきほん』
マイナビ出版。
Chowdhury, F. H.(2021)The Docker Handbook - 2021 Edition
Chowdhury, F. H.(2021)The Docker Handbook - 2021 Edition.

さらになる参考資料!

さらに、『経済セミナー』2021年12月・22年1月号の特集「気候変動にどう向き合うか?」で「空間モデルで経済活動と環境の相互作用に迫る」という記事をご寄稿いただいたブラウン大学経済学部博士課程の津田俊祐さんが作成された導入向けの講義資料をご紹介いただきました!

  • 経済学者・社会科学者のためのプロジェクト管理(Software Engineering for Social Scientists)

また、津田さんからはさらなる参考として、以下の資料もご紹介いただきました。実際にデータとプログラミング言語を活用して研究プロジェクトを進めていく際のご参考に、ぜひチェックしてみてください。

  • Matthew Gentzkow and Jesse M. Shapiro (2014)「Code and Data for the Social Sciences: A Practitioner’s Guide

Matthew Gentzkow and Jesse M. Shapiro (2014)「Code and Data for the Social Sciences: A Practitioner’s Guide」
  • アメリカ経済学会(AEA)のData EditorのページでもDocker!
    Use of Docker for Reproducibility in Economics」という投稿があります! ここでも再現性を担保することの重要性と、そのための方法としてのDockerの利用について述べられています。

AEA Data Editor, Use of Docker for Reproducibility in Economics

この情報は、手島健介先生(一橋大学)のTwitterを通じてご教示いただきました。ありがとうございました!


■ おわりに

さて、このnoteでは、Sansanの皆さまによるシリーズ連載「実証研究マネジメントのためのツールキット」の概要、ウェブ付録、そして参考資料をざくっとご紹介しました。

第1回ではGit/Github、第2回ではDockerを実証研究マネジメントに活用するための実践例をご紹介しました(第2回は12・1月号に掲載!)

2022年2・3月号(特集:「歴史データ×経済学」の可能性(仮))は、いよいよ最終回(予定)となる第3回です。内容は、共同研究のプロジェクト管理のプラクティスとして、アジャイル開発の一種である「スクラム開発」についてご紹介頂く予定。ぜひご期待ください!!


サポートに限らず、どんなリアクションでも大変ありがたく思います。リクエスト等々もぜひお送りいただけたら幸いです。本誌とあわあせて、今後もコンテンツ充実に努めて参りますので、どうぞよろしくお願い申し上げます。