見出し画像

研究の進捗-データセット作成-(2020/05/20)

緊急事態宣言も終わりが見えてきた今日この頃、世間では自粛疲れから来る外出の増加が問題視されているようですね。私が住んでいる神戸市でも、繁華街(三宮駅周辺)は4月と比べて平日の外出者数が増えているそうです。第二波を引き起こさないためにも、しばらくは気を引き締めていかなくてはならないでしょう。

さて、前回は、「自主ゼミの開催」を進捗としてまとめました。この10日間では、データセットが完成間近となったので、今回のエントリーではその辺りのことをまとめたいと思います。

データセットとは、統計分析ソフト等によって処理するデータのまとまりのことです。私が現在進めている研究では、時系列データ横断面データを合わせた「パネルデータ」と呼ばれるデータを使用します。時系列データとは、同一の項目を複数期間にわたって追跡したデータのことです。横断面データとは、ある時点における複数の項目を集約したデータのことです。私の研究では、2014~2019年度の時系列データと約70の国内空港に関する横断面データを組み合わせたパネルデータを使用します。

4月30日のエントリーにも書きましたが、このデータセットの作成にはとてつもない時間と労力が掛かるため、学部時代のゼミの学生に作業補助をお願いしていました。先週その成果が届いたため、これでいよいよStataに読み込んで色々分析できる準備が整いました。まずは基本統計量(平均、中央値、標準偏差など)の算出から始めようと思います。

話は逸れますが、第三者に作業補助をお願いする際に、私は以下の3つを心掛けています。

1つ目は文章でお願いすることです。依頼する側からすれば文章よりも口頭で伝える方が手間がかからないというメリットはありますが、ミスコミュニケーションを避けるためにも、時間をかけて文章で依頼事項を伝えるべきです。

2つ目は「だろう」ではなく「かもしれない」を前提とすることです。これは依頼事項を文章で整理している間に心掛けていることなのですが、依頼を受ける側は依頼内容についてほとんど情報を持っていません。そのことを前提に依頼内容を伝えないと重大な情報が漏れてしまう可能性があります。自動車の運転と同じように、「これくらいなら理解できるだろう」というような「~だろう依頼」はやめて、「~かもしれない依頼」を徹底するべきです。

3つ目は、ゴールを共有することです。この作業の結果としてどのようなものが出来上がるのか、例を示すなどして事前に完成イメージを共有しておくことで、依頼を受ける側の作業中の不安を解消することができます。

いずれも、私が社会人時代の経験を基にした心掛けです。依頼する側とされる側は基本的には対等な関係で、両者の間に差があるとすれば、それは情報量のみです。立場の差はありません。その情報量の差、経済学で言う「情報の非対称性」を解消することが、イメージ通りの成果を生み出すカギであると私は考えています。

今回私が学生に依頼した作業成果はイメージ通りのものでした。ゼミの先生いわく、その学生はゼミの中でも特に優秀な学生だそうで、そのような方にお手伝いいただけたことはとても幸運でした。彼女の成果を研究の方の成果にしっかり結び付けられるよう、気を引き締めて次なるステップへ進んでいきたいと思います。

Good day.

この記事が気に入ったらサポートをしてみませんか?