見出し画像

気がつけば博士後期課程標準修了年限の半分以上経過(2)

博士後期課程の振り返り2回目です。

カバー写真は今週訪れた中国深圳の空港。でかいけれどデザインそのものは品のいいものでした。イタリアの建築会社の基本設計がコンペで選ばれ、ドイツのエンジニアリング会社、北京の実施設計会社が形にしていくというプロジェクトだったそうです。


2023前期の続き(研究編)

そんなこんなで1年を終え、大学紀要ですが短いレビュー論文を書き、単位取得プラスアルファ(研究と発表)という1年目の要件はクリアできたことになりました。

2年目の活動としては、所属学会での査読論文の投稿(できれば査読通過まで!)を目標にしようと思い、春からアイデア出しプラスデータ収集を開始しました。1年目同様、授業も取ったのですが、この実証研究のための知識補強を目標に、前期では統計、特にベイズ統計専門の先生の授業を学部聴講も含めて取りました。

少し授業負担は軽くなったので、データ収集と整理、そしてどのような論文化を目指すかを考えることにかなり時間を使いました。

ただ、ラッキーだったのは、正式に提出した後の修正指示対応にかなり手こずることを想定していた紀要論文が、あまり修正なくすんなり終わり、2月から3月にかけて割と時間が取れたことです。この期間をRのコード学習やデータハンドリングのトライアル、論文探索に充てられたため、スムーズに2年目に入れたように今思うと感じます。

とりあえずデータ(だけじゃない難しさ)

実証研究の難しさはまずデータを探すことと、やっと探したデータの構造を理解すること、そしてPCソフトが扱えるようにすることだと感じます。

これと並行してどんなモデルで、何を明らかにしたいのかというリサーチクエスチョン、仮説に関わる考察も同時に行います。この同時並行がなかなか慣れるのが大変です。

自分の研究の場合は産業(鉄道)データが存在することと、その構造については業務を通じて理解しているので、この探索と基礎的理解という2点はショートカットできました。しかしこの先はリサーチクエスチョンと、仮説とモデル化(計量経済学モデルの統計的検証)の兼ね合いを考えて、必要な要素の抽出とパネルデータ化のようなデータの構造化が必要になります。

分析(Analysis)の前に、統合(Synthesis)による仮説化が必要になるので、ここがやはり一番頭と時間を使った部分だと思います。

ひたすらクリーニング

もう一つとにかく時間がかかった(今もかかっている)のがデータのクリーニングです。自分が使ったデータは一応エクセルファイルとして国から公開されている統計データを使用しましたので、単純な手作業の転記は発生してません。ただ、このエクセルデータというのがいわゆる「ネ申エクセル」そのもののシロモノで、エクセルのまま整理作業を行うとまず再現性が確保できない(分析に使うデータセットを作る手順が記録できない)、またコピペの繰り返し、空白セルの削除、名前などのキー列をマッチさせての表同士のマージなどもエクセルでは実はとても手間がかかります。

さらに構造化、標準化が全くされていないデータなので、名前列に「小計」や「合計」が含まれる、国の機関の都合で同じ事業者名が同一年度で2回現れる、IDがないので企業名を変更した場合に名前をキーにしてデータをマージすると違う事業者としてのデータになってしまうなど、多くの問題がありました。

これらを一つ一つ、コードを書いて整理していくというクリーニング作業をやりました。エラーメッセージと格闘しながら結局3ヶ月くらいかかったでしょうか。検索と置き換えなどエクセルでできる操作もあるのですが、コードを書いておくと後で同じ操作をしたり、コードを少し変えてデータを改良することができます。その勉強のためにも、ChatGPT、 GoogleBard、この1ヶ月くらいはGitHub Copilotを使いながら悪戦苦闘しています。

2023後期(←イマココ)

今年も残り少なくなりましたが、色々とありました。これをちょうど書いている時に査読の結果リジェクトというショックな通知もきたし。涙

交通学会発表と論文投稿

10月に松山で開催された交通学会で、このエントリーで書いたようなデータを使った研究についての発表を行いました。この発表の前の段階で一応の論文形式にし、学会後に修正を行なってそれが査読(Peer review)される、という流れでした。

いいことばかりは続かない

今週2泊3日で仕事で中国の深圳に行っていたのですが、その滞在中に査読の結果がリジェクトというメールが入り、ドーンと落ち込みました。また、3名の査読者からのコメントも来たのですが、色々と苦労した結果が、至らぬところだらけであれもこれものコメントの数々、凹みます。しかも言われてることは当たってることばかりで、自分のあまりの力のなさがわかり、余計にグサグサきます。😅

投稿は3月末に出版される学会誌向けのものなので、同じ学会にリジェクト後の再投稿という流れはなく、修正できたら別の学会へ、という流れになるでしょうか。できるかどうかはわかりませんが。。。まあ、ちゃんと読んではくれた(査読すらしてもらえない時もあるので)、否定だけではなく改善の方向を多く示してくれている(実際に対応するのはとんでもなく難しそうで気が遠くなりますが)、失敗するなら早いほうがいい(チャレンジしないことには前進もない)、とポジティブに捉えるようにします。

リジェクト後に残るもの

かなりの時間を費やしたものなので、正直相当凹んではいますが(コメントは再読できていない。。苦笑)、前向きにというか、何が残っているのかという点を考えています。

手元に残っているものは、まずデータと、データ整理やモデルのコードがあります。これがあればモデル修正も時間をかければ可能です。

そして、次に残っているのは関連する先行文献です。こういう点はもっとしっかりレビューしろという指摘と、参考にすべき論文の指示までもらっているので、今後内容を修正して別の学会誌に投稿する場合でも、ゼロからのリサーチではないということになります。これはリサーチ時間の節約という点で大きいと感じます。

最後はやはり査読者からのコメントです。例えば大学院の授業や先生からの指摘は「練習としての試合」みたいなもので、やはり公式戦、本番の厳しさというのは出てみないとわからないものだと感じました。昔テニスやスキーなどの競技スポーツの大会に初めて出た時も、もう下手くそで顔から火が出るくらい恥ずかしかったことを思い出しました。それでもめげずに練習して、ちょっとづつ上達するものだったので、若い頃の思い出をもう一回追体験させてもらってるんだと思うようにします。

スポーツ同様、こういうのを経験しないと次がないと自分に言い聞かせててます。

新しい仕事、論文執筆と学会発表、20年ぶりの海外で初の中国、などなど、こうやって書いてみると激動の一年になっています。「もっと速く日本語も英語も読みたい」、「英語のコミュニケーションもまだまだ」、「経済学や統計学そのものの理解もまだまだ」、「ライティングも論理的でない」、「仕事で多くの中国人スタッフと関わるようになったので、できれば簡単な中国語もできるようになりたい」、など欲も出てきて、それに対して課題の大きさも実感もしてはいますが、成長の前の停滞というかフラストレーションだと考えたいですね。

今年も残りわずかですが、仕事も授業もまだまだ残っていますので、落ち込んでる暇はないと自分に喝を入れるためにも、リジェクトのことを書きました。

この記事が参加している募集

学問への愛を語ろう

この記事が気に入ったらサポートをしてみませんか?