見出し画像

The Hidden Costs of Data Collection: Time and a little bit money

 まったく予期してなかったことだけど、このnote記事のタイトルの通り、データの取得という作業には時間がかかる。

それも取得している最中は、うまくいっているのか分からない状態で。。。

 はじめのうちは順調だった。。。

↑これをXでポストしたときは、おーーーって思ってたけど、別のデータを集めようとしたらつまずいた…

 いま、ある特定の6か月間の間に提出された上場会社のディスクロージャーの訂正報告(情報)について、それが行われた前後一定期間内に大きな株価の変動があった場合にそれを抽出してもらうことをコードを走らせてやってもらっている。


 そしたらデータを集めて解析してもらうのに、一晩くらいかかったうえに、最後の最後にデータを集めた結果をCSVファイルにまとめてもらうと言う作業をしてもらおうと思っていたら、保存するフォルダが存在しなくて、最終的にエラーが出て終わった。
 なので、データの収集・解析もうまくできてたのかもわからずじまい(オレの直感だと、たぶん全部がうまくできてたということはなさそう…)。


R0005328


 コロナ禍のとき、講義動画なんかを作成したときは、動画ファイルのエンコードに数十分かかったと言うことはあったけど、それに比べて、今回は主に数字のデータを扱う程度だから、一瞬でおわるべ……なんて考えてたけど、全然あまかった…..


 これだけコンピュータなんかの性能が伸びて、AIなんかもバリバリ使う時代でも、時間がかかる、ってことがあるんだねぇ……


 でも、今くらいの失敗を繰り替えしている段階だと、負け惜しみっぽいかもだけど、ちょっとなんか楽しい。


 ちょっとずつ改良を加えて、コードを走らせて……って、やっている行動の態様はまったく違うけど、研究してて、あーでもない、こーでもない、って考えてるときと変わらない気もする。


 ただ、問題は、1回の実験(おためし)に最低5,6時間とCursorでChatGPTのAPIを使いながらコーディングするときに、ちょっとお金がかかる、ってことなんだよなぁ….. それでも、もうちょっと時間短縮できるコーディングはないですか? ってChatGPTに聞いたら、よさげな提案もしてくれたんだけどね。

R0005325


 ってか、昨日、たまたまオラの指導教授とひさしぶりに話したときに、最近、オイラが研究論文だせてないせいか、「いまどーいう研究してんだ?」って聞かれて、「↑でかいたようなことをしてます」って言ったら、「そうか、まあ、(オラの考えていることがちゃんと)できたら、(ちゃんとした)実証研究になりそうだな」とは言ってもらえたんだけどね。

 オレ自身は、ひょっとしたら、今やっている研究は、ほかの法律学者の人たちにはほとんど理解してもらえないかもしれない、って思ってたので、(仮に成功したら)分かってくれる(関心をもってくれる)人もいるかも……って思って、ちょっとホッとした。

 このタイミングでしばーらく話してなかった指導教授とこーしたやりとりをするってのもいい兆しだ、って思うことにして、もうしばらくあーだこーだしてみるッス。


 ってか、仮に今の研究がもうちょっとうまくいったとしたら、1人だと時間かかりすぎるし、こりゃ複数のMacゲットと、共同研究者の募集かもなぁ……


R0005331

 ホント、夏っぽくなってきましたなぁ〜〜







まだまだとても、サポートを受け取れる内容にはなっていないと思いますので基本的にサポートは不要です。でもでも、もしサポート頂けたら、何か面白くなりそうなことに使わせて頂きます!!