見出し画像

データサイエンティストになる夢を応援してください!【「#かなえたい夢」プロジェクト】

始めましての方は初めまして。たぬぽんと申します!

突然ですが、私には夢があります。それは、世界を牽引する「尖った」データサイエンティストになることです。


高校生の3年間はデータサイエンスに明け暮れた日々を過ごしました。その中で、データサイエンスとは単なるデータ分析でない。その結果をどう解釈し、どう表現するのか、それが大切だと感じ、またそれが魅力だとも感じました。

データサイエンスに惹かれたわけ、その魅力、なぜデータサイエンス学部に進学せず、分離融合の学部に進学したのか。そもそも何者なのか。

この記事からデータサイエンスへの熱量を感じ取ってください!!!


この度、さわかみ投信さんの「#かなえたい夢」プロジェクトの、応援したい14件のかなえたい夢に選出されました!

応募総数は10,648件ということで、その倍率なんと760倍以上!


数多く寄せられた夢の中からピックアップしてくださり、ありがとうございました!

もし、この記事を読んでる方の中に、さわかみ投信のファンド仲間の方がいらっしゃいましたら、応援のほどよろしくお願いしますm(_ _)m

ちなみに、投票期間は2024年3月14日までとなっています。


何より、この記事に興味をもって読んできてくださった皆様に感謝申し上げます!ありがとうございますm(_ _)m

もし、応援していただけるという方がいらっしゃいましたら、スキ・フォローをぜひお願いします!(メンバーシップも一応あります…)


この記事では、なぜデータサイエンスに興味を持ったのかその魅力は何なのかなぜデータサイエンティストになりたいのかの3本柱でお話しさせていただきます。




データサイエンスとの出会い

私の通っていた高校では、データサイエンスに力を入れたSSH校に指定されており、情報の時間を中心にデータサイエンス教育がなされていました。

つまり、高校がデータサイエンスとの出会いの場となったのです。


とある企業の売上向上プランを考える

本格的にデータサイエンスに触れ始めたのは、高校1年生の夏。

具体的には、とある実際の企業の生データを使用して、売上向上のための施策をデータ分析を用いて提案するというものでした。

何もかも初めてのこと。

商品別の売上データから、来店客数をはじめとする顧客データなど、初めて触れるものばかりで何からを手を付けていいのかさっぱりでした。


物は試しということで、Excelを用いて折れ線グラフや円グラフに顧客データをまとめたり、売上と滞在時間の相関を求めてみたりなど、いろんなことに挑戦しました。

グループで研究していて、私がリーダーをしていました。互いの進捗状況のすり合わせや分担が難しかったのですが、Excelで簡易的なタスク管理シートを作成し、だれが何を今やっていて、何が手つかずになっているのかを視覚化できるようにしました。

最終的には、拙いながらも広告と売上の関連性を導き出し、オンライン販売の有用性を用いた売上向上案を提案しました。


これらの活動が功を奏して学年で一番良い評価を頂き、京都大学からも教授が見に来られる校内発表会で一年生ながらも研究発表をさせていただきました。

約半年間の研究だったのですが、これが本当に達成感に満ち溢れていました。これをきっかけにデータサイエンスの沼にはまり始めたのです。


地方創生をデータ分析で考える

高校2年生からは、各自グループを組み、好きなテーマを選択して研究を進めます。

ここで、選んだテーマが「地方創生」でした。


私の住んでいる場所は兵庫県なのですが、実際にどんな課題があって、それを県政は把握しているのか疑問に思いました。

せっかくビッグデータが存在しているのに、それを地方創生に生かせていないのではないか。それなら、私たちがその方法論を提案すればいいのではないか。そういう動機で研究を始めました。


具体的には、複数観点のデータから地域を比較する独自指標を作成し、その指標をスコア化することで、今までにない新たな地域比較の方法論を提案するというものです。その結果を元に、効果的な施策を提案したのです。

研究をする中で、大学範囲のデータサイエンスにも果敢に挑戦しました。Pythonを用いた主成分分析や階層クラスター分析をはじめとする、高校生だからと馬鹿にされない、本気のデータサイエンスをしました。

この研究は現在も続けており、各種コンペティションやシンポジウムにも多く参加し、日本一を3度、世界大会参加権を2度受賞しました。


この研究を通して、データサイエンスの専門家である大学教授の方と実際にディスカッションさせていただいたり、兵庫県の課員の方とお話しさせていただいたりしました。この経験がすごく大きかった。

最前線の現場に触れることでしか見えない、データサイエンスの魅力が肌で感じられたのです。


私は幼いころから、科学者になることが夢でした。

高校でのデータサイエンスとの出会いをきっかけに、科学者の中でもデータサイエンティストになろう。そう思い始めるようになったのです。



データサイエンスの魅力

データサイエンスは、ただデータを分析するだけではありません。その結果をどう解釈するか、それをどう表現するか。

つまり、データの分析力のみならず、論理的思考力、コミュニケーション能力、プロデュース力、これら全てを掛け合わせた力が必要だと感じました。

これはすごく大変なことですが、やりがいがあって楽しい。


データを分析することで、そのデータの裏にある新たな価値を生み出す。

データを組み合わせることで、それらのデータに共通すること・相反することを読み取り、その関連性を把握する。

導きだした結果を実際の肌感と照らし合わせ、何が課題なのか、何が求められているのかを整理して、解決策を導き出す。


データは一見単純に見えて、その裏には様々なストーリーが隠されています。そのストーリーを解読していく過程がまるで宝探しをしているかのようで、極めれば極めるほどその面白さのとりこになりました。


例えばこの図。

これは、私の独自指標を元に47都道府県を階層クラスター分析にかけたものです。似た特徴をもつ都道府県同士が順々につなぎ合わさっていく様子をグラフにまとめています。


縦の線が長く伸びているほど、遠い関係にある都道府県だということを示しています。逆も然り。

どの地域が似ているか、またどの地域が似ていないのか、肌感にすごくあっていると思いませんか?

都市部と地方部には大きな差があるということも、青い線から一目瞭然です。

ここまでたどり着く紆余曲折あったのですが、なんとかここまで精度を高めることができました。


一見単なるデータの羅列でも、このような肌感に合致した結果を導き出せたとき、データサイエンスって面白いなとしみじみと思います。これがデータサイエンスの魅力ですね。



どんなデータサイエンティストになりたいか

最近でこそ日本でもデータサイエンスが注目され始めており、色んな大学でデータサイエンス学部ができ始めてきました。

しかし、私はすぐに飽和してしまうと考えています。

既に欧米がそうであるように、データサイエンティストは正直各会社に一人いれば十分なのです。むしろ、いなくても良いと思っている会社も多い。


そんな中で生き延びていくためには、「尖った」データサイエンティストになることが求められます。

まだデータの分析が定着していない分野。そういう分野で第一人者として駆け抜けていけるような、そんなデータサイエンティストになりたいと考えています。

それこそ、地方創生もまだまだその一つだと思います。


高校で様々な研究をしているうちに、データの分析以上にその研究対象の深い知識が必要になってくるなと感じました。

その研究対象の知識が不完全なまま結果を導いたとしても、それが肌感にあっていない、現実とかけ離れたものであれば、なんの意味もありません。


ゆえに、私は大学選びでわざとデータサイエンス学部を選びませんでした。

将来研究対象となりえる様々な知識を得られるであろう、そして国際的に羽ばたいていけるだろう。そう考えて、神戸大学の国際人間科学部というところに進学することに決まりました。

大学生の間に、分離を問わず様々な知識を吸収して、自分にしかなりえない、そんなデータサイエンティストになって見せます。


直近では、Global Link Singapore 2024 という世界大会への推薦参加権を頂いております。

ですが、さすがに費用が高すぎるので悩んでいるのも事実。参加締め切りが4月中旬までなのでもうちょっと悩みます^_^



ここまで読んでいただき、本当にありがとうございます!

私のデータサイエンスの本気度は伝わったでしょうか。大学入学後も、高校生の時の熱意をそのままに頑張っていきたいと思います。

もしよろしければ、応援・支援よろしくお願いします!


この記事が参加している募集

探究学習がすき

世界大会へ行くための足しにさせていただきます! ご支援よろしくお願いします🙇