見出し画像

データサイエンティストのイメージと現実のギャップについて考える

こんにちは、Mikenerianです。


この記事では、世間的あるいは学生から見た(あこがれや理想に近い)データサイエンティストのイメージと、現実で様々な案件に対峙するデータサイエンティストのイメージについて、なぜこんなにもギャップが生じているのか、考察したいと思います。

前半部分で世間的なデータサイエンティストのイメージと、現場で働くデータサイエンティストについて軽く定義し、後半部分でそのギャップがなぜ生まれてしまったか考察します。

内容はあくまでも私見です。現実には、あこがれに近いデータサイエンティストの方がいるのかもしれません。もし周りにいたら、ぜひコメントお願いします!

ちなみにMikenerianはとあるIT系会社でプロジェクトマネージャーをしつつ、プロダクトマネージャーやデータサイエンティストなど新領域の新規事業を企画するような立場に2年間従事しています。


ところで、そもそも更新頻度が高くないMikenerianではありますが、そろそろnoteを活用しようと思います。

今までははてなブログを中心に更新していましたが(半年に1回くらい、、、)、noteの気軽さと拡散性の高さに惹かれています。


2020/12/21追記

私が記事を書こうと思ったきっかけの元ネタを再発掘できました。

これはデータサイエンティストを志す人々にとってのバイブルだと思います。顧客や案件という現実と真摯に向き合い、客観的事実の中から具体的な解決策を探る。

それがデータサイエンティスト、機械学習が社会に求められることの本質なのかなと思います。

データサイエンティストのイメージ

「データサイエンティスト」という仕事をイメージすると、どのような姿を思いつくでしょうか。

・なんかよくわからないけど、パソコンでデータを集めている?

・ひたすら表とにらめっこするプログラマー?

・ロジカルにカタカナを使いこなしそう

私が学生の頃はこんな感じで、何をする人かよくわかっていませんでした。

ただ、統計や人工知能に対する高い専門性と、世の中のサービスに貢献するインパクトの強さから、個人的には漠然とかっこいいイメージを持っていました。

データサイエンティストとして有名なTwitterアカウントを見ていると、かっこいいイメージがついてしまいますよね。

TJO / Twitter

もう少し世間一般的な解釈を織り交ぜるために、Wikiも見てみましょう。

データサイエンス(英: data science、略称: DS)またはデータ科学[1][2]とは、データを用いて新たな科学的および社会に有益な知見を引き出そうとするアプローチのことであり、その中でデータを扱う手法である情報科学、統計学、アルゴリズムなどを横断的に扱う。

なかなか秀逸にまとまっていると思います。おさえておきたいこととして、「データを扱う手法である情報科学、統計学、アルゴリズムなどを横断的に扱う」という言葉に表されているように、深い専門性と広い視点が求められる職業であるといえるでしょう。

ざっくりまとめると、データサイエンティスト=情報科学系に詳しい人というイメージですね。


現場で働くデータサイエンティスト

それでは、どのような仕事をしているのか。事例や特集から見ていきます。

ググると色々出てきますが、一例として以下のような記事があります。

この記事でも語られているように、コミュニケーションが大事、と口を揃えて言われます。

むしろコミュニケーションスキルが一番クローズアップされている状況からも分かる通り、コミュニケーションがあって始めて、専門的な統計学の知識などが必要になってきます。

もっと言うと、顧客からデータを集める部分、顧客に結果を説明する部分など、仕事の結果に直結するのはコミュニケーション部分になります。ぶっちゃけ、過程で使われる統計的知識はどうでもいいまであります。

というような具合で、GAFAのように何もしなくてもデータが集まるような企業以外は、最初のデータ収集でコミュニケーション、アウトプットの説明場面でコミュニケーション、というように、コミュニケーションが重要視されます。

これは個人的な印象になりますが、完全に業務としてはコンサルタントと同じだと感じています。違いは、データを使うか口八丁かだと思っています。

つまり、データサイエンティスト=顧客とデータを使ってコミュニケーションを取る人というのが実態です。

期待されることと現実のギャップ

実際にTwitterでも以下のような記事がバズっていますし、そもそも分析しようにもデータが無いというのはあるあるです。むしろデータを収集するためにシステムを構築することが、一番のメインタスクになる案件もあったりします。

データサイエンティストのイメージ / Twitter

なぜ、このような期待外れな出来事が起こってしまうのか。これは私の仮説ですが、その背景は関係者間のミスマッチです。

ミスマッチ

データサイエンティストという言葉が指す範囲が広すぎて、図の左上と右上が混同されているというのが私の仮説です。

同じ名前を使って右上になれるという希望を持たせることも良いですが、現実働く姿、左上の良さを伝えるよう努めることが、本当の意味でいい人材を育てるためには大事だと思います。

若者の夢を潰すな

とある漫画キャラも言っていましたが、「憧れは理解から最も遠い感情」です。

そういう意味で、意識高い系学生を釣るのは簡単ですが、現実を戦う会社を作るにはもっと建設的なPRをしてほしいと切に願うばかりです。

この記事が気に入ったらサポートをしてみませんか?