スクリーンショット_2020-02-16_1

「データサイエンティスト」というお仕事とは何か?【前編】

はじめに

「データサイエンス」という職業がここ2〜3年で大分浸透してきたように思えます。かつて私が営業で求人広告を作っていた時にそんな求人なかったので間違いなく当たり前になったのだなーと感じております。

ところで皆さん「データサイエンティスト」という言葉から何を想像しますか?一番多く想像されるのは「機械学習・AI作ってる人」でしょう。もしくは「統計・分析のスペシャリスト」と考える人もいるでしょう。どれも正解といえば正解ですが、この認識では結構過不足もあると思います。何故ならば「分析をする」「AIを作る」どちらをやるにも「データを作る」という業務が発生するからです。

この記事ではデータサイエンティストのお仕事の概論を私なりにさらっとお伝えします。ドラフト書いていたら長くなってしまった故前編・後編で分けて投稿します。「お仕事」と定義しているので「ビジネス領域」のお話しだということをご理解いただけると幸いです。

「おらはこれからデータサイエンティスト目指すんだ!」「拙者はこれからAIの作成プロジェクトを任されたでござる!」「ジョブチェンジ考えてるんだけど…データサイエンティストとか考えられない…」そういう人がもしいたら、自分もそういう道を通ってきたので少しでも参考になったらと思います。

■データサイエンスの面白さ

データサイエンスの分野は日々進化しています。しかし実際に今王道で使われている分析手法や機械学習のロジックは意外と1970年代のものや古典的なものが多いのが実態です。逆にいえば新しいロジックを生み出したり、過去提唱されていたものを応用して実装したりするチャンスも多い状態です。また数値だけでは判断できない現場での感覚的な要素、いわゆる「ドメイン知識」を以下にモデルに落とし込むかはデータサイエンティストの腕が試されるところです。私は現在、マーケティングの企画職という肩書になりますが、データサイエンティストとしての仕事も多く抱えています。この仕事にやりがいと伸び代しか感じないが故に今の仕事に誇りを持って携わっています。

■そもそもデータサイエンティストが必要になった背景


私が考えるにこの10年で大きく3つの事象が重なったからだと考えます。一言でいえばテクノロジー進化の産物です。

①ビッグデータを活用できるようになったこと
②スマホの爆発的普及
③ビジネスでの活用シーンが増えたこと

実は知らない人も多いかも知れませんが、機械学習とかAIはそもそも1950年代からその分野が提唱され、数々の取り組みがなされています。中にはブームになった時期もあります。しかしそれでも定着や職業になりませんでした。理由は、大量データの溜め込み処理ができる環境がなかった。また気軽にやるには高すぎる設備投資が必要だった。これらの壁が厚かったことで一部の領域でしか実現できなかった背景があります。

それを解決したのはIT分野のテクノロジー進化によるものです。特にクラウドサービスが台頭したことが、活用に大きな波を作りました。これにより事業者側は気軽にサーバー環境や分析環境を作ることができるようになりました。

そしてそれを後押ししたイノベーションがスマホの普及です。これにより情報収集の流れが一気にweb上に集まるようになった。旧来メディアや実店舗では中々定量化できなかった顧客の動きが集まるようになったことが大きな

またビジネスの領域でもマーケティングの領域やCRM領域が目覚しくデジタル化したことで定量数値を見る機会が多くなっていました。これによりデータ活用の意味や意義が事業者側にも深く理解をされていたことも侮れない要素です。

これらが重なり各事業において「データ利活用のスペシャリスト」のニーズが生まれてきた背景になったと考えております。

■データサイエンティストのお仕事とは


基本的にはしたの3つをやるお仕事だということです。

【基本的な業務内容】
①課題に対してデータを用いた分析や機械学習のモデルを「設計」する。
②実際に設計通り分析や学習モデル「実施・検証・改良」をする。
③出てきたアウトプットを「解釈」したものを報告(実装)する。

これだけ書くと設計→分析・検証・改良→報告という流れです。実際よくある求人や業務内容はざっとこんな感じで書かれています。
しかし、現実はこれだけではないのがデータサイエンティストの実情です。
ましてや、この3つをやる前にそもそもという話をちらほら聞くこともあります。下記が裏業務となります。

【裏業務内容】
①ローデータを用いた果てしない抽出・加工業務
②変数を作るために必要な各部署へのコンセンサス業務
③池上彰の如く、分かりやすく結果を説明する資料作成業務

「そもそもデータがない(取得してない)」とか「機械学習モデルの果てしないチューニング沼」とか「依頼者に結果説明したけど言葉が伝わらない」このようなことに世の中のデータサイエンティストの多くは直面しているのではないでしょうか…もちろん私は直面しました。
このような裏業務の5割くらい時間が取られます。(むしろ裏業務③は重要)この辺の大変さについては違う記事で別途詳しく説明します。

多くのデータサイエンティストを目指す人は表の業務をやりたくて入るけども実際はかなりのデータ加工とかを手作業でやらないといけなかったり、社内調整しないといけなかったり、決裁や依頼者を満足させるために説明する時間をたくさん設けないといけなかったりかなり息の長い仕事が待っています。

そういう仕事が多くなる理由は、背景で書いた通り「データ利活用のスペシャリスト」を現場が求めているからです。

次回はデータサイエンティストに求められるスキル他の職種との違い、文系の私がなれた理由についてお伝えします。


この記事が気に入ったらサポートをしてみませんか?