見出し画像

データサイエンスの各国の現状 〜日本〜

 これまでアメリカと中国のデータサイエンスの現状をご紹介させていただきましたが、私たち身近な状況はいかがでしょう。

今回は、日本の現状と当社の考察をご紹介いたします。


データサイエンティストとは

 日本におけるデータサイエンスの考え方は、2013年発足の一般社団法人データサイエンティスト教会によって取りまとめられている。
教会のカリキュラムによって、「ビジネス力」「データサイエンス力」「データエンジニア力」の3つのカテゴリからデータサイエンティストの定義を図ろうとしている。
これらのカリキュラムは、割合として1:1:2の割合で構成されており、データエンジニア力を重視した考え方である事がわかる。(データサイエンティスト教会 カリキュラムより)

1.レポート3日本

これらの3つの要素はどれが欠けても「データのスペシャリスト」と呼ぶことはできない。

それぞれの要素がかけると以下のような事象となる。

2.レポート3日本

各フェーズで必要となる3つのスキルバランスは、以下の通りである。

3.レポート3日本


次に、企業における実態とデータサイエンスの業務内容について確認をしていく。

4.レポート3日本

 こちら調査結果から分かる通り、69%もの企業にデータサイエンティスト自体が存在していない事がわかっている。
在籍している会社も5名以下がほぼ半数で非常に少数である事がわかってきた。



データサイエンティストの業務内容

 データサイエンティストの具体的な業務内容についてまとめると、以下の流れとなる。それぞれが重要かつ論理的な工程であるため、ある工程で間違いを発見したら、その前の工程に戻って修正を行うという「ウォーターフォール形式」で行われるのが一般的である。

<1. 目的、目標とテーマの設定、問題提起>
 データサイエンティストは、データを取り扱う前にビジネス上の課題を発見し、明確化する。多数の課題が得られた場合は優先順位をつけ、課題解決のための仮説立案や達成目標の設定も行う。

<2. 必要なデータの収集>
 アメリカの調査会社ガートナーによると、データの中でもビッグデータは「データ量(Volume)」「発生頻度(Velocity)」「多様性(Variety)」を備えた大量のデータ群と定義されている。ただし、やみくもに大量のデータを集めただけでは、ビッグデータから十分な分析結果を得ることは困難である。データサイエンティストは、特定した課題の解決につながる可能性が高いデータをビッグデータから収集し、必要に応じてデータ形式の変換やデータの統合を行う。

<3. データ処理、分析と分析結果の解釈・考察>
 データサイエンティストはプログラミングや統計学的解析のスキルを駆使して、収集・整理されたデータの分析を行う。さまざまな視点から分析結果を解釈あるいは考察し、結果的には課題を解決できるような方向へと導いていく。途中で、別の手法でデータ分析を行ったほうがよい、あるいはデータが不足していると気づいた場合、必要に応じてデータの追加やデータ分析のやり直しを行う。

<4. 分析結果の報告と解決策の提案>
 データ分析結果や知見をまとめたレポートを作成し、経営幹部や事業部門へ報告する。レポートは通常、統計グラフや図形で可視化し、データ分析に詳しくない社員にもわかりやすくする。また、データ分析結果にもとづき、課題解決に向けてプロジェクトチームが取るべきアクションを提案する。



現状と課題

 自動運転や通販のレコメンドなど、データが活用されているシーンが増えておりデータサイエンスが重要な役割を担っている状況となってきているが、人材不足から有効となる事例が少ない事が課題と考えられる。

 人材不足は、一般職員のデータサイエンティスト化(シチズンデータサイエンティスト)によって解決をするという考え方がトレンドとなっている。つまり、業務知識に造詣のある一般職員がツールを使いこなしてデータサイエンティストの業務の一部を実施し、専門家の登場するポイントを限りなく少なくして解決をしようとしている。

 事例に関しては、少ないながらも出てきている。以下を事例として共有をしたい。(出典:https://www.shigotoba.net/bigdatawokigyougyousekini_1808_1.html

【楽天】レコメンドに加え、ランキングの更新頻度とジャンルの細分化で、売上向上
レコメンド(オススメ)機能を活用するだけで30%の売上向上が可能と言われている通販業界。その大手企業である楽天は、更新頻度の短縮と、ジャンルを細分化したランキングの導入を試みて、大きな成果をあげた。ランキング頻度が高いほど売上は増加し、ジャンルが細かいほど全体の売上があがるという分析結果に基づいた改善。
(参考:「楽天の執行役員がビッグデータでEコマースの売上げを急伸させた秘策を公開」[流通BMS.com] )
【スシロー】レーンに流れる寿司の鮮度や売上状況を管理し、売上向上
回転寿司チェーンのスシローでは、すべての寿司皿にICタグをとりつけ、レーンに流れる寿司の鮮度や売上状況を管理している。どの店で、いつどんな寿司がレーンに流され、いつ誰が食べたのか、どのテーブルでいつどんな商品が注文されたのか、などのデータを毎年10億件以上蓄積。需要を予測し、レーンに流すネタや量をコントロールしている。
(参考:「楽ビッグデータの高速分析で、隠れていた課題や問題点を可視化 回転寿司業界のNo.1を支える迅速な経営判断と店舗オペレーションを実現」[アシスト] )
【ヤクルトオランダ】自社商品による顧客の奪い合いを解消して売上げ20%増
オランダにおけるヤクルト商品は、1つのカテゴリに150点もあり、互いに店頭で顧客を奪い合っていた。効率化を図るためにデータ分析を行った結果、商品のうち「15本パック」と「7本パック」は購入する顧客層が異なることがわかり、2つを併売すればどちらも売上が増加することを発見しました。その後も分析と改善を繰り返し、同社の売上は20%も増加した。
(参考:「ヤクルトの売り上げを大幅に伸ばしたデータアナリティクスの秘密」[ITmediaエンタープライズ] )
【無印良品】商圏分析を形式化して、出店判断をサポート
無印良品では、利用者の拡大に伴って収集した、オンラインと店舗購入、さらにSNSでの発言にまたがる数千万件の購買データを分析。商圏分析の結果が視覚化され、それまでエリアマネージャーの感覚に頼っていた商圏分析を、データベースを元に判断できるようになった。新規出店が既存店に与える影響予測や、オープン後の検証まで行えるようになっている。
(参考:「ビッグデータ分析で「顧客時間」の拡大に挑む、無印良品のO2O戦略」[クラウドWatch] )
【千葉県柏市】スマートシティ構想でCO2 5万トン削減をめざす
千葉県柏市では、道路に設置されたカメラや、ナンバープレート識別センサーから交通状況の監視を行い、自動車のCO2算出に取り組んでいる。これに、市営の乗合バスや、自転車共同利用サービスの運営などを組み合わせることで、CO2を5万トン削減したスマートシティを実現する計画である。
(参考:「今更聞けないビッグデータの基礎と業界別の活用事例15選」[CodeCampus] )
【大阪ガス】修理作業員の作業を自動化して人件費を圧縮
過去数百万件にわたる修理履歴や機器の型番データと、コールセンターに寄せられる修理依頼の内容を組み合わせることで、ケースごとに必要となる部品を自動的に割り出し、修理作業員が行う作業を自動化することに成功した。サービス業で人件費のウェイトが高いことを考えると、非常に有効な活用例と言えるだろう。
(参考:「ビッグデータを価値につなげる活用事例15」[IT Readers] )
【Jリーグ】年間の全試合日程を4日間で決定
サッカーの試合日程を決めるのは、ホーム/アウェイ、平日/休日、移動距離等、様々なファクターが混在しており、非常に複雑な作業である。Jリーグではこれを公平に決定する解析エンジンを開発。1月の天皇杯決勝から数日のうちにスケジューリングしている。
(参考:「Jリーグの試合組み合わせにも データ分析の意外な活用事例とは」[ogmi] )

 
 また、これらの事例の中には海外製のソリューションを採用しているものが多い。これは、日本製のベンダー製品が少なく、海外製のものが革新が速くてニーズにマッチするものが多いためと思われる。

実際にデータサイエンスとして実施をして欲しいことを求人情報から探ってみる。


各種求人情報のデータ

 各種求人情報のまとめサイトの求人数から、現在求められている状況を検討してみると以下のようになる。

   データビジネスアナリスト 2,968 件
   データアナリスト     5,922 件
   データアーキテクト    5,342 件
   データエンジニア     88,561 件
   機械学習エンジニア    18,335 件
   データサイエンティスト  9,831 件
   データ分析        93,898 件

(※求人情報まとめサイト スタンバイ(https://jp.stanby.com/)の集計結果)

 このうち、データエンジニアと機械学習エンジニアに関しては非公開求人も相当数含まれている。これらから推測すると、比較的実施をしてほしい事がはっきりしているデータエンジニア及び機械学習エンジニアに関しては、ピンポイントで求人情報が発信されている事がわかる。データ分析は大量の求人情報が出ているが、これは全て職種に対してデータ分析が含まれるため、重複して検索された結果とみる事ができる。

 これらからわかることは、データサイエンティスト関連の業務で一番求められるのは、データ分析であり、技術力が不足しているためデータが扱えないという課題が明確なため、データエンジニアが非公開を含めて条件がはっきりと求人に出されており、全体的にみた場合はデータがビジネスに及ぼす影響までは見通せていないという推測ができる。



見解・考察

 データサイエンスで実現して欲しい事が明確でない分、ビジネスへ応用事例が少ないという現状が浮き彫りとなっている。日本製のデータサイエンスに関するツールが少ないことも無関係ではないと思われる。これは、データはあくまでも事象や状況を表すものであり、言語によって左右される要素が少ないためと推測される。
データサイエンティスト協会が資格制度を定義し、今年の9月から試験が始まるなどデータサイエンス、データサイエンティストの定義について固める動きが出てきている。

 その一方で、上記で示した8つの例に加えて最新のニュースで米スノーフレーク社(クラウドデータウェアハウス)が伊藤忠と協業する事でファミリーマートのビジネスにおけるデータ活用を模索するなど、実態とデータがつながりやすいところから徐々に事例が出てきている。

 様々なスキルが必要とされるデーサイエンスの分野だが、各要素に関してはスキルを既に持っている技術者も多いと推測されるので、業界としては今後、一人のスペシャリストの育成を行うのではなく、一般職員への啓蒙も含めたデータサイエンティストチームの構築へ考え方をシフトする事でデータサイエンスが企業の未来を支えていくものになると推測される。


<著者>
金子 尚司