見出し画像

米国におけるデータサイエンティスト不足への対応

概要

 米国では約10年前からデータサイエンティストが優れた仕事の一つとして位置付けられており、高額な給料や充実した福利厚生などの好条件で働ける環境があるにも関わらず人材が不足している。 
 人材不足を解消するためには、これから述べる問題に対して、専門分野ごとに分業したチーム化および自動化を促進することが必要である。


問題点

 米国で続いているデータサイエンティストの人材不足の原因は主に2つある。
1つ目は、データサイエンティストの需要が2010年頃から継続的に増加していること。2つ目は、需要の増加に応じてすぐには供給できないということである。

 データの保存方法や機能が進化するにつれ、データサイエンスも進化をしている。データサイエンスが進化すれば、さらにそのアプリケーションも進化する。Amazon、Google、Facebookなどの規模が大きく注目を集めている企業は、データサイエンスを活用していることでこれまで以上に応用性が高くなり、注目を集めている。この需要は、以下のように人気の高いリクルートサイトLinkedinとGlassdoorでの求人数が証明している。

 <Linkedin>
 2012年以降、データサイエンス関連の求人広告が650%増加
 <Glassdoor>
 2016年に1,700件だった求人情報が、2020年には6,500件に増加

 また、米国労働統計局は、データサイエンスの分野は2026年までに28%成長し、1150万人の新規雇用につながると予測している。



 データサイエンティストの需要は高まっているが、その需要を満たすことは容易ではない。
 ジョン・ウィルズ氏が言ったように、データサイエンティストとは、ソフトウェアエンジニアよりも統計学に長け、統計学者よりもソフトウェアエンジニアリングに長けている人のことである。そのため、一般的に、さまざまなスキルや経験が求められ、実質的には異なる業務を行っていても、似たような教育を受けている傾向がある。

 データサイエンスは比較的新しく、急速に進化しているため、大学ではその需要の高まりに完全に対応しきれていない。データサイエンティストは、コンピュータサイエンス、統計学、工学などに関連する科学や数学の分野から必要に迫られて誕生した。また、ほとんどのデータサイエンティストは上級学位を持っている。

「Burtch 2020 Data Scientist」の調査
 データサイエンティストの94%が上級学位を取得している。これは、6~10年の時間を費やすことを意味している。さらに、ほとんどのエントリーレベルの職種では、3年間の関連する実務経験が必要とされているため、投資期間は9~13年になる可能性がある。実際には、データサイエンティストの需要は増え続けているものの、ゼロからエントリーレベルの人材を生み出すのに、約10年かかっているのが現状だ。

レポート4

レポート4-2



問題解決のための試み

 問題解決の試みの中で特に注目されているのが、以下の3つである。
 ・データサイエンスブートキャンプ
 ・企業主導のトレーニングプログラム
 ・アウトソーシングや請負の増加

 データサイエンティストの需要に応え、この分野への移行を支援するために、データサイエンスのブートキャンプ(養成プログラム)が登場した。通常は、9~12週間の集中プログラムで、分析手法や頻繁に使用される言語、フレームワークなどの基本的な理解を深めることを目的としている。場合によっては、応募者は入学試験に合格する必要があり、費用は約15,000ドルと高額になる傾向がある。高い就職率を誇るブートキャンプもあるが、それが有効かどうかは個人差がある。ブートキャンプは、データサイエンティストと同等の学歴や実務経験を持っている場合にのみ応募できる。
ここで、ブートキャンプの一例を紹介する。

期間: 12週間/週40時間
費用: $15,000 (約166万円)
内容:
①データの基礎
 ・データの収集、アクセス、保存方法
 ・データビジュアライゼーションの方法
 ・Tableauのような業界ツールを使用し、ビジュアライゼーションをデザインし、推奨事項を提示する方法
②データサイエンスのための分析
 ・Pythonを使ってデータセットを解析する方法を学ぶ
 ・結果の解釈と定性的な推論を学ぶ
③機械学習のテクニック
 ・Deep Learningのような最先端のデータサイエンス・アプリケーションを体験
④ビッグデータの基礎
 ・クラウドベースのテクノロジーを使ってモデルを作成し、デプロイする方法を学ぶ
 ・Hadoopの経験を積む
⑤専門的な開発
 ・プロジェクトのポートフォリオを構築し、自分のキャリアをナビゲートする方法を学ぶ



データサイエンティストの育成について
 教育的・実務的要件を備えていない人は、データサイエンティストとしての仕事に就くことはできない。しかし、ブートキャンプを利用することで、データサイエンティストとして就職することができる。
データアナリストのようなエントリーレベルのポジションでデータサイエンスの分野に入ることは可能である。つまり、ブートキャンプは特定の人をデータサイエンティストとして移行させるのには効果的であり、エントリーレベルのデータアナリストを生み出すのにはより効果的と言える。

 ブートキャンプのような企業は、資格を持った社員をデータサイエンティストとしての役割に移行させている。
<Amazon>
2019年、7億ドル以上を投じて、10万人の従業員をデータサイエンスやソフトウェア開発者の役割にスキルアップさせる計画を発表した。
<Accenture>
さまざまな大学の大学院プログラムとパートナーシップを結んでいる。それにより大学院生は在学中にデータサイエンスの実践的な経験を積むことができ、Accentureは自社の社員教育に利用できる最先端の研究につなげることができる。

 このような大企業には、必要な学歴を持つ社員がすでに多数存在し、スキルギャップを埋めるためのトレーニングを行う手段があるが、中小企業にはこのような手段はない。


 一般的には、社内にデータチームを持つことは、アウトソーシングや契約社員を雇うよりも望ましいと認識されているが、人材不足のため、アウトソースが有効な選択肢となっている。コントロールの欠如やコンプライアンスのリスクはあるが、米国では "Beggars can't be choosers(ねだる人はわがままを言ってられない)" と言われている。

アウトソーシングにはいくつかの戦略がある。例えば、社内にデータチームを置き、必要に応じてアウトソーシングで専門家を投入する方法や、実際にプロジェクト全体を社外のデータチームに依頼する方法などがある。

 大手コンサルティング会社であるAccentureは、Accenture Analyticsを通じてデータサイエンスのアウトソーシングサービスを提供している。また、Fayrixのような中小企業も同様のサービスを提供している。データサイエンティストが不足しているため、世界のデータ分析アウトソーシング市場は2桁の成長を遂げており、Accenture、Capgemini、Fractal Analytics、IBMなどの企業が重要な役割を果たしている。



人材不足を解決する方法

 先に述べた2つの問題に対処するには、専門分野ごとに分業したチーム化および自動化を促進することが必要である。

 データサイエンスが進歩するにつれ、この分野での自動化も進んでいる。データサイエンティストが不足しているため、企業はこの自動化を促進する必要がある。データサイエンティストのタスクのすべてが自動化できるわけではないが、約80%の時間を費やしているデータの準備とクリーニングは、自動化できる部分である。重要なことは、自分が解決しようとしている問題の背景を理解することで、そのためにはエンドユーザーと会話し、そのニーズや問題点を深く理解する必要がある。この工程は決して自動化することはできない。
結果として、データサイエンティストが必要になるが、自動化によって多くの単純作業を行うことができる。

 自動化は、データの探索、フィーチャーエンジニアリング、モデルの作成にも役立ち、モデルは完全に自動化できるようになった。実際、2019年に開催されたモデル構築コンテストでは、GoogleのAutoMLが2位に入賞した。自動化を活用することで、企業はデータサイエンティストの作業負荷を下げることができ、結果的にデータサイエンティストの必要数を減らすことができる。

 自動化に加えて、専門分野ごとに分業したチーム化にも取り組むべきである。
データサイエンスが複雑になるにつれ、チーム化はより必要になってくる。なぜなら、一人のデータサイエンティストが、データサイエンスに関連するタスクを実行するために必要なすべてのスキルと知識を持つことは期待できないからだ。たとえそれができたとしても、データサイエンティストは不足しているため、現実的な選択肢にはならない。可能であれば、データサイエンティストのタスクは、スペシャリストや、スキルが低いもしくは経験が浅いチームメンバーに委ね、シニアデータサイエンティストが監督するべきである。スペシャリストやチームメンバーは、データサイエンティストよりも簡単かつ迅速にトレーニングを受け、成長することができる。スキルの低い人でも実行できるタスクを取り除くことで、データサイエンティストはより複雑なタスクに取り組むことができる。これにより、企業は手持ちのデータサイエンティストを最大限に活用することができるであろう。



<著者・編集> Charles Jewett
<サポート> Melanie Sweeney
<共同編集> 劉 海琪、Donald Thompson、李偉良、Melanie Sweeney、金敏
<日本語校閲> 小室奈々、鈴木優華
<参考文献/資料>
https://towardsdatascience.com/automation-in-data-science-f11fe389d49b
https://www.burtchworks.com/wp-content/uploads/2020/08/Burtch-Works-Study_DS-PAP-2020.pdf
https://finance.yahoo.com/news/global-data-analytics-outsourcing-market-114300404.html
https://www.businesswire.com/news/home/20200929005940/en/Data-Analytics-Outsourcing-Market---Global-Industry-Trends-Share-Size-Growth-Opportunity-and-Forecast-2020-2025---ResearchAndMarkets.com
https://www.forbes.com/sites/joewalleneurope/2019/03/26/can-outsourcing-data-science-fill-the-jobs-shortage-fayrix-believes-so/?sh=11b7e293bce7
https://bids.berkeley.edu/news/berkeley-institute-data-science-and-accenture-applied-intelligence-announce-new-collaboration
https://www.fiercehealthcare.com/tech/amazon-plans-to-spend-700m-to-retrain-a-third-its-workforce-for-data-and-analytics-roles
https://towardsdatascience.com/are-bootcamps-worth-it-if-you-are-switching-career-to-data-science-acd20ae21e73
https://www.quora.com/Are-data-science-bootcamps-worth-it-to-get-a-data-science-job
https://www.reddit.com/r/datascience/comments/ac2xmt/is_a_bootcamp_worth_it/
https://dataspace.com/dataspace-news/are-data-science-bootcamps-worth-it/
当社データベース