見出し画像

日経 Data Society Fes 2020 まとめ・感想 2

日立システムズ 「ITサービス領域での価値創出のためのデータサイエンス活用」

ITデータサービスベンダーとしての「データサイエンティストとは?」

・データサイエンティストとは、数学に基づくデータ分析・技術活用により業務課題を解決する職業
・まずは数学・統計学の網羅的な知識+実装能力が必要。次にドメインナレッジを体系的に習得すべし。最後は課題解決経験。
・コンサルティング、アナリシス、エンジニアリングの知識と経験が必要
→実力不足が問題
・業務プロセスは
1 分析課題設定(数学的に課題とKPIを設定)
2 データ分析(有効情報の抽出、数理モデル構築。統計学と数理分析手法を駆使)
3 AIシステム開発(課題を自動的に解決するシステム、大切なのはAIシステムの挙動を監視し、予測と実績のギャップを解析し改善課題を考えること)
4 AIシステム運用・保守

・データサイエンス業務を行うためにはデータサイエンティスト、AIコンサルタント、AIプロジェクトマネージャー、AIアーキテクトの4職種が必要。(チームで業務を行う)数学の基礎力がとにかく求められる。

・アシスタントやデータエンジニアはまだ初歩的な方(データ分析やデータ整形のプロセスを経験している程度)で、データアナリストやAIエンジニアとなると学部水準の数学と統計学の理解やPythonのライブラリの習熟が必要。プロダクトサイエンティストやAIリサーチャーとなると大学院水準の数学と統計学の理解や数理モデル実装能力、課題解決の経験が必要。

・数学の知識としては
入門レベル=微積分、線形代数、数理統計、位相空間論など
特定分野=関数解析、微分方程式、多様体、圏論など
さらに....=数理物理、統計、AI技法のあらゆる分野
・AI技法は機械学習、ベイズ統計学、深層学習に分類され分析の目的と手持ちデータに基づき使い分けられる。
・機械学習系の技法は回帰系、分類系、クラスタリング系、次元削減系に分けられる。使うだけなら容易だが使えるものにするのは難しい(数学のスキル必須)
・深層学習(ディープラーニング)は多層ニューラルネットワークをベースにした機械学習。綺麗な大量データに限って高い予測・分類性能が発揮される。

・予測性能が高い数理モデルが得られても、運用効果が出るかは別問題であり、実用的な数理モデルの開発には数学・統計学の活用力が不可欠。
・AIは予測性能が高いだけでは不十分であり、解釈性と説明性の担保が大切。

◎実務における数学・統計学の価値
・これらを活用できればデータに基づくビジネス展開・システム開発プロジェクトの随所に活かせる。
・応用理論まで理解できると、データを扱うビジネスや社会課題解決の成功確率向上につながる。キャリアの選択範囲が拡大する。合理的な実務を実行できる。


[会社について]
・企業理念は「真に豊かな社会の実現に貢献する」ために
2020年にDX推進センタを新設
事業を活動を通じてSDGsへの貢献(ITをコアとした多彩なビジネス・ソリューションのサービスを強化)、社会課題解決に貢献できる人財の育成(数理科学・情報科学の知識活用方法に関する社内研修)
・ミッションは「社内の経営課題・現場課題をデータサイエンスを活用して解決し、そのノウハウや成果物、人財育成を通じてイノベーションに貢献」。
→社内IT部門の組織としてデジタル技術を活用し、生産性向上やビジネス価値創出
実務と技術の両面で社会実装を推進できるシニアレベルのデータサイエンティストの育成


[ひとこと]
この方の話を聞くとデータサイエンティストになることの難しさをかなり感じたのと、実力不足の人材が多い理由も分かった気がした。うちの学科も"データサイエンティストになれる!"を若干"うたっている"部分があるが、どう考えても4年間じゃ学びきれないように思う。常に向上心を持って日々学び続けられる人は向いているだろう。私はサイエンティストよりコンサルをしたいなと思った。

専門的な話が多く数学的な面でも技術的な面でもレベルの高さを感じた。しかしデータサイエンティストになるために具体的に何が必要なのかをここまで具体的に聞ける機会は初めてだったので貴重な経験になった。