データサイエンス

データサイエンス関連を勉強中です。
(現在機械学習を勉強中。数理最適化も開始。)
改めて、データサイエンスってなんだっけ?と思ったのでまとめてみます。


データサイエンスとは

人によって異なりますが、大枠は「データを元に、有益な指標を導き出すもの」という解釈が多いです。
ただ、単純なデータ分析だけを示すものではなく、範囲は幅広いです。
データの集計から統計、機械学習、数理最適化なども含めてデータサイエンスに含まれます。
データに関する最初から最後までをひっくるめて、データサイエンスであるというのが正しそうです。

データサイエンティスト

データサイエンティストとは、dodaでは、「主にビッグデータを解析することで、経営に役立つ情報を抽出する人、ヒントや気づきになる新しい事象を発見する業務をこなす人、またはそのスキルを持つ人のこと」と定義されています。
そして、その仕事内容はデータの分析だけでなく、「データ収集」「企画・仮説考察」「前処理」「分析・解析」「結果の解釈・仮説検証」「レポーティング」というのが基本プロセスとなっています。

DS協会では、データサイエンティストに必要なスキルは、3つと定義しています。
だいぶ幅広いです。

  • データサイエンス力

  • データエンジニアリング力

  • ビジネス力

DS協会が定めるDSスキルは、下記リンクからダウンロードできます。

https://www.datascientist.or.jp/common/docs/skillcheck_ver4.00_simple.xlsx

それぞれのスキルカテゴリとして、以下のように分類されています。

データサイエンス力

基礎数学/データの理解・検証/意味合いの抽出、洞察/予測*/推定・検定/グルーピング/性質・関係性の把握/サンプリング/データ加工/データ可視化/時系列分析/学習/自然言語処理/画像・映像認識/音声認識/パターン発見/シミュレーション・データ同化/最適化

データエンジニア力

環境構築/データ収集/データ構造/データ蓄積/データ加工/データ共有/プログラミング/ITセキュリティ/AIシステム運用

ビジネス力

行動規範/契約・権利保護/論理的思考/着想・デザイン/課題の定義/アプローチ設計/データ理解/分析評価/事業への実装/PJマネジメント/組織マネジメント

スキルを見ると、AIモデル開発もデータサイエンティストの仕事に含まれそうですが、そっちはAIエンジニアの仕事になります。
データサイエンティストはAIモデルを使う側であって、作る側ではありません。
ただし、AIモデルの知識は必要です。

データサイエンティストとデータアナリストの違い

pasonaの定義を見てみると、どちらも似ています。
・データサイエンティスト:データ分析を行なう専門的な職種
・データアナリスト:データの分析や可視化を専門とする職種

ビジネスの意思決定に寄与するOUTPUTは以下のように記されています。
【データサイエンティスト】
大量のデータからパターンを見つけ、ビジネスの課題に対する解決策や洞察を導き出します。
【データアナリスト】
データから抽出した情報をもとに具体的な提案を行ない、ビジネスの意思決定に貢献します。
だいぶ似ており、具体的に何が違うのかがあいまいです。

AXISでは、以下のように違いが記されています。
「データアナリストは分析のビジネスへの応用、データサイエンティストは分析モデルの構築に、それぞれ軸足を置いているという違いがあります」
これが一番しっくりきそうです。
どちらも向かっている方向は同じですが、見ている視点が職種の違いになります。
・データサイエンティスト:エンジニアリング寄り
・データアナリスト:ビジネス寄り

データサイエンスの分野

様々な分野がありますが、三好さんの図がわかりやすいです。
 ※参照:AI・データサイエンスにおける技術群

この図では、大きく4分野に分かれています。
・基礎統計(集計・可視化)
・統計解析(記述統計・推計統計・時系列分析)
・機械学習(教師あり学習・教師なし学習・レコメンデーション)
・数理最適化
一般的にデータサイエンスというと基礎統計・統計解析・機械学習が頭に浮かびますが、数理最適化もデータサイエンスの中の重要な技術です。

この記事が気に入ったらサポートをしてみませんか?