「データエンジニア」と「機械学習エンジニア」と「データサイエンティスト」について
「データエンジニア」とは
下記の単語集をまとめてて、そもそも「データエンジニア」って、今はどういうポジションかな?と、思ったので考えてみました。
上記、記事の用語やそのツールの使い方は「データエンジニア」を目指すなら、がっつり分かっておかないといけないところかなと思います。ただ「データエンジニア」の言葉の定義も、まだ日本の業界内ではブレがある気がしています。
例えば、次の感じとか。
「データ基盤を構築、管理するエンジニア」
「データサイエンティストに渡すデータの前処理(収集、加工、集計)をするエンジニア」
「データ基盤の構築と管理とデータ前処理と機械学習モデル開発まで含んで、データ全般に関わるエンジニア」
個人的には「インフラとデータ前処理あたり」かな、と思います。異論や、ご意見、ご指摘があれば、頂けると参考になりますので、大変助かります。
「データエンジニア」と「機械学習エンジニア」
あと、この「データエンジニア」と「機械学習エンジニア」を同一職種として扱っている企業も、完全に別職種としている企業もあると思います。
「機械学習エンジニア」を目指すなら、資料にあるような環境から自分でデータを取ってくるか、この環境を作っているデータエンジニアからほしいデータをもらってモデルを作る感じだと思います(自分で取らないとけないのか、ほしいデータはデータエンジニアがクレンジングまでして渡してくれるのかは、その企業の環境しだいかと)。なので、最低限は技術名称と機能は覚えていく必要があるのではないかと思います。
「機械学習エンジニア」と「データサイエンティスト」
ただ、機械学習ができるスキルに特化しているということは、今度は「データサイエンティスト」のスキルと重なってくる気もします。w
「機械学習エンジニア」は学習モデルの開発で、「データサイエンティスト」は「ビジネスやマーケティング系も踏まえて機械学習エンジニアリングまで行う」か「機械学習エンジニアが開発するための要件定義や効果検証などを行う」かなどのボーダーも、またあいまいなのかなぁ〜と。
私の理解がまだまだ低いという点もあるかもですが、こんな感じで一般企業では、まだまだボーダーがあいまいな感じがしています。日本のデータサイエンス、データ分析の業界では。(2019年11月現在)
データ分析領域の「いい意味でのカオス感」
この業界的にスタンダードが決まってない状態には「いい意味でのカオス感」を感じてます。この「いい意味でのカオス感」とは、インターネットが始まった時、SNSやブログが始まった時、検索業界に後から参加したGoogleが検索連動やコンテンツ連動広告で収益を上げ台頭し始めた時(つまり検索エンジンの淘汰時期)、Googleアナリティクス(アクセス解析)が流行りだした時、スマホが普及し始めた時、UXが流行りだした時などと同じ感じです。
つまり、今の時期は自分でやりたいスキルを身につけて、やったもん勝ちかなーと。今のうちに、いろいろ勉強して実践を身につけておくと日本の業界でも、まだまだトップクラスに入り込めるチャンスあるのでは!?と、勝手に思ってます。
参考URL
「データエンジニア」について、分かりやすい記事です。
急成長する《現場》の、データエンジニアというお仕事。
https://qiita.com/Nimimal/items/42c03c61e4003c3b3ee5
データエンジニアとは?仕事内容から年収、必要スキル、資格まで徹底解説
https://www.bigdata-navi.com/aidrops/1171/
データ サイエンティストとデータ エンジニア:ロック スターと裏方の関係
https://learningnetwork.cisco.com/docs/DOC-31728
※この投稿は、Facabookに上げた記事にフードバック頂いた内容を入れて修正しています。
最後まで読んで頂き、ありがとうございます。