データサイエンティストに求められるスキル
1.データサイエンティストとは
以前の記事 「ビックデータ」を事業に使うポイントは? で以下を
説明しました。
https://note.com/myok_project/n/ncf4924d66fdb
ビックデータを使ったデータ解析に必要とする技術(知識)は
以下の3項目になる。
① 大量のデータを計算するシステムに対するITスキル
② データを集計、解析するための数学の分析スキル
③ 業務の知識(何を分析して、何を生み出すのか?を考える)
今回は、②を中心に説明しています。
2.データサイエンティストに求められるスキル
今回の記事の参照資料は下記です。興味のある方は御一読ください。
書籍に関する詳細情報は「A.補足資料」
「ゼロからはじめるデータサイエンス Pythonで学ぶ基本と実践」
オライリー・ジャパン ( オーム社 )
まずは、目次を見てください。
① 確率統計
統計(5章)確率(6章)
② 推論、回帰分析、AI
K近傍法(12章)ナイーブベイズ(13章)
単純な線形回帰(14章)重回帰分析(15章)
ロジスティック回帰(16章)決定木(17章)
ニュートラルネットワーク(18章)
クラスタリング(19章)
そうなんです、データの可視化(3章)線形代数(4章)も含め
数学の分野の知識なんです。
コンピュータ系の技術者が馴染みなのは次の章くらいです。
Python速習コース(2章)データベースとSQL(23章)
これはどう考えればいいのでしょうか?
3.データサイエンティストの裏読み
社内で業務システムを構築に活動してきたエンジニアに、
ビックデータの分析業務を急に担当させても荷が重いということです。
逆に見れば、データサイエンティストは準備されたデータを集計分析は
特異でも業務システム等を触らせるには不安があります。
サポートよろしくお願いします。ご感想、ご希望などいただければ嬉しいです