データ分析担当者で時間のない人は、RとPythonのどっちを学習したらよいか

どちらも使えた方が便利であることは間違いないが、システム工学エンジニアでもプログラマーでもなく、仕事上Excel以外の分析手段が必要になった人は、他にもやることが沢山あるしコードを書いている時間など日常のごく一部の筈なので、やはり片方に絞りたいものだ。

データ分析だけしたいならRがいい

SPSSを買うお金がない、アップデートを待てない、そういう人にとってはRが便利だ。大学の心理学・生物学等、実験の結果を分析したい人もRを使用している人が多い印象がある。

Rは決まった分析を短いコードで実行できるし、結果のサマリーのアウトプットが備わったパッケージが多いし、グラフの描画も楽だ。

以前は、重たいデータになると限界があったりもしたが、裏で別の言語が動くことで軽快に前処理できるようになっているし、日々進化している。データ分析ユーザーが多く、パッケージを更新してくれる社会貢献意欲の高いユーザーが多い。

教養を広げたいならPythonがいい

一昔前なら、MATLAB、Cなどで紹介されていたような「~で学ぶ~」系の本が続々Pythonで紹介されるようになっている。ブロックチェーン技術の基礎をPythonで理解しようだったり、信号処理だったり、OpenCVの画像処理だったりと、Pythonはとっつきやすい言語のため便利なライブラリが提供されている。

他にも、APIの提供がPythonでサンプルコードとともに提供されていることも多く、何か触ってみるときにPythonが使えると便利なことこの上ない。

データ分析については一通り行えるが、唯一、グラフの描画については、ややRに利便性が劣る。

実装したいなら職種を変える

ただ、RもPythonもとっつきやすいツールや言語である一方、決して実装向けの言語ではない。自分のようにただデータを分析するだけなら全く問題ないものの、実際に何かシステムとして動くものを作らなければならないとなるとCやGoを使うーのだと理解している。自分は実装しないのでー。

SQLが理解できてPixelをWebサイトに埋めてSaaSのデータマネジメントプラットフォームを作れたら良い、というレベルならまだしも、コンピューティングの計算の速度やデータの量やリアルタイム性・バッチ処理などのシステム工学の設計が必要になってくると、データ分析担当が時間を割いて考えるのではなく、別の人をアサインするか、そういう仕事が好きなら職種を変えて専念するべきだろう。