Tableau x Pythonでできそうなことまとめ
データ分析のBIツールTableauをおととし辺りに使ってみたのですが、かなり使い勝手がよかったので、もう少しやってみたいことをまとめてみたいです。
〇Twitter APIからデータ取得し、可視化
ツイッターのAPIからデータを取得し、データを可視化できるのだとか。複雑なスクリプトを書かずともできそうなので、これは試してみたい。
〇Web Data ConnectorでAPIっぽくデータを取ってくる
Web Data Connector (WDC)を利用すると、自作でデータ取得ができるページができるらしいですね。GASでHTML作って、実装みたいなこともできるのかな?
〇データの前処理
TableauはBIツールなので、データの前処理はちょっと微妙っぽいです。
前処理に関しては、以下のことができそうです。
・欠損値削除
・文字列削除
・スペース削除
・各テーブルをJOINさせる
特徴量を新しく作成することができなさそうです。この辺に関してはPythonでさくっと前処理したほうがよさそうです。
〇 Python連携
データの取得から、機械学習した結果をグラフ表示みたいなことも、Tabpyを使うとできます。基本的にデータ取得から前処理までを実行しちゃって、処理結果はインタラクティブにTableauで統合しちゃう感じがよさそうです。特定の処理をまとめておいて、例えばアカウント名変えるだけであるユーザーの人気のツイートとかを可視化したりできるみたいです。ただし有償版Tableau Desktopを利用しないと厳しいそうで。。。
〇ダッシュボート公開
取得したデータのビジュアライゼーションをしたものをダッシュボードに公開できる。これはTwitterのデータを可視化しているダッシュボードです。あるアカウントについてもっともつぶやいたアカウントトップ10とか、最もバズったツイートトップ10とか。
〇所感
Tableau上でPythonを動かして、Matplotlibでやるような探索的な分析とか、レポーティングに必要な可視化に関してはTableauでサクッとやってしまうのがよさそうですね。ただ、実行処理とかがちゃんと結果が見えるのかがよくわからないので、Tabpyを試してみようと思います。
おそらく、データが整っていて、複数のデータソースがあるみたいなときに探索的にデータを見るような場合は重宝しそうですね。Analyticsのデータ連携とかが非常によさそうです。(Pythonは使わなさそうですが。)
サポートでいただいたお金はFanzaの動画を購入するために利用されます。