![見出し画像](https://assets.st-note.com/production/uploads/images/99196625/rectangle_large_type_2_56022fd2005f27ae3bf180e2868efb4d.png?width=1200)
「Tableau等のBIツールよりも使いやすいぜ!」を自負するオープンソースのRATHを使ってみる
はじめに
先日、突如 登場した PythonによるTableau風BIツール 」の PyGWalker に感動し、以下、記事にしました。
PyGWalker だけでも驚くほどすごい!のですが、これだけにとどまらず、オンライン上でも 多次元データの可視化や探索的データ分析(EDA)の自動実行ができる RATH というツールを、同じ作者が公開されていることを知りました。
これまでチマチマとグラフ化していたのは何だったんだ・・・と嘆くのはやめ、とにかくどんなものかみようという記事です。
![](https://assets.st-note.com/production/uploads/images/99205100/picture_pc_44d7dbebce5651fb22c59f19531218f1.gif)
RATHってどんなツール?
RATH は、かなりできることが多く、何であるかを表現するのは簡単ではありませんが、公式 では『探索的データ分析のための次世代拡張アナリティクスエンジン』とされています。
RATHは、次世代の自動化された探索的データ分析(Autoamted Exploratory Data Analysis)ツールです。RATHは、Augmented Analytic Engineにより、自動EDAを実行し、パターン、洞察、原因を発見し、それらの洞察を自動生成された強力な多次元データ可視化で提示します。
起動方法
まず、以下のURLにアクセスしてください。
画面中央に表示されたメニューに ✉アドレスを入力し、
[Send Cert Code] ボタンを押してください。
verification code の ✉が届いたら、verification code をコピーし、✉内ののリンク「Click here to complete registration」をクリックし、
コピーしたverification code をペーストし、[Login/Register] できれば、以下の [Get started] クリックで起動します。
![](https://assets.st-note.com/img/1677659474467-FkzOx2a3sF.jpg?width=1200)
使ってみました
起動すると、以下が表示されます。
![](https://assets.st-note.com/img/1677658974305-OaD7i0JbOI.jpg?width=1200)
[File] をクリックし、データ(csvファイル)を読み込んでみます。[↑] をクリックすると、ファイルを開くダイヤログ画面が表示されます。
![](https://assets.st-note.com/img/1677660012042-ReLTH5IYFd.jpg?width=1200)
titanic の csvファイルを読み込みました。
![](https://assets.st-note.com/img/1677660241306-DQ4NvWxOzh.jpg?width=1200)
[Load Data] ボタンをクリックすると・・・以下のデータテーブルが表示されました。いいですね。
![](https://assets.st-note.com/img/1677660401588-33Y0BJzhZd.jpg?width=1200)
画面上にある [Meta]タブ をクリックすると、各カラムの状況が縦方向に表示されました。
![](https://assets.st-note.com/img/1677713464906-mo1WmmzPH3.jpg?width=1200)
transforms ボタンをクリックすると、以下のポップアップが表示されました。ワンコードエンコーティングしてくれそうです。
![](https://assets.st-note.com/img/1677715544946-HeavBUe5sQ.jpg?width=1200)
ポップアップをクリックすると、ワンホットエンコーディングが実行され、結果が反映されました。
![](https://assets.st-note.com/img/1677716026673-LBccRjZT53.jpg?width=1200)
ワンホットエンコーディングの結果は、先のデータテーブル画面で見た方がわかりやすいですね。
![](https://assets.st-note.com/img/1677716182141-ZXaxoSOK01.png?width=1200)
[Clean Method] というドロップダウンメニューがあり、欠損値(null)のカット等が実行できます。none(use original data) を選ぶと、元データに戻せます。前処理やデータのエクスポートにも対応・・・すごいです。(欲をいえば、ラベルエンコーディングもできれば… ^^;)
![](https://assets.st-note.com/img/1677730626398-xy7WRZClX9.png?width=1200)
[Statistics]タブ をクリックすると、各カラムのグラフと統計情報が表示されます。
![](https://assets.st-note.com/img/1677713736010-TL5VvIBKxk.jpg?width=1200)
上記キャプチャの中央にある [Explore in Dataset] をクリックすると、自動生成された他のデータカラムとの相関グラフなどが表示されます。
![](https://assets.st-note.com/img/1677714037031-XYjWYiXNg6.jpg?width=1200)
画面左メニューの [Manual Exploration] を選択すると、以下の画面が表示されます。
![](https://assets.st-note.com/img/1677715392965-sLgR18AyTC.jpg?width=1200)
Field List のデータ項目をドラッグし、Columns や Rows、Color 等にドロップするだけで、以下のようにグラフが表示されます。(以下では、先にAggregation の ☑ を外しています)
![](https://assets.st-note.com/img/1677729900071-OoewCZ1toD.png?width=1200)
グラフの種類も変更できますし、以下のようにFacet的に描くこともできます。
![](https://assets.st-note.com/img/1677730317551-YiPcyrWjlI.png?width=1200)
[Manual Exploration] でできることは、Pythonライブラリ「PyGWalker」 でも同じことができます。興味ある方は以下の記事を確認してください。
最後に
盛りだくさんなので、説明しつくせませんが、RATH がどんなもので、何ができるかはイメージしていただけたのではないかと思います。
オープンソースで こんなのが出てくるとは・・・ ほんと、ありがたすぎます。
よろしければサポートお願いします!