見出し画像

無償のノーコード分析ツールを使って、業務で活きるセルフサービス分析を実践する方法(非エンジニア向け)

最後にnoteの記事を書いてからだいぶ経ちました。Sisenseの営業とパートナー担当をしてましたが、最近あったテック系大規模レイオフのひと足先にAPACの営業組織が解散、完全にパートナー制度に移行し、今は分析に関するフリーランスやってます。営業的なこと、プリセールス的なこと、コンサルティング的なこと、分析に関わる色んなことをやっています。今まではベンダー側にいたので特定のツール推しにならざるを得なかったんですが、中立的な立場になってからはいろんなBIツールやETLツールを深く学ぶことができました。学んでいくにつれ、自分が思っている理想の分析方法論が無償のノーコードツールをベースに固まってきたので共有したいと思います。タイトルの通り、重要なポイントは有償のツールを使わず、コードを書かないで、セルフサービス分析を業務で役に立つレベルで実践するということです。

データの民主化

セルフサービス分析という文脈で、多くの方々は「データの民主化」というフレーズを聞いたことがあるかもしれません。このフレーズの意味を、電通さん誰もがデータを主体的かつ自律的に使える状態を実現すること」とスッキリと説明してくれています。「データの民主化」の方向性に、個人的に賛成している要素として「すべての人がデータを扱うことができる存在である」という人の可能性を肯定する前提があることです。ただ、色んなソフトウェアを学んできてわかってきたことは、「データの民主化」を支えている土台となりうるのが「テクノロジーの民主化」だということです。

テクノロジーの民主化

テクノロジーの民主化を考えるときに、ノーコードアプリ開発プラットフォームのBubble 創業者/共同CEOのエマニュエル・ストラスノフの以下の言葉を思い出します。

なぜ、現代にいたっても、我々はコンピューターの言葉を話さないといけないのか? コンピューターにこそ、我々の言葉を話させるべきではないか?」

The No-Code Manifesto

テクノロジーの民主化の代表的な要素がノーコードだと考えています。ノーコード、GUI、色々と言い方はありますが、コーディングせずに人間のクリエイティビティを使って直感的にテクノロジーを活用することがノーコードの本質でしょう。AppleがGUIベースのMacintoshをリリースした時に揶揄されましたが、 他のパーソナルコンピューターが持っていなかったビジュアルオリエンティッドなUIはテクノロジーの民主化にとって大きなステップだったんじゃあないかな、と思います。

1985年にリリースされた最初のMacintosh

テクノロジーの民主化に大きく寄与するもう一つの要素は、入手しやすい価格であることです。80年代に出てきた初期の携帯電話も、数十万円の保証金+月々何万円もの基本料金、通話料1分100円だったとのことです。全ての人が簡単に手に入れられた代物ではなかったと思います。

KDDI「1988〜1985年、 “予感”の時代」

テクノロジーが一般的に使われるようになるには、価格が下がり、使い始めやすくなることも大きな影響を与えます。今では携帯電話は月々数千円ほどの料金で、機種もこだわらなければ実質無料のものも多いです。テクノロジーが進化し続けて技術革新が起こることで、開発/生産コストが下がり、市場の淘汰が進んで価格が低くなっていくでしょう。個人で管理できるほどの価格の低下が起こると、テクノロジーが個人レベルまで浸透しやすくなります。総務省の調べによると、モバイル端末の普及率は96.1%まで上がっているそうです。ビジネスで言うとExcelも同じくらいの普及率だそうですね。価格が高いままのサービスや製品は、なかなか一般的に広がらず民主化はしないのではと思います。

セルフサービス分析

第1世代BI(Cognos、Business Objectsなど)はデータモデルとしてのキューブとダッシュボードを情報システム部門が専門的なスキルを基に開発して経営層に提供し意思決定を支援するという構図でした。第2世代BIはインメモリ集計処理という技術革新により、デスクトップのメモリのリソースを活用し比較的大規模がデータをデスクトップPCのメモリに展開し集計実行できるセルフサービスBIが世の中に出てきました。(Qlik、Tableau、PowerBIなど)第3世代ではその集計処理も並行分散処理が可能になったクラウドDWHが普及し始めたことによって、主にSQLを活用したコードファーストのアプローチをとるDWH依存型ノートブック系のBIツール(Looker、Mode、Metabaseなど)が増えてきました。第2世代も第3世代も使い方が異なるため、現在の市場では両方のスタイルのBIが共存する形になっています。(集計処理的な部分だけに触れましたが、BIには本当はいろんな要素があるのでそこはツッコまないでください。笑)

ここで注目したいポイントはセルフサービスBIです。基本的にはノーコードで、専門知識や専門的なスキルを必要としない、かつデスクトップにインストールし活用できるセルフサービスBIツールが世の中に出てくることで、マーケティングや営業などビジネス部門の担当者が、自分の力で、自分の業務に必要なデータからの気付きを得られるようになりました。このセルフサービス分析のスタイルがデータの民主化を支えています。企業や組織としては、最近のデータの民主化に関するPwCとTableauの協業のプレスリリースはその概要が分かりやすく説明されています。

公認会計士ナビ「PwCコンサルティング、Tableauと協業開始」

PwCとTableauとの協業の記事なのでセルフBIはTableauでしょう。ビジュアルなUIがクエリ言語になっている有償のセルフサービス分析ツールとしてTableauに勝るツールはないのでは、と思います。ETL的な処理の要件も、Tableau Prepが適していればTableauを導入するだけで、セルフBIとセルフETLがカバーできちゃうかもしれないですね。ただ、組織として運用する際には上の図の様にデータのサイズやチームのサイズの増大に応じてセキュリティ、ガバナンス、集計処理や描画のパフォーマンス、自動化などをカバーしないといけなくなって、セルフBIやセルフETLがすべてを解決するわけではなくなります。また、企業や組織のデータ民主化へのアプローチは、上のようなプロフェッショナルがすでにいますし、私はそれをこの記事で触れようとしているわけではありません。前述のテクノロジーの民主化の要素としての「ノーコード」「価格を抑える」ことで「個人」でも始められることを前提に徹底的に調べました。そして、この要件に合致したすべての人のためのセルフBIとセルフETLの組み合わせを見つけました。私が至った結論は、セルフBIにLooker Studio、セルフETLにKNIME(ナイム)を使うという結論です。

セルフBI

Looker Studio は元々Data Portal、Data Studioと呼ばれていましたが、今はLooker ブランドに統合されたようです。拡張機能やBigQueryを使わなければ、2022年11月現在では個人のGoogleアカウントでも無償で使えます。ダッシュボードを作成するUIに関しては、Power BIと酷似しているのでPower BIも試したんですが、Power BIはDAX関数が必要になること、DAX関数を書かなくてもデータ型(文字列、数値、日付など)を変更/管理と計算フィールドを作ろうとするとどうしてもWindowsのデスクトップ環境が必要になります。また、ダッシュボードなどを組織やチーム内の他の人と共有しようとすると有償版が必要になってしまいます。非エンジニアかつ個人でMacの環境しかない人でも使えると考えるとLooker StudioはブラウザのみでOSに縛られないのと、無償で分析結果をチームと共有ができるのもポイントです。他にもいろんなOSSのBIツールを試してみましたが、モダンなUIかつ理解しやすい、使い始めやすい、様々な要素を含めて考えるとLooker Studioは優秀です。ただ、ここで問題になってくるポイントはQlikのロードスクリプト、P/E関数やSET、Tableauで言うLODなど、集計の集計を行ったりロジックのレイヤーをBI側だけで増やそうとかなり厳しくなってきます。これが、ノーコードのセルフETLが必要になってくる理由、また活きてくる理由です。

Looker Studioでは作成された計算フィールドを使って新たな計算フィールドを作ることを「Re-aggregation」と呼び、いわゆる集計の集計ができなくなっている

セルフETL

私はセルフETLとしてKNIME(ナイム)をおすすめします。KNIMEはWindows、Mac、Linuxのデスクトップなどのローカル環境にインストールして使えます。使い始める際の環境を選ばないのはありがたいです。そして、何よりオープンソースツールなので、手持ちのPC環境で無償で使えます。基本的な文字列の操作や、計算集計処理、ループ処理など、ETLで必要な機能は一通りできます。もちろんAlteryxのような有償のツールでは、UIが日本語対応していたり、ツール内でより便利で強力な機能が用意されていたり、優れた処理が実行できることも分かっています。予算が確保できる場合は個人的に慣れている&愛着のあるAlteryxはオススメですが、費用対効果を考えるとKNIMEは分析をし始める頃から割と深めの分析まで、十分な機能があると使ってみて思いました。例えば、以下のような事前集計処理を、コーディングせずにワークフローを作成して実行できます。

KNIMEでRFM分析のデータ前処理を実行するためのワークフロー

GUIでフローチャートを作り、詳細設定でクリックや情報入力するだけのような使い方なので、データ変換や集計ロジックを組み立てやすいのと、後々どうデータが処理されているかのドキュメンテーションにもなるため可読性が高いです。こういったワークフローで集計したデータをBI用に準備してあげれば、集計の集計をしようとすると速攻で「できないっす、サーセン」と言ってくるLooker Studioでも活用範囲が広がります。例えば、Looker Studioで以下のようにRFM分析で売上の高い顧客セグメントをフィルタリングし、その顧客リストを抽出することもできるようになります。CSVやGoogle Sheetsで出力できるので、別システムで活用するターゲティングリストとして使えます。

Looker Studioのフィルターとデータ抽出のUIの例

残る課題

大袈裟な表現かもしれませんが「データの民主化」は、人類にとって大事な前進だと思っています。個人レベルでの分析に関しては、データの民主化に必要な無償ツールはすでに存在していますし、BIやETLの市場がテクノロジー的にデータの民主化のために追い付いたと感じています。ただし、追い付いたテクノロジーをエンジニアではない普段Excelを使うような私たちが「分析は一部の人がするもの」とか「分析は特別な人がするもの」と思わずに、こういったツールを実際に使いこなして分析できるかが残る課題です。ツール自体は無償なので、是非ともいろんな人に使ってもらってデータを活用しまくって欲しいです。それがこの記事を書いた意図です。

まとめ

分析ツールや使い方などの情報はすでに(英語が多いですが)インターネットで見つけられるからと言って「ツール無償だよ!誰でも分析できる!やってみて!」と理想を語っても、自分の力で分析をできるようになるには時間がかかると思います。そういう意味で、非エンジニアとして無償で使えるノーコード分析ツールのLooker StudioとKNIMEに関して情報を発信していこうと思います。


Header Illustration Credit: Image by upklyak on Freepik


この記事が気に入ったらサポートをしてみませんか?