見出し画像

セマンティックレイヤどう実現するか?Google Cloudの「Looker」の事例

お疲れ様です。スーパーに並ぶみかんを見て、そういえば今年の夏はスイカを食べ損ねたな…ということに気付きました。Shinです。

さて、先日はデータ活用基盤におけるセマンティックレイヤという概念について簡単に触れました。

サマリとして、セルフサービス型BIを含めてデータ活用基盤を全社公開した場合に、データを分析したいビジネスサイドはデータウェアハウスのデータを見ても何のことだか分からないし、人によってデータの作り方が変わってしまうのではないかという問題が発生し得ます。

この問題に対し、データの意味の定義を管理するセマンティックレイヤという層を設けることによって解決することができ、ビジネスサイドでのデータ活用を促進することができます。すなわち「データの民主化」が実現できます。

本日はそのセマンティックレイヤを実現するひとつの方法として、Google Cloudの「Looker」というサービスについて触れていきます。

Google Cloudのデータ活用基盤「Looker」

LookerはGoogle Cloudが提供するデータ活用基盤です。BI的な機能は持っていますが、Lookerの機能はBIに限定されないため、仮にデータ活用基盤と呼んでいます。なお、BI機能自体は「Looker Studio」と呼ばれるLookerとは別のサービスがあります。

LookerはBigQueryやRedshiftといったDWHに接続して利用します。接続後、LookerがSQLを自動生成して発行し、リアルタイムでのデータの取得が可能になります。なお、Looker自体にデータ蓄積の機能はありませんので、データマートとは異なる位置付けになります。

なお、TableauやLooker StudioといったBI製品は、DWHではなく、Lookerに接続して使用することを想定しています。(TableauにはLookerコネクタは無いと思うのですが、きっと何かしら繋ぐ方法があるのでしょう…。)

指標の定義を一元管理する「LookML」

Lookerの特徴的な機能のひとつに「LookML」と呼ばれる機能があります。

LookMLはLooker Model Languageの略(Machine Learningではありません)で、独自のデータモデリング言語によって、BIで可視化すべき指標(売上などの定量的なメジャーや、都道府県名などの定性的なディメンション)の定義を一元管理します。

したがって、複数のダッシュボードやレポートなどで共通して使われるデータについては、仮にその算出方法が変わったとしても、各ダッシュボードやレポートで修正するのではなく、LookMLでの定義のみを修正すればよくなります。

また、どのBI利用者であってもLookMLでの定義をもとにデータを分析するため、利用者によって同じ名称でもデータの定義が異なるような事態を防ぐことができます。つまり、誰が分析しても同じデータの定義に基づいた精度の高い分析結果が得られるようになります。

それゆえ、Lookerはセマンティックレイヤとしての役割を果たすことができます。TableauやLooker StudioといったBI製品は、BI側でデータの定義を持つのではなく、Looker側でデータの定義を持つことで、データ定義の属人化と分散の可能性を排除することができるようになります。

おまけ:Looker StudioとTableau

最後に、Lookerとは別サービスとして紛らわしいBI製品「Looker Studio」についても簡単に触れておきます。私がTableauユーザであるので、Tableauとの違いを意識しつつ書いていきます。

なお、Looker StudioとTableauの比較は以下にほぼまとまっています。この記事では私が気にする一部分だけをピックアップします。

Looker StudioはGoogle Cloudが提供するフルマネージド型BIであり、無償で利用可能です。Tableauのフルマネージド型としてTableau Cloudが提供されていますが、当然こちらは有償です。

グラフの作り方にも特徴があります。Looker Studioでは、いくつかのデザインやテンプレートの中から選択して、色や文字サイズなどを変更していくスタイルを取ります。一方でTableauは(テンプレート機能はありますが)読み込んだデータをキャンバス上にドラッグアンドドロップしながらグラフを作っていきます。少しコツはいるかもしれませんが、Tableauの方が可視化表現の自由度が高い印象です。

可視化表現の自由度が高いと何がポイントになるかというと、アドホック分析がしやすくなります。アドホック分析とは、分析した結果についてより深堀を行うための分析を意味します。例えば利益を押し下げる原因を探るとして、地域別に傾向を見たり、製品カテゴリ別に傾向を見たり、その他複合的な条件下での傾向を見たり、分析を多角的かつ自由に行うことができます。

そのため、とりあえずデータが見えればいい、というレベルの利用者であればLooker Studioの方が操作性が良く簡単に可視化が行えますし、データをもとに原因を探って戦略を立てたい、といいうレベルの利用者であればTableauで多角的に深掘りをしていくのが良いと言えるでしょう。

どれか一つに製品を絞るのではなく、ユーザのニーズに応じて適切に使い分ける仕組みが求められます。

いいなと思ったら応援しよう!