見出し画像

「データ分析のセルフサービス化」に向けた取り組み 〜Looker Exploreを用いた事例〜

メルカリ Analytics Infra チームの take です。
この記事では、Looker Exploreを活用して分析環境を構築し、データの民主化に取り組んだ事例を紹介します。

SQLクエリが書けずデータ分析をアナリストに依頼するしかなかった人たちに対し、セルフサービスでデータ分析ができる環境を提供しました。
この取り組みにより下記3点が実現できました。

  • データが扱える人を増やすことができた

  • データ分析の効率を上げることができた

  • アナリストの負荷を軽減させることができた

この事例を通して、データの民主化に向けた課題と解決方法、そしてその具体的な取り組みについて知っていただき、参考にしていただければ幸いです。


メルカリのオープンなデータ分析環境

メルカリでは様々な職種でデータを活用する文化があります。
データに基づいたプロダクトの改善やマーケティング戦略立案など、各種経営判断がデータドリブンに行われています。

その意思決定を支えるデータ分析基盤として、BigQuery上に様々な分析データが整備されており、SQLクエリを使って自由にデータを分析できる環境が提供されています。
またダッシュボード文化も根付いており、社内にはLookerを使ったダッシュボードが数多く存在しています。


SQLクエリなしではデータ分析ができない

分析データがBigQuery上で整備されている一方で、データ分析手段が個々のスキルに依存してしまっているという問題があります。
具体的には、SQLクエリが書けなければデータ分析が行えず、結果としてデータ分析の依頼がアナリストに集中することになります。
これにより、アナリストの負担が増大し、本来アナリストがやるべき分析に時間を割けない状況になっています。

さらに、社内には多くのダッシュボードが存在しますが、チームごとに異なる定義で作成されており、集計定義が不明確なものが多く誰もが安心して使える環境とは言えません。
また、定義が明確なダッシュボードを使う場合でも、異常値を発見した時にその要因を深堀りするためには、結局SQLクエリによるデータ分析が必要となります。


Reliable,Efficient,Accessibleな分析環境を構築

これらの課題を解決するため、私たちは個々のスキルに依存せず、SQLクエリが書けなくても自由にデータ分析ができる環境の構築に取り組みました。
分析環境のコンセプトは「信頼できるデータ(Reliable)、効率的な分析(Efficient)、誰でもアクセス可能(Accessible)」と定めました。

  • Reliable(信頼できる)

    • オフィシャルな集計定義により正確な集計ができること

  • Efficient(効率的)

    • 素早く簡単にアドホックなデータ分析が行えること

  • Accessible(誰でもアクセス可能)

    • SQLの知識がなくても誰でもデータ集計ができること

このコンセプトを指針として、「分析において重要なデータを正確な定義で誰でも簡単に集計できる分析環境」を構築しました。これはLooker Exploreを使って構築され、全社で使えるオフィシャルな分析環境として公開しました。


なぜLooker Exploreを採用したのか

Looker ExploreとはBIツールLookerの機能の一部で、SQLを使わずGUIの操作だけでアドホックなデータ集計ができる機能です。
分析環境としてLooker Exploreを採用した大きな理由は、さまざまな分析ニーズに応えられるデータ集計の柔軟性を持っているツールであることです。
Google スプレッドシートやExcelのPivot Tableのように自由に分析軸と数値項目を選んでデータを集計することができます。

例えば、分析環境をダッシュボード形式で提供する場合、分析ニーズに応じて大量のグラフを作成する必要があり、またそのメンテナンスにも多大なコストが発生します。
しかし、Looker Exploreを用いることで、分析者自身に集計作業を任せることができ、よりスピーディーに多くの分析ニーズに対応できます。
そして私たち管理者もデータ整備や集計定義など環境整備に専念することができます。
すなわち、少ない管理コストで幅広い分析ニーズに対応できる分析環境を提供することができます。

また上記以外にLooker Exploreを採用した理由として下記のメリットが挙げられます。

  • データをツール内部に保持しないアーキテクチャで、BigQueryに接続することでパフォーマンスが良い

  • データモデリング言語LookMLを使うことで、データ定義の標準化と一元管理ができる

  • メルカリでは、すでにLookerのダッシュボードが広く使われていたため、利用者がLookerのUIに慣れている


シンプルかつ利便性の高いデータモデル

分析環境は当初、データ分析で頻繁に使用されるBigQuery上の4テーブルをベースとした、シンプルなモデルとしました。
4テーブルとは、メルカリのお客さまの出品や購入などの行動を分析するための重要なテーブル群です。
重要なテーブルのみに絞り、データモデルをシンプルにすることで、利用者はデータ構造を簡単に理解することができ、利用のハードルを下げることができます。
一見、対象データが多く多機能な分析環境は便利に見えるかもしれませんが、初めて利用する人にとっては複雑で理解しにくいものとなります。
そのため、新規に分析環境を構築する際には、過度にデータを詰め込まず、シンプルで理解しやすいモデルで提供することが重要です。

一方で、特定の複雑な集計がこの分析環境を使うことで簡単に行えたり、この分析環境でしかできない集計をできるようにすることも大切です。
例えば、マスターテーブルが複数階層に分かれておりSQLクエリで集計すると多くのテーブル結合が必要で複雑な処理になってしまう集計や、分析用に整備されておらず集計しづらいデータを使った集計などは、事前に分析データとして整備し分析環境に入れておきます。
このように特定のデータを簡単に集計できるようにしておくことで、利用者に対して分析環境を使うモチベーションを明確に示すことができます。


作っただけでは使われない

分析環境のリリース当初、私たちは利用者を増やすことを目指し、全社向けの説明会を開催し、様々な場所で宣伝活動をするなど、広範囲にアプローチする"Horizontal Approach"を展開しました。
このアプローチにより分析環境の重要性や便利さは広く伝わった一方で、ツール利用が定着せず、結果として利用者は増えませんでした。

定着しなかった要因の一つとして、利用者の認識の中で「新しい分析環境の使い方を覚えるためのコスト」が、「分析環境を使うことで得られる具体的なメリット」を上回っていたことがわかりました。
そこで、特定業務領域へ深くリーチする"Vertical Approach"へと展開方針を変更することでツール利用の定着化に成功しました。

  • Horizontal Approach : より広く全体向けに展開するアプローチ

    • 多くの人に認知を拡大し、広く利用を促進する施策を展開することで利用者を増やす

  • Vertical Approach : 特定業務領域に特化して展開するアプローチ

    • 特定の業務領域に絞り深く手厚いサポートをすることで定着率をあげる


定着率向上のためのVertical Approach

ここからは実際に定着率向上に有効だった具体的なVertical Approachによる施策を5つ紹介します。

1.ビジネスインパクトが出せる領域を選定する

業務領域によって意思決定に必要な分析方法が違うため、分析環境がフィットする分析を行う業務領域を選定します。
フィットする業務領域を対象とすることで、分析環境による効率化の効果が高くなり、ビジネスへのインパクトも大きくなることが期待できます。

選定プロセスとして、まずアクセスログを利用して利用状況を把握し、次に直接ヒアリングを通じて分析ニーズを明らかにします。
そして、「分析環境を使うことによる分析ニーズのカバー範囲」と「分析ニーズを満たすことによるビジネスインパクト」を考慮し対象領域を選定します。

具体的に分析環境がフィットした業務領域は、マーケティング領域や新規事業開発領域でした。企画の立案フェーズにおける基礎分析として、さまざまな視点から現状を把握し問題点を見つけ出すような分析で効果を発揮します。

  • フィットしやすい分析

    • 商品属性や顧客属性によるトレンド分析

    • KPIの構成要素を分解し影響要因を特定する要素分析

  • フィットしづらい分析

    • クラスタリング分析のような顧客セグメントを軸とした分析

    • プロダクトUI/UX改善におけるA/Bテストなど特定機能に対する詳細な分析


2.分析環境のデータを充実させる

サポートするビジネス領域で分析の幅を広げるために分析環境へ必要なデータを追加していきます。
分析環境のデータは、FACTテーブルの粒度そのままに分析軸となるdimensionデータを大福帳形式で追加していくことで、効率よく分析データを増やしていくことができます。

データを追加する際は、何のデータをどのように追加するかを検討することがとても重要になります。
利用者からデータ追加要望を受けた場合でも、利用者自身が意思決定に必要とするデータを具体的にイメージ出来ていないことが多く、データを追加しても意思決定に役立たないケースがよくあります。そこで、利用者が行う分析の目的を把握し、その目的のためにどのような分析が必要かを共に考え、その上で必要となる追加データを提案することが重要になります。

また、追加するデータはシンプルな定義であることが望ましいです。複雑な定義のデータは利用が限定的になりやすく、結果的に分析環境の活用を妨げる可能性があります。
そして、対応の優先度を決める際は、複数の幅広い分析ニーズに対応できるデータを優先することも重要です。それにより効率的に分析環境の価値を高めることができます。

これらを意識することで、特定領域における分析の幅を広げるだけでなく、全体最適化されたサステナブルな分析環境を目指すことができます。


3.実践的な活用方法をレクチャーする

利用者に対して分析環境の説明会を実施し、使い方をレクチャーします。
説明会は、分析環境に興味はあるけどまだ使えていない人達へのオンボーディングとして効果を発揮します。そこでは、分析ツールの操作方法やデータの内容を伝えるだけではなく、いくつかの分析手法や分析の思考法を合わせて伝えることが大切です。

可能であれば参加者から事前に具体的な分析ニーズをヒアリングし、そのニーズに合わせてハンズオン形式で説明するとより効果的です。
利用者が分析環境を活用するためのカギは、より具体的な利用イメージを持ってもらうことです。


4.自ら分析し共有する

利用者に分析環境の使い方を教えるだけでなく、私たち自身も実際に分析環境を使い分析を行い、分析結果を集計内容と共に利用者にシェアします。
分析結果をシェアすることで利用者に分析方法の具体的なイメージを持ってもらうことができます。
LookerExploreは分析の自由度が高い反面、具体的にどのような分析ができるのかイメージしづらくもあります。そのため、実際に私たちが行った分析の例を通じて、分析環境を使ってどんな分析ができるのか、またLookerExploreがどんな集計機能を持つのかを知ってもらうことが重要です。

分析結果共有サンプル


5.「office hour」で個別課題を解決

分析環境について誰でも気軽に質問ができるように、定期的にオープンなQ&Aセッションを設けています。
これは、テキストベースでは説明しづらい質問や、具体的でない相談をしたい利用者へのサポートとなります。
また、こうした時間を通じて利用者のニーズやペインポイントが把握でき、それを分析環境の改善に役立てることができます。


Vertical Approachにより利用者が積み上がった

リリース直後に大幅に減少した利用者数ですが、”Vertical Approach”の施策により、利用者が徐々に定着し利用者数が着実に積み上がっていきました。
その中で、特に注力したマーケティング領域の一部チームでは、チーム全体の分析ニーズのうち約6割を今回の分析環境でカバーすることができ、結果としてアナリストの負担を軽減し、企画立案のスピードを向上させることができました。
さらには、当初ターゲットとしていた”SQLが書けない人”だけでなく、”SQLが書ける人”やアナリスト自身もこの分析環境を活用するようになりました。これは、SQLを書くよりも早く分析が可能であり、かつ正確な基準で分析が可能なため、その利用が広がったと考えられます。


まとめ

今回、データの民主化を推進するために、新たな分析環境を構築し、様々なVertical Approachの施策を通して利用者を拡大させました。
この取り組みの中で特に大切にしてきたことは、アクセスログのモニタリングや利用者へのヒアリングを通じて、常に利用状況を把握し課題を明確にすることでした。「課題に対して素早く打ち手を考え実行する。そして利用者にとことん寄り添ったサポートをする」、それが分析環境の定着率向上に重要な役割を果たします。
一方で、分析環境を維持し続けるためには、個別最適ではなく全体最適なデータモデルを目指す必要があります。
そして今後も、誰もが正しいデータを効率的に分析ができるサステナブルな分析環境として、メルカリの意思決定を支えていきます。


▼採用情報サイトはこちらから


この記事が気に入ったらサポートをしてみませんか?