【新技術】AI?ML?データ分析って何?-データはあるけど分析の進め方が分からないあなたへ-(2)
こんにちは。事業企画部のデータサイエンティストのミヤマルです!
新規事業の企画・システムアーキテクト・UI/UXデザイン・人工知能の社会実装など、色々やっておりますが、お客さまのデータをフル活用して課題を解決することを生業としています。
前回(1)では、AIや機械学習、データ分析といったデータ活用の進め方について寄稿いたしました。↓
今回(2)では、「仮説立案と分析環境の構築」をお伝えできればと思います。
前回お伝えしたデータ分析のフローを再掲いたします。
今回は、「不動産業界の賃貸仲介業」のデータ活用というテーマで、「都内に複数の店舗を持つ不動産仲介会社における本部のDX担当者」になったつもりで分析の流れをお伝えしてみようと思います!
全行程をお伝えしたいので本記事では②AI・RPA型で進めていきます!
1.データ分析フロー -ビジネス課題の抽出&仮説の策定-
まず、AI・RPA型のデータ分析を進めるうえで一番重要になってくるのは、「事業のゴールや関連する定量指標(KGI・KPI)」を明確にしたうえで「課題の解決方法の仮説」を策定することです。
例えば、不動産業界における賃貸仲介業務であれば、KGIとして定義されるのは「仲介手数料による売上高の増加」「賃貸の契約数の増加」「顧客対応にかかる時間の削減」などがあたり、
それに紐づくKPIとしては、「店舗来店数」「賃貸への問い合わせ数」「賃貸契約書類の作成時間」などがあります。
こうした定量的な指標およびその関係性を整理しておくことで、課題解決のための意思決定の材料として「使える」ものになります。
こうしたKGIやKPIがすでに定義されている場合は良いですが、こうした情報が整理されていない場合は、顧客へのリサーチや、社内外の有識者へのリサーチを通して明文化することが必要であり、業務の勘所をうまく言語化できるか、が非常に重要なポイントとなります。(最近ではこうしたユーザリサーチや関係者へのヒアリングを総称し、UXリサーチとも呼ばれたりします)
例えば、不動産仲介における売り上げ増加、をゴールとした場合、
仮説①:Googleマップの評価が上がると店舗の評価が上がり、店舗の来店数が増え、仲介手数料の増加につながる
仮説②:若者の多い支店については、ツイッターで若者を対象に販促広告を打つことで問い合わせ数が増え仲介手数料の増加につながる
といった形で仮説を作ることができるでしょう。
こうしたリサーチを通し仮説として言語化ができたら、それを数式の形で整理しておくと、後々のデータ分析やシステム化が円滑になります。
仮説で定義したKPIを目的変数、それに影響を与えそうなKPIや定量的な特徴を説明変数として定義します。こうした定義を整理することで機械学習やAIにとって理解しやすい形である統計モデルとして整理ができます。
また、上記で説明した説明変数をどのように取得するかまでブレイクダウンし定義することが非常に重要です。
今回の仮説②でいうと、広告の表示回数といったツイッターの分析機能で取得できる数値を説明変数として置いていますが、データの計測が可能かどうかを調査し統計モデルにしていくことが必要ということです。
こうした①定量指標の整理、②仮説の策定、③統計モデル化といった一連の「ビジネスの言葉をデータサイエンスの言葉に変換する」ことがいわゆるデータ活用の推進者であるデータサイエンティストの腕の見せ所となります。
2.データ分析フロー -分析環境の構築-
1章で述べたような、データ分析のゴールを数字で定義できたら次は、どういったデータがどこにあって、どういった環境で分析をすることが良いかを検討していくことになります。
そもそも、「店舗の来店数」や「問い合わせ数」といったKGIに相当するデータは、現状どこでどういった形で蓄積しているか、そもそもデータ分析に耐えうる形で貯められているか、といったところもこのフェーズで明確にしていきます。
よくあるパターンとしては、ここでいう「店舗の来店数」にあたるKPIなどが記載されたデータが店舗ごとに個別のフォーマットのエクセルで管理されており、その場所が点在してたりすること、やそもそも計測していないといったこともあります。こうした状況においては、データの継続的な入力を見据えたシステムの構築や、データの一元管理のためのシステム設計なども検討する必要があります。
また、このフェーズで必要な観点としては、データのセキュリティです。特に顧客データを取り扱う際などには個人情報が付与されたデータをクラウドで分析する際に、誤って第三者提供してしまったり、公開してしまうなどデータ漏洩につながることも起こりえないとは言い切れません。
多くのデータを保有している企業様であれば、自社のPC端末に分析ツールを入れての分析ではなく、クラウドでの分析が必須であるケースが多くありますが、こうした点にも注意が必要です。
さて、1章で整理した仮説についてですが、こちらを分析するための環境の一例としてクラウドで分析することを想定してその環境をシステム図にしてみました。
各種店舗のマネージャーに一日の終わりのタイミングで「店舗の来店数」と「問い合わせ数」をクラウド管理ツールを用いて計上している、という想定で作成しています。
近年では「API」と呼ばれるサービスから必要なデータだけを呼びだせる共通規格も普及が目覚ましく、グーグルやツイッターのサービスから自社で契約したクラウド環境にデータを挿入して分析するといったことも可能です。
また、AmazonのAWSやGoogleのGCPといったクラウドサービスではそういったAPIを呼び出し、自社で契約しているクラウドサービスや、自社で保有しているデータと統合して分析する環境、および分析に適するアプリケーションなどを提供しています。
データ分析環境を構築する際には、「分析に必要なデータの所在の整理」を実施したうえで「データのセキュリティ」に気を配り、仮説の検証に必要なデータを収集、分析しやすい仕組みを構築していくことが求められます。
次回は、上記の「データ分析環境を使ってどう検証していくか」について具体的に記載します!
3.おわりに
インテックではデータ活用のコンサルテーションから、システム化・その後の運用までをご支援することができます。
お客さまに合う分析ツールや、ソリューションを組み合わせてより良いシステムをご提案させていただきます。
お気軽に下記フォームよりご相談ください!
※ 記載されている会社名、製品名は、各社の登録商標または商標です。