見出し画像

[保存版] AI/IoT導入やDXなどの「ビジネスのデータ活用に必要なデータ戦略の7要素」

弊社では様々なデジタルトランスフォーメーション(DX)やAI/IoT導入のプロジェクトの相談やサポートを日々行なっていますが、外部のReady madeなAIサービスが増えてきたり、自社にしかないデータを蓄積させてそれを強みとして活用する企業も増えてきたという実感を持っています。

一方で、「その分析結果がどんな売上UP/コスト削減につながるのか」をきちんと定義できないままにプロジェクトが進んでしまい、途中で頓挫しているような話もよく聞くという印象です。

そんなトレンドを受けて、以前こちらの記事で「データ戦略の4要素」を書きましたが、それを今回Updateすることにしました。

はじめに:データ戦略とは

弊社は「データ戦略」の会社であり、社名にDataStrategyと名付けています。私も、自分の肩書に、それなりに意味を持って「データストラテジスト」と付けています。

実は英語圏でも、「データ戦略(Data Strategy)」という言葉は、一部のプレーヤーがそれぞれの定義で使うことはあれど、確立された定義が存在する訳ではありません。しかし、世の中には様々な機能戦略として、「マーケティング戦略」「営業戦略」「知財戦略」があります。それと同様にデータというものが経営上重要になってきたとき、また私自身が起業前に流しのデータサイエンティストとして活動をする中で、データについても戦略的なアプローチが求められるのではという直感があり、法人を設立する際にはその直感をそのまま社名にしました。

以下、私の考える「データ戦略」を定義してみます。

まず、ここでいう戦略については「目的を達成するための、資源(リソース)利用の指針」という定義を採用します*。マーケティング戦略で言えば、例えば「ある人数の新規顧客の獲得顧客」を目的としたとき「顧客ターゲット選定・ブランドとして一貫して発信するメッセージの選定・クリエイティブ/メディア選定」などを戦略として定義されることが多いでしょう。
*厳密に言うと、どの必要なリソースを獲得するかといったことも含まれます。

データ戦略の7要素

データ戦略における「目的=ビジネス上の成果」は、マーケティング戦略等の特定の機能戦略と比べても、多伎に渡ります(例:業務時間が下がってコストが下がる、マーケティングのROIが改善する、UXが向上して転換率が改善する、等)。それらの目的を、限られた時間含む資源の中で達成していくためには、適切な戦略策定を行い実行することが必要だと考えるようになりました。

さて、データ活用のための「データ戦略」と言ったときには、以下の7つの要素を定義していくことで、戦略がはっきりします。どんなに複雑なデータ活用事例でも、この7つ視点からデータ戦略を捉えていくことで、他者の事例を分析するときになにが「肝」だったのか、あるいは自社のデータ戦略を考える際に「何を決めていけばよいのか」がはっきりして来ます。

<データ戦略の7要素>

スクリーンショット 2020-04-30 22.13.16

1. Input Data - モデルに投入するデータ項目
2. Stored Data - 過去のデータとして蓄積すべきデータ項目
3. Algorithm - 解析アルゴリズム(AIモデル)
4. Output Data - 分析結果としてフィードバックすべきデータ項目
5. User Interface - 分析結果を表示するインターフェース
6. User - 分析結果を利用するユーザー
7. Benefit - ユーザーが分析結果を利用することによって得る便益

*ちなみに、この4要素は私が経験上導き出したものです。類似する概念の提唱は少しずつ色々なところで行われるようになってきましたが、私はこの4要素が現時点では最も使いやすいと思います

これは、機械学習や深層学習を使うようなデータ分析でも、あるいは単純なクロス集計で済むようなデータ分析でも、IoTのように沢山のデバイスからデータを収集する場合でも、基本的に同じ考え方でアプローチできます。「データ活用」となると、データをどのようなアルゴリズム(例: AI技術など)で分析しようか?という視点に思考がいきがちですが、私は最も重要かつ最初に考えるべきなのはOutputだと考えています。

Output Data, つまり解析結果が「誰に、どんな提供価値を提供できるか」をしっかり考えることが重要です。ですが、このポイントをしっかり考えられていないケースが散見されるので、要素の中に組み入れることにしました。

ケーススタディ

前回同様に、ケーススタディで考えたいと思います。

導入検討企業: タクシー・バスを運行する交通会社
KPI: 自社ドライバーが起こす事故を減らしたい
KPI達成のためのAI利用シーン: 自社のドライバーの走行ログを活用して「普段とは異なる運転をした(異常な運転をした)ドライバーを検知することで、事故を未然に防ぐための予防策を行いたい」

では、この目的を達成するためのリソース利用の指針として、上のデータ戦略の7要素を順に考えていきましょう。

1) 何を誰にフィードバックすべきかを決める

まず、「4 Output data」 関連として、以下の項目を考えます(ここも結果から組み立てていきましょう)。

スクリーンショット 2020-04-30 22.11.54

4. Output Data - 分析結果としてフィードバックすべきデータ項目
5. User Interface - 分析結果を表示するインターフェース
6. User - 分析結果を利用するユーザー
7. Benefit - ユーザーが分析結果を利用することによって得る便益

Outputとしては「異常な運転をしているかどうかのスコア」を出したい、と決めます。

4. Output Data - 分析結果としてフィードバックすべきデータ項目
データ項目: 全従業員別の昨日までの運転と比較をした場合の異常値スコア
頻度: 日報とセットで毎日確認しているので、日次で出力できれば良い

次に、このOutput Dataは、誰にとってどのようなベネフィットがあるのかを整理します。

6. User - 分析結果を利用するユーザー
各営業所の指導員(平均年齢50代で、男性が多い)
7. Benefit - ユーザーが分析結果を利用することによって得る便益
現状で指導員が日次で日報をチェックしているので、その時にスコアが出力されていれば声かけや面談の優先度が決まる。見逃しは大事故に繋がる可能性があり、全員分の日報を細かくチェックできないので、指導員の業務負荷の軽減になる

この場合は、声かけの優先順位が決められるので、より大事故を防げる可能性がある、というベネフィットです。

また、Userを想定したInterfaceの設計も重要です。例えば指導員が一日1回見るだけであれば、Excelの表の打ち出しを毎朝送る、という形式も想定できますが、場合によってはアプリや既存の業務システムに表示をさせた方が使いやすいかもしれません。ただし年代を考えると、もしかしたらアプリよりも紙で配布した方が浸透率が高まる可能性もあります。というように、想定ユーザーにとってどんなInterfaceが使いやすいかを意識する必要があります。

通常は「小さく始める」ことが原則なので、表のレポートでも良い場合はそれでスタートすることが望ましいですし、その中でBenefitを確認できれば、既存システムに載せるなどして徐々に拡大していきます。

今回のケースでは以下のようにして取り組みを始めることにしました。

5. User Interface - 分析結果を表示するインターフェース
・概要: メールによるExcelファイル添付での通知
・既存システムとの連携方法(アーキテクチャ): Inputデータについては既存システムとAPI連携。計算用サーバでスコアを計算し、メールで担当者に送付

2) フィードバックに必要なデータとアルゴリズムを決める

続いて、残りの3つの要素を組み立てていきます。

スクリーンショット 2020-04-30 22.12.27

1. Input Data - モデルに投入するデータ項目
2. Stored Data - 過去のデータとして蓄積すべきデータ項目
3. Algorithm - 解析アルゴリズム(AIモデル)

まず Input Data として「何があれば普段とは異なる運転を検知できそうか」を考えます。いわゆる特徴量として何が想定されるか、です。この場合は、例えば以下のように考えられます。

1. Input Data - モデルに投入するデータ項目
・入力データ項目: 昨日までの走行ログ(実際は、例えば速度を見るとしても単純に平均速度を見れば良いのか、速度の変化を見れば良いのか、などの細かいテクニックを踏まえて入力項目を決める必要があります)
・収集方法: 既存の運行管理システムからAPI連携(要開発)
・必要な前処理・データ加工: 生ログからxxxという処理を加えて特徴量を追加する。運転者により運行時間は異なるので、xxx時間分をx分ごとにずらしながら利用する。

次に、Inputデータをどうアルゴリズムで処理するかを考えます。

3. Algorithm - 解析アルゴリズム(AIモデル)
・手法: 異常検知手法のうち、Autoencoderの手法を検討する。異常が無いと確認されたxxx時間分のデータでモデルを構築し、再現率から異常を検出する手法を検討する。
・アルゴリズム構築方法: 外部リソースでそのまま利用可能なものはないため、自前で構築。過去xx年分のデータから検討
・計算リソース・計算環境 : 全てクラウドを想定し、分析環境 xxx, 運用時環境 xxxとする

というように決めることができます。

実際の運用では、このAlgorithmをアップデートする必要があります。そのためには過去データの蓄積が重要になります。過去XX年分のデータはモデルの初期開発時に役に立ちますが、それだけでなく、日々蓄積されるデータの定期的な分析を行い、アルゴリズムをUpdateする必要があります。

そのためには、蓄積すべきデータとして「ヒヤリハット事例」「自社の事故事例」を収集し、どのような予兆で事故を検知できるかを詳細に分析、モデル予測に組み込む必要もあります。そうすると、蓄積すべき Stored data を事前に定義することができます。

2. Stored Data - 過去のデータとして蓄積すべきデータ項目
・日次の走行ログ
・ヒヤリハットデータ(事象の有無フラグ+テキスト情報)
・発生事故データ(事象の有無フラグ+テキスト情報)

参考) 外部AIサービスを活用する場合

昨今の Ready made なAIサービスの充実に伴い、AIモデルは外部サービスを使うケースも増えてきました。自前でAIモデルを構築するよりも安価・スピーディに始められるため、欲しいOutput dataが外部の組み合わせでも得られる場合は、まずは外部サービス利用から始めるのがオススメです。

ただし、運用に耐えるのは、翻訳や文字認識などまだまだシンプルなアルゴリズムに限定されることが多いです。また、その場合は 2 Stored data と 3 Algorithm を外部ベンダーのサービスに依存するため、自社データによる競争優位性を作るのは難しくなります。


成功するデータ戦略策定のポイント

実際に決めようとなると考えるべきポイントは沢山あります。実際に考える上で難しいポイントは2つあります。

①技術的な観点からの判断 - 妥当性の見極め

1つ目は、データ分析の技術的な観点からの判断です。例えば、以下のようなケースがあります。

・ビジネス上望ましいOutputは決められても、それが技術的に実現可能な内容ではなかったので、その後の分析プロセスの難易度が極めて高くなり途中で頓挫してしまった。

・AIモデルの検討を分析会社に委託したが「精度が出ないので無理です」との報告をされた。社内でも分析会社での検討プロセスや報告内容の適切さを判断できないまま、プロジェクトが終了してしまった。

こうしたデータ分析の技術的な観点からの判断が難しい理由の一つには、「データ分析」と一口にいっても適用手法は幅広いことがあります。例えばデータ分析と言っても以下のような切り口があります。

・対象とするデータ
  ・ビッグデータ(構造化データ)
  ・自然言語
  ・画像
  ・動画
  ・センサーデータ
  ・ネットワーク(人間関係・ソーシャルグラフ)など etc
・適用する処理手法
  ・モデル構築
  ・シミュレーション
  ・機械学習・強化学習・深層学習・オートメーション
  ・上記の内容を踏まえたシステム開発 etc

いまチャレンジしようとしている内容が、技術的にみて妥当かどうか等の視点は、なるべく個々のケースに即したナレッジや技術を持っている人がジャッジをした方が、当然良い結果に繋がりやすくなります。また、実際は適切な人にアクセスできていない場合も実際には多くあります(世の中全体としてデータ分析が可能なエンジニアがまだ少ない上に、技術を持った人は技術やデータを持った会社に集中しがち、ということも背景の一つにあります)。

いずれにせよ、最初の技術プランニングが適切でないと、コスト(費用や期間)の管理や期待値コントロールといった観点からその後のプロジェクトマネジメントが難しくなっていきます。最初のプラニングが技術的に見て妥当なものであれば、その後の成功確率は大きく変わるというのが実態ではないかと思います。

②ビジネス的な観点からの判断 - ROIの判断

2つ目は、ビジネス的な観点からの判断です。例えば以下のようなケースがあります。

・分析結果は良好だったので、費用をかけUser Interfaceを開発・導入したが、想定しているユーザーが全然使ってくれなかった。実は想定ユーザーに「こういうシステムがあったら使うかどうか」という事前調査を行なっていおらず、ユーザーが本当に欲しい情報からズレた情報を提供していた。

・AIによる業務効率化ツールを構築したが、試算の結果、業務工数は減ったものの経営視点から見たインパクトは小さく、「効果はあったけどそこじゃなかった」という評価で終わってしまった。

ビジネス的に意味があるフィードバック内容を見つける、つまり高いROIが得られるデータ活用戦略を立案する必要があります。データ活用のROIの考え方には、大きく分けて3つあります。

②-1 ROI => 削減できるコスト>必要な投資

これは比較的イメージしやすいと思います。生活に密着したケースで考えると、例えば「宅配便の配送順の最適化」があります。電気メーターなどのデータから生活パターンを予測、在宅先を効率よく巡回できる配送網を予測することで、不在配達の削減により配達員の超過勤務の負荷や残業代を軽減するという取り組みです。
そのほか、「物流の配送ルート最適化による輸送コストの削減」「データセンターのコスト削減」「電力生産コストの削減」「レントゲン/CTによるAI画像診断」「コールセンターの無人対応」「需要予測による食品ロスの削減」「解約ユーザー予測による優遇コストの最適化」など多岐に渡ります。

②-2 ROI => 増加する売上>必要な投資

こちらも日々生活する中で体験することもできますが、例えばAmazonにログインすると自分の購入履歴や閲覧履歴に応じておすすめの商品が出てきてきたり、他の人のYoutubeを見ると自分と全く違う動画がオススメされたりというものがあります(レコメンド)。その結果、滞在時間のUPやクロスセル/アップセル効果があるため、幅広いサービスで類似の取り組みが行われています。

売上をあげるには、顧客行動を情報として蓄積することが重要になります。先日Facebookに投稿したエッジAIを使ったソリューションは、こうしたものを

・店舗マーケティング(通行/来店/リピート顧客カウント)
・観光地での入込客数や公共施設の利用者数の把握
・店舗/施設内の待ち時間や滞留時間の推定

等のリアルな世界で活用できるようにし、かつ既存プロダクトよりも圧倒的に手軽で安価に利用できるように開発を進めています。

②-3 ROI => 絶対に避けるべきリスク<予算

これは、例えば「ドライバーの危険運転/居眠り検知」「テロ/爆弾などの危険行動の画像検知」「一人暮らしの高齢者の画像認識による見守り」等があります。これらはいわゆる売上やコストに換算することはできませんが、一度起きてしまうと致命的なことであるが故に、一定の投資を行うことが正しいと考えられるものです。実態として比較的余裕がある企業や自治体、個人であるほど手厚く投資することが可能になることが多いですが、これらも適切なデータ戦略を適応することによって、目的を達成しつつコストを抑え持続可能にすることができます。

③AIの特徴を踏まえたROIの見極め

AIを活用する場合は、いわゆる通常のIT投資とは異なるROIのポイントもあります。

・データ収集=再学習により徐々に精度が良くなる傾向がある
・そのため、データ収集・再学習・AIアップデートといった運用フェーズがより重要になる
・初期コストだけでなく、運用フェーズにおけるコストも意識して設計する必要がある
・データ収集に端末/デバイスが必要な場合は、エッジ or クラウドコンピューティングのシステム設計がコストを左右する

というポイントがあります。

特にAIモデルはデータ収集とラベリングを丁寧に行い、教師データをリッチにしていくことで、精度を改善することが期待できます。ソフトウェアでも機能改善や追加機能の実装など、リリース後のUpdateは重要ですが、AI・データ活用を考える上では運用フェーズでどのようにデータを収集し、精度を上げていくかも重要な論点のため、運用フェーズのリターン/投資も意識して考える必要があります。

意外と見落とされがちなのが、オフラインの現場でのデータを収集して解析する場合に、個々のデバイス/端末からデータをクラウドに送る設計にしてしまうと、データ収集のためのデバイスに比例して通信コストが増えてしまうということがあります(例えばカメラで店舗の顧客を解析する場合に、数台のカメラであれば動画を全てクラウドに送れますが、数十台/数百台となると通信コストが増大します)。全てをクラウドに送ってクラウド上で解析すれば、AIモデルのUpdateは簡単ですが、通信コストがかかるというデメリットもあります。この場合は、個々のデバイス/端末(エッジ)でデータを処理する設計にする必要があります(エッジコンピューティングについてはこちらの記事をご覧ください)

これらの効果/費用を踏まえてAI・データ分析導入のROIを考えたり、そもそも目的を達成するために必要な機能をもちつつ、初期費用や運用費用を最適化した技術を採用(全てゼロから開発するのではなく、出来上がっているプロダクトや、プラットフォームやモジュールの活用を含む)していくことが重要となります。そうでないと、これらの事が課題になって導入に足踏みをしているうちに、競合他社は最初の大変な時期を乗り越え、単年度でのROIが成立し、どんどん良くなる時期に先に入られてしまうと、競争力の差にはボディーブローのように効いてくることになりかねません。

特に、「既にPOCが終了し精度そのものは出ているがROI・採算が合わない」という場合には、もう一踏ん張りのことも多いですので、i) 本当にROIのRを出すために必要な要件を再度絞り込み、ii) その上で採用する技術・実装および運用のアプローチを再検討、iii) ROIの計算方法には必ずAI・データ分析導入の特徴を踏まえて行う。といった検討をもう一度行ってみてはいかがでしょうか。

以上になります。AI/IoT導入や、DXを考える上での戦略検討にぜひ使ってみてくださいね。長くなりましたが、最後までお読みいただきありがとうございました!

---

DataStrategy は「最先端のデータサイエンスチームで、最高の価値を提供する」を理念に、研究機関や技術者との連携を通じ AI/IoT/DX分野でのプロジェクトをリードする専門家集団です。まずは無料で相談だけでもしてみたい、弊社の取り組みについて一度直接聞いてみたいという方は、お問い合わせフォームからご連絡ください。


この記事が気に入ったらサポートをしてみませんか?