見出し画像

ダイムラーのデータドリブンエンタープライズを支えるデータカタログの構築

このブログは、Tableau Conference 2019 で行われた講演「Daimler Trucks North America: Building a Data Catalog for a Data Driven Enterprise」から抜粋した内容をまとめたものです。

このブログは、以下の3つのポイントにより、ダイムラーのデータカタログ導入の取り組みについて理解することができます。

・Alation導入に至った課題と導入効果
・ITとビジネスの協業体制の構築
・ビジネス利用での定着と実績

ダイムラーのデータドリブンエンタープライズを支えるデータカタログの構築

ダイムラー(Daimler AG)は、ドイツを本拠地とする世界的な自動車メーカーです。同社は、自動車、商用車、トラック、バス、および関連するサービスを提供しています。2018年のダイムラーの年間販売台数は約340万台、売上高は約1,670億ユーロ(約1.9兆ドル)で、従業員数は約30万人です。

ダイムラーDTNA(Daimler Trucks North America)では、ビジネスデータは多岐にわたり、データはオンプレミスとクラウドに散在しており、データベースはSAP HANA、DB2、SQL Serverなど多数あります。自動車、商用車、トラック、バスのデータが存在し、ユーザーは社内および社外で必要に応じて共有することがあります。また、分析ツールにはTableau、Power BI、Alteryx、Alationの他にもレガシーツールがあります。私たちのデータ環境は広範であり、その複雑さに取り組むのは非常に困難です。データを見つけようとすると、それが問題につながることがあります。

トラックの販売台数や足りなくなるリスクのあるパーツの調達予定など、アナリストが必要とする情報を得る際に、どのデータベースを参照すればよいかわからず、他の部署の知らない人に問い合わせに行く必要があることがあります。このような状況は、異なる部門でデータがサイロ化されていることや、誰に問い合わせればよいかが明確でないことによって引き起こされます。その結果、データを使用する際のフラストレーションが生じ、プロジェクトの遅延が発生することもありました。

その課題を解決するために、Alationを導入しました。導入前には、Tableauコミュニティが活性化し、あらゆる部門でデータの活用を促進する機運が高まっていました。データ会議と言われるパワーユーザーを集めた有志のグループを形成し、データの活用に必要な要件を話し合いました。その結果、データの高い需要とセルフサービス分析を推進するためには、データカタログが必要であるという結論に至りました。

これは、私たちのAlationのインターフェースです。Tableau Serverからメタデータを収集し、すべてのTableauのコンテンツを検索可能な状態にしています。アナリストは、Tableauの背後にあるSQLや使用される計算フィールドの内容をAlation上で管理し、共有すべきドキュメントやデータの取り扱いポリシーも含めて閲覧できます。

なぜAlationを導入したのかについてです。Alationを導入する前は、データカタログに関しては内製ツールを使用していました。私たちが求めていたのは、IT部門向けだけではなく、ビジネスユーザーが使いやすいカタログです。ビジネスユーザーのTableauコミュニティからPOCの協力をもらい、多くのフィードバックを得ました。市場に存在する多くのカタログツールがIT部門向けのものである中、Alationはビジネスユーザーのコミュニティに密着し、コミュニティの発展に貢献できると判断しています。選択基準は次のとおりです。
1. 使いやすさ
2. エコシステム
3. 生産性
4. 検索性
5. リスクの回避

ここでは、典型的な分析プロセスを定義しています。まず、ビジネスユーザーが質問を持つ場合、データスチュワードやデータエンジニアにデータの所在を尋ね、データの使用ガイドラインに関する情報は他の担当者に問い合わせることもあります。次に、データアナリストやデータサイエンティストが質問に答えるための情報を探し、分析や可視化を試みます。このプロセスは、数日から数週間、場合によっては数ヶ月かかることがあります。Alationの導入により、このプロセスをスムーズにできたユースケースについて、いくつかの事例を紹介します。

まず一つ目の事例は、Ninad Gadreのユースケースです。彼は、CFOから市場の状況と顧客の購入パターンを理解するためのダッシュボードを構築するように求められました。彼は、まずAlationを使用して、以前に類似の分析が社内で行われていないかを確認することができます。Alationにより、車輪の再発明を防ぐことができます。その後、要件に合うダッシュボードを見つけて再編集し、CFOの要求に応えることができました。

二つ目の事例は、営業とマーケティングの分析を担当するDawn Rinehartのユースケースです。彼女は、車のパーツの使用状況とそのパーツがどのプロジェクトで使用される予定かを尋ねられました。彼女は以前はデータスチュワードに連絡してデータの入手方法を問い合わせていましたが、Alationを使用することで、自身で2、3分のうちに必要なクエリを見つけ、それを再利用することですぐに分析を行い、回答に辿り着くことができました。これにより、データを見つけるために通常かかっていた80時間の作業が2時間で終了し、時間の99%が削減されました。

三つ目の事例はデータエンジニア、Saajan Patelのユースケースです。彼の役割は、当社の顧客に最適なトラックを推奨するレコメンドエンジンを構築することでした。Alationを使用する前は、機械学習モデルに使用するデータを見つけるのに苦労し、推測しながら業務を行っていましたが、Alationの導入後は、Alation内のチャット機能を活用して部門を越えてクエリやデータセットの共有が行われ、新しいデータセットでの予測モデルの構築に役立てることができました。

次に、個々人のユースケースに限らず、カタログにより会社全体のデータの利活用が変革されたユースケースを紹介します。ダイムラー北米では、多くのブランドを取り扱い、複数の製造工場が存在します。各工場には独自のデータベースがあり、個別の分析が行われています。しかし、個別の分析を他の工場と共有することが困難であるため、Excelで出力し、Dropboxに保存して共有する方法が採用されていました。本来求められる理想の姿は、個々の工場の分析ではなく、工場を横断したデータの共有と分析が求められていることがわかったため、各工場からチャンピオンを選出し、それぞれの工場のSQL ServerのメタデータをAlationに統合することで、各工場の異なる分析や活動内容が把握できるようにしています。また、Alation上でチャットを行うことも可能になりました。会社の文化とコミュニティの変革を実現することができています。

素晴らしいことは、私たちが事例を尋ねずとも、ユーザーが自らストーリーを共有しに来てくれることです。Alationを導入してから1年が経過しました。以前はビジネスユーザーのデータの理解が進まなかったのですが、Alationの導入によりビジネスユーザーのデータ検索が進み、セルフサービスでのデータ利活用が推進されています。また、以前はデータスチュワードやデータエンジニアに大量のメールや電話で個々人の問い合わせが行われていましたが、Alation上での会話にシフトすることで、ナレッジが蓄積され、データ人材全体の生産性とナレッジの再利用性が向上しています。

次に、リリース計画とユーザー数の伸びについて紹介します。Alationは2018年10月にスモールスタートによる導入を開始しました。全社への展開は控え、初期導入時には3名のデータスチュワードが6つのデータソースをAlationに統合し、統合されたメタデータの説明が100%行われていることを徹底しました。データに説明を付与しないと、それが発見されることはありません。テクニカルなシステムメタデータはデータソースから取得されますが、それを活用するにはビジネスメタデータが必要です。両方が揃って初めて、ビジネスに利用できるカタログとなります。2019年2月には大々的なローンチを行い、2019年4月にはコミュニティの半分が失われました。これは自然なことで、ユーザーが必要な情報を見つけられなければ、戻ってくることはありません。その後、当社にとって重要なデータソースやユースケースを特定し、カタログを充実させるグロース計画を立て、着実に進めてきました。現在では、20のデータソースが統合され、1490のTableauワークブックが確認でき、約200のクエリの共有が行われています。

Alationの導入と拡大に対して取り組んだことは次のとおりです。
・Alationのユーザーやデータスチュワードのユーザーコミュニティを設立し、Tableauのコミュニティと協業できるようにした
・Alation Analyticsを用いて、Alationの使用状況を分析し、取り組みに還元すること
・Alation University(AlationのEラーニングコース)を通して新しいユーザーを教育すること

これからは、さらにデータスチュワードの育成と更なるビジネス価値の創出に力を入れる予定です。

本セッションを通して伝えたいことは次のとおりです。
・ITとビジネスの間でパートナーとなる協業体制を構築すること
・データカタログを推進するために、アワードやイベント、イントラネット、コミュニティを通して成功を共有すること
・Alationと深く協業し、新機能に追随し、活用すること
・まずは小さく始めて、データスチュワードの体制を構築し、大々的なローンチの前にビジネス利用のユースケースを理解すること


この記事が気に入ったらサポートをしてみませんか?