見出し画像

データマネジメント2022 その6 ガイド付きNLQで真のセルフサービス分析の実現を!〜新たな分析体験で組織をデータドリブンに〜

データマネジメント2022 ~データを制するものがDXを制す!~

2022年3月10日(木)に年に一度の「JDMCカンファレンス データマネジメント2022 ~データを制するものがDXを制す!~」があり、視聴したのでレポートを書きます。

JDMCさんがアーカイブを公開してくれているので、見た順番にコツコツ書いていこうと思います。

開催概要は以下JDMCのデータマネージメント2022の公式サイトにて確認ください。
https://seminar-reg.jp/jdmc/dm2022/

データマネジメント セミナーレポート

データマネジメント関連のセミナーに興味ある人はこちらからどうぞ。

ガイド付きNLQで真のセルフサービス分析の実現を! 〜新たな分析体験で組織をデータドリブンに〜

データ分析ニーズの裾野が拡がったことで、NLQ(Natural Lnguage Query:自然言語クエリ)が更なる進化を遂げています。これまでは予め用意された定型的なダッシュボードやレポートを使うしかなかった一般ユーザーが、普段誰かと会話をするイメージでデータについて質問したり、意思決定に必要な情報を見つけられるようになっているのです。セルフサービスで必要なアナリティクスができるとも言えます。また、データアナリストやIT部門の方々にとっては、サポートの負担が減り、より高度な分析も大幅な時間短縮が見込めます。
そんなNLQが、アナリティクスの分野ではどのように活用されているのか、そしてYellowfinが採用している「ガイド付きNLQ」が従来からある検索ベースのNLQとどう異なるのか?本講演ではこれらの解説を通じて、NLQが皆様のデータ活用環境に与えるインパクトをお伝えします。

データマネジメント2022より

発表者

Yellowfin Japan株式会社 東アジア事業責任者 林 勇吾 氏

概要

マーケットトレンドとYellowfin

BIツールとは「複雑なデータを役立つ答えに変えるツール」です。
NLQとは自然言語クエリ=普段会話するような言葉でDBに問い合わせする仕組み、NLQを使えばどんな方でも簡単にデータに質問ができるようになる。

NLQでは自然言語でデータベースへの質問を組み立てる。SQLを知らない人が自然言語で構文を組み立てられる。

BIツールのマーケットの歴史として、昔はIT部門で管理されていたものが、セルフBIと呼ばれるビジネス側が管理できるようになった。そして今はもっと民主化が進んでおり、要求スキルの水準が下がってきた。

BIツール今後のトレンド
・BIと業務システムが一体化する。
・データストーリーテリング(データから得られたことを、ストーリーを組み立てながらわかりやすく伝える)ことが普及する
・拡張コンシューマー(ツールがライトに使えるようになる)の出現

ツールを入れてもユーザーに浸透していかないという課題に対して、拡張コンシューマーは期待に応えられるものが出てきた。

データの取得の方法
・SQLベース
・GUIベース
・【New】自然言語で問い合わせる

デモンストレーション

NLQを使ってダッシュボードを作成するデモ。
見た感じは「GUIベース」と言っていたDWHのデータに対してマウス操作で表だったりグラフだったりを作成するのが基本っぽい。
「質問する」というメニューからデータソースを選んでSQLの構文が日本語で表示されて、マウスもしくは文字入力で選択していくような感じ。

デモのときはウイスキーの売り上げの抽出を話していたのだけど、対話形式で選んでいくと内部的にSQLが生成されるという仕組みらしい。

抽出したい項目は?
ウイスキー名 ← ここを画面かキーボードで入力する
比較したい項目は?
売上(合計) ← ここを画面かキーボードで入力する
比較する期間は?
今月 ← ここを画面かキーボードで入力する

自然言語でやりとりしていくので、SQLを使って組み立てることと比較して作業時間を1/10くらいにできる仕組みになっている。

Yellowfin社のWebサイトより

ガイド付きNLQ

Yellowfinはなぜ「ガイド付き」NLQと呼んでいるのか。

NLQが必要とされる背景
・スキルがない
・スキルを身に着ける時間がない
・数少ないデータ分析者への依存
・サポートの作業量が多い

NLQを導入すると
・技術を持たないユーザーもセルフでデータ活用
・データ分析者も短時間でデータ分析ができる
・利用者自身でできるためサポートコストが低い

NLQというのは2つある。「検索ベースNLQ」と「ガイド付きNLQ」
Yellowfinのアプローチは「ガイド付きNLQ」という新しいアプローチです。

「検索ベースNLQ」と「ガイド付きNLQ」の比較
・設定をONにするだけでYellowfinのメタデータレイヤーをそのまま利用
・言語の複雑さを解釈させるための同義語やルールをエンジンに教える必要がない
・言語の問題ではなく、アナリティクスの問題を解決に特化できる

感想

私は2025年の崖から落ちそうなレガシーな会社でデータ利活用の推進をしているので、BIツールの求めるスキルが高くてもっとデータ分析の民主化が実現できるようなツールに対するニーズが高いのは理解している。

その解決方法の一つが今回の講演内容であるNLQのようなものであるのは説明上は理解できた。

ただ、現場のニーズはもっと短絡的でExcelでできるものをなぜ新しいものを覚えないといけないのか、Excelで業務命令を実行できるのであれば未知であるNLQにトライするモチベーションが無い。というくらいITに対しての拒否反応があると感じている。

「ガイド付きNLQ」というのは対話式UIと呼ばれるものだろうなと思ったのだけど、UIを特化してもそもそも利用者がどういうDBがあり、どういうものを分析したいのかが無ければ、あまり意味がない。少なくとも弊社で導入しても従来のBIツールと同じようにあまり普及しない。

そもそもBIツールを使うためには、SQLはどういうDBがあり、どういうものを分析したいのかを最初に意識しないといけないので、集計設計みたいなのができればSQLで書こうと対話式UIで書こうとそんなに変わらないのではないか。

デモで言っていたのをSQLで書くとするとこんな感じ?なものをあえてポチポチする意味がわからないって人と、そもそも何を集計したいのかわからないので使いたくないという人の2分化されて終わりそう。

Select 
 whisky_name 
from 
 whisky_m 
where 
 DATE_FORMAT(purchase_date, '%Y%m') = DATE_FORMAT(NOW(), '%Y%m')

SQLの難しさはSQLというプログラミング言語を習得するのが難しいと捉えられがちだけど、RDBに対してどのような集計を行いたいかという集計設計ができないことが難しいのだという事を業界的に理解が進むといいなと思っている。

「検索ベースNLQ」より「ガイド付きNLQ」は優れているという説明をしていたが、「検索ベースNLQ」はAIチャットボットのようにこちらの意図を学習しようとすることに対して、「ガイド付きNLQ」はSQLの構文を作成するためだけの質問をするという意味っぽかったので、それは別に優れているよりは目指すべきものが違うだろうと思った。

「検索ベースNLQ」=データ分析の民主化を目指している
「ガイド付きNLQ」=SQLの民主化を目指している

データ分析の民主化を行うためには、データに係るビジネス職の人たちが学び続けるという基本姿勢を持ち、データの基本的な概念を理解してツールが変わろうと基本的な考え方は変わらないから、短時間でやりたいことができるツールを導入しようというモチベーションにならないと難しいと思う。

おわりに

自分の知識をまとめるためと今後誰かがデータマネジメントをやってみたいと思った時のきっかけとなるためにnoteを書くことにしました。

モチベーションのために役にたったという人はぜひ、フォロー&スキをお願いします。

ツイッターでもデータマネジメントに係る情報をつぶやいてますので、よろしくお願いします。

データマネジメントを学ぶ人が抑えておきたい本

DXを成功に導くデータマネジメント

DXを成し遂げるために必要なデータをどうマネジメントしていけばよいかが書かれている。
データ環境より、セキュリティの観点であったり、プライバシーの観点であったりといった非技術者向けの内容が多く書かれている。
データマネージメントに興味を持った人はまずは読んでみるとデータマネジメントでなすべき概要が理解できる。

実践的データ基盤への処方箋

データ利活用を行うために必要なデータ基盤の考え方と、利活用するためにはデータをどのようにマネジメントしていけば良いかを具体的な例を用いて説明されている。
技術が中心になるので現在データ技術に係る人がデータマネージメントに興味を持った時には、まず手に取ることをおすすめする。

個人データ戦略活用 ステップでわかる改正個人情報保護法実務ガイドブック

個人情報保護法を順守するための基本的な考え方が実務ベースで書かれている。2022年4月に施工される改正個人情報保護法で新たに追加される概念も同様に記載されている。
政府の出しているガイドラインよりも俯瞰的に読めるためデータプライバシーにかかわる人、データを使ったビジネスを推進する人は読んでおくとスムーズに業務が進められる。

データマネジメント知識体系ガイド(DMBOK)

自分も要約・解説記事を書いているDMBOK。データマネジメントに興味を持った人がまず手に取ると挫折することは間違いないほどのボリュームがある。
読めば読むほど味が出てくるので、データマネジメントを進めようとしている人は各家庭に1冊は是非買っておきたい。

データマネジメントが30分でわかる本

本の著者もDMBOKを読むためには非常にボリュームが多く読み解くには苦労するので、かみ砕いた解説書をまとめたと書いてある通り、DMBOKを独自解釈してわかりやすく書かれている。
DMBOKを技術者目線で読み解いた内容になっているので、実践的データ基盤への処方箋と同様データ技術に係る人におすすめする。

この記事が気に入ったらサポートをしてみませんか?