【参加レポ】Tableauデータサイエンス勉強会LT&MeetUP 2021-04~後編~
noteをお読みいただきありがとうございます!Tabjo Webコンテンツ担当のkanaです。2021/4/7(水)に開催された「Tableauデータサイエンス勉強会LT&MeetUP 2021-04」(オンラインイベント)に参加してきました!Tableauでデータサイエンス??と思っている方の参考になれば幸いです。
アジェンダ
LT#1.AIもついてる!使ってみようTableau CRM! → ~前編~として別記事で紹介しています。
https://note.com/tabjo/n/na80b566e0005
LT#2.デジタルトランスフォーメーションとデータサイエンスとBIの動向考察おさらい
LT#2.デジタルトランスフォーメーションとデータサイエンスとBIの動向考察おさらい
2つ目のLTは、「Slalom株式会社 岩橋 智宏 さん」による「DXとデータサイエンスプロセスの中のTableau」についてのプレゼンテーションでした。それではレポート始めます!
LT#2-1.Slalomってどんな会社?
シアトルでうまれたコンサルティングファーム(企業の業務上の問題点を発見したり、対応策や改善策の提案などを主な業務とする会社)で、下図の赤枠で囲っているデータやデジタルのサービス等を組み合わせてビジネストランスフォーメーション(事業の構造改革)を実現する会社、だそうです。『データやデジタルのサービス等を組み合わせてお客様を窮地から救い出す』なんだかカッコいいですね。
LT#2-2.デジタルトランスフォーメーションとは
最近よく聞くこのワード「デジタルトランスフォーメーション(DX)」とは一体何なんだろう?ということで認識を合わせていきましょう!
経済産業省の定義 では、「 企業がビジネス環境の激しい変化に対応し、データとデジタル技術を活用して、顧客や社会のニーズを基に、製品やサービス、ビジネスモデルを変革するとともに、業務そのものや、組織、プロセス、企業文化・風土を変革し、競争上の優位性を確率すること 」とされています。「データとデジタル技術を活用」という点がキモのようですね。
また、システムがデジタル化されることで、データが次々と発生します。これらのデータを分析してビジネス戦略に活かす、このサイクルを回し続けることが重要、なのだそうです。
LT#2-3.データサイエンスとは
次は「データサイエンス」について迫っていきましょう。データサイエンスとは、情報処理、人口知能(AI)、統計学などの情報科学系の学問です。LT#2-2.デジタルトランスフォーメーションとは、で解説した「データを分析してビジネス戦略に活かす」ためには、データサイエンスだけではなく、データエンジニアリングとビジネス力も必要なのですね。
データから価値を創出するという意味では、デジタルトランスフォーメーションとデータサイエンスも方向性は同じではないでしょうか。(と岩橋さんは仰っていました。)
LT#2-4.データサイエンスのプロセスとは
「データを分析してビジネス戦略に活かす」といっても簡単なことではありません。実際にそのプロセスをのぞいてみましょう。左の図をご覧ください。わかりやすく料理に例えてくれています。右の図では、実際の使用する製品に置き換えています。Tableauが出てきましたね。予測モデルの作成では、LT#1で紹介のあった「Einstein Discovery」を使用していますね。
このプロセスの中でも「モデルの作成と評価」に着目して解説がありました。この工程をPythonでやろうとするとめちゃくちゃ大変、なのだそうです。この大変な作業から解放してくれるのが、Auto ML(機械学習モデルの設計や構築を自動化する)という技術で、これらを利用すると良いそうです(Einstein Discovery以外にもあります)。データサイエンスの目的は「データをビジネス戦略に活かす」ことなので、時間をかけずに進められるところは進めたいですよね。
LT#2-5.データサイエンスのプロセス具体例①(マンション価格の予想)
東京JR中央線沿線の中古マンションの価格を予想してみよう!です。
データを準備して、モデルが作成できたら評価が必要ですよね。
予測モデルの誤差(実際の価格-予測価格)がどの程度なのかを確認することで評価ができます。では、どのように確認するのか。Tableauユーザの皆さんならお気づきかもしれませんね。
そうです、ここでTableauを使用します!今回は沿線沿いにマンションの価格を予測するモデルなので、データのばらつきを駅ごとに並べて比較すると良さそうですね。データのばらつきを駅ごとに・・となると、ベストプラクティスは「箱ひげ図」ではないでしょうか。
中央値に着目ください。中央値が大きいほど誤差が大きいということなので、「実価格>予想価格」といえます。逆に、中央値が小さいほど誤差が小さいということなので、「実価格≒予想価格」もしくは「実価格<予想価格」といえますね。(駅ごとの考察は、みなさんに委ねます・・。)
LT#2-6.データサイエンスのプロセス具体例②(アイスクリームのイメージ調査)
もう一つの事例です。11種類程度のアイスクリーム製品について「清涼感があるか」「満足感があるか」などのアンケートをとって、それぞれの製品がどのような特徴をもっているのかを分析した事例です。
主成分分析という機械学習を用いて、特徴量が最も表れやすい二次元に圧縮した結果です。
チョコモナカジャンボは、「チョコ感」に大きく振れていますね。
このように製品ごとの特長を分析することで、ビジネスの戦略に活かすことができる発見ができるかもしれませんね。
まとめ
1.デジタルトランスフォーメーションとは、「データとデジタル技術を活用」がカギである。
2.データサイエンスとは、「データを分析してビジネス戦略に活かす」ための学問である。
3.データサイエンスのプロセスをすばやく回すために、Auto ML(機械学習モデルの設計や構築を自動化する)技術を利用すると良い。
→自動化技術は素晴らしい技術だと思います。が、機械学習モデル自体を理解した上での利用が望ましいとも感じました。Tableauも同じですよね。簡単にグラフが作成できますが、裏でデータがどのように集計されているのか等、理解していなければ得られた結果が正しいかどうかを判断できないですから・・。
4.データ活用を進めるにあたって、AIや機械学習で得られる予測の情報や、予測の先にある「何をするべきか?」という情報も必要であるが、それらのデータを一瞬で理解できる形に成形できるTableau等のBIツールはこれからも必要である。
イベント当日の資料は以下のリンクからご覧いただけます。
おまけ
Tableauによるデータサイエンスに興味のある方へ、書籍とFacebookグループのご紹介です。
①Tableauで始めるデータサイエンス
②facebookで「Tableauデータサイエンス勉強会」と検索してみてください。
以上です。最後までお読みくださりありがとうございました。
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?