アンケート調査結果を可視化してみた【Tableau】
どうも、分析屋の東雲(しののめ)です。
今回は、「アンケート調査」の結果を可視化してみましたーの回です。
グラフ等で大小が表せる定量的なデータではなく、アンケートに記載された「言葉」を可視化する手法となります。
以前ご紹介したSNS分析にも少しだけ登場した「ワードクラウド」という可視化手法を使っています。
ちなみに今回、データ準備の詳細やダッシュボードの作成方法は尺の都合上割愛して、
「こんなデータが準備できたらこういうダッシュボードが作れましたよ」という感じの内容になります。
「アンケート調査してみたけど、何とも言えんなー」となっている方は、是非参考にしてみてください。
完成品とデータ
■完成品ダッシュボード
※各画面の用途については後ほど解説いたしますが、前述の通り今回は詳しい実装方法については割愛しております。
実装についての詳細が気になる方は、以下からダッシュボードをダウンロードしてご確認いただけます。
■元データ
元データは、こちらのアンケート回答データです。
よくある口コミサイトのようなイメージで、いくつかの有名な飲食チェーン店に関して、
回答日時、回答者の属性、複数の項目での0~5までの評価点、自由回答でのコメント といった内容が記載されています。
※アンケート回答内容はサンプルとして自作したものになりますので、実際の口コミデータではございません。また評価点と自由回答コメントの整合性が微妙な点はご容赦ください。
■加工済みデータ
今回は、元データをそのまま読み込みます。
追加で、自由回答欄のテキストに形態素解析(名詞や動詞、助詞などの品詞毎に区切って一覧化する処理)を行ったデータを読み込ませます。
各形態素のワードには、元のアンケート回答のidを付与して紐づけしています。
ダッシュボードの各グラフの解説
①ワードクラウド(★)
形態素解析で抽出したワードの集合を表示しています。
アンケートでの登場回数が多いワードは、色とサイズで強調されるため、ユーザの声として目出つ内容をピックアップするのに役立ちます。
②評価点の平均点(時系列推移)
あるワードを含んだ回答の評価平均点が、毎月どのように推移しているかを表しています。
(ワード未選択の時はすべてのワードの評価平均点を表示)
③ワードの登場回数(時系列推移)
あるワードを含んだ回答の登場回数が、毎月どのように推移しているかを表しています。
(ワード未選択の時はすべてのワードの登場回数を表示)
④評価点別回答数(★)
「評価点」「評価項目」ごとのアンケート回答数を表示しています。
今回のアンケートにおいてどの項目が特に不評・好評だったのか等がわかります。
⑤属性別回答数(★)
「年代」「性別」ごとのアンケート回答数を表示しています。
今回のアンケートにおいてどんな年代・性別の層がメインの客層になるのかが見られます。また深堀りすることで、客層によってアンケート回答の傾向があるか等も調査できるかもしれません。
⑥回答内容
アンケート回答内容をそのままずらっと表示しています。
形態素解析などの自然言語処理をすると傾向を読み取りやすい反面、元の文章のニュアンスが多少なりとも失われることは避けられないので、原文を確認しながら慎重に分析を行うことが大切です。
補足
★がついている部分は、フィルターアクションを適用しています。
※フィルターアクションとは----------------------------------------------
Tableauの公式ドキュメントには、以下の内容で記載されています。
フィルターアクションはバックグラウンドで、関連するソースフィールドのデータ値をフィルターとして送信先のシートに送信します。
つまり、ひとつの画面で選択したデータをフィルター条件として、他の画面にも同じフィルターを適用する機能となります。
こちらのブログで説明されている内容が動作イメージとしてわかりやすいかと思います。
----------------------------------------------※
今回のダッシュボードでは、フィルターアクションを以下の様に設定しています。
すると以下の様に、それぞれのワークシートが相互で作用し合っている状態になります。
①ワードクラウド(★)で形態素をひとつ選択
➡「形態素」でフィルター(①以外のワークシートに適用)
④評価点別回答数(★)で評価点・評価項目をひとつ選択
➡「評価点」「評価項目」でフィルター(④以外のワークシートに適用)
⑤属性別回答数(★)で年代・性別をひとつ選択
➡「年代」「性別」でフィルター(⑤以外のワークシートに適用)
実際の操作・分析の流れイメージ
■まずは俯瞰して状況を見てみる
※()内は確認する画面
どんなワードの投稿が多いのかな(①)
評価点はどんな風に推移しているのかな(②)
いつごろ投稿してくれてるのかな(③)
どんな属性の人からの回答が多いのかな(⑤)
どんな評価をしてくれてる人が多いのかな(④⑥)
■その中で、深堀したい部分を見つけ、アクションフィルターを使って絞り込みをしていく
「メニュー」の登場が多い(①)
➡ どんな人がどんな風に回答してくれてるのかな(④⑤⑥)
「味」についての評価で「2未満」と回答している人が多い(④)
➡ どの属性の人の回答が多いのかな(⑤)
➡ 同じような評価は時系列ではどう言う風に増減しているのかな(②)
このように、ユーザの声の中でも目立って増えていたり、全体の評価に影響を与えている意見を見つけていきます。
そしてその後は、実際の店舗状況がどうなっているかの事実確認をしたり、重要度やコスト等を元に改善の優先順位や手法を決める、実際に改善策を打つ、効果を計測するといった感じでPDCAサイクルを回していくという流れになります。
まとめ
■形態素解析を用いたデータの分析で気を付けること
単語が持つ意味というは、文脈によって大きく変わります。
今回でいうと、「嬉しい」という単語は「もっとこうしてもらえると嬉しい」という文脈であればネガティブな意見で、「こういうサービスをしてくれたことが嬉しい」であればポジティブな意見と取ることができるでしょう。
形態素解析の段階ではネガポジの判定までは行えないので、登場回数の増減だけで一概に良くなった悪くなったとは取らない方が吉です。
また今回は行っていませんが、より複雑なテキストマイニング処理を行った場合も注意が必要です。
例えば、自由回答欄の意見の趣旨を「メニューの品質改善」「サービス速度の向上」のようにカテゴライズする処理を行ったとします。
この場合も、自然言語という多様性のある言語を機械的に解釈して分類するわけですから、当然カテゴライズを間違ってしまうこともあります。
こういった面でも、テキストマイニング処理後のデータというのは完全ではないので、それを前提に分析を行う必要があります。
今回は分類を行っていないので「回答数」のような実数値で可視化をしていますが、分類結果が正確でないと思われるデータの場合は件数のような実数値ではなく「先月から今月にかけて、カテゴリAが10%増加」や「各世代の中で、10代が一番カテゴリAの比率が多い」の様に、比率など相対的な数値を指標に分析するなどが代替え案として挙げられます。
■おすすめの書籍
繰り返しになりますが、形態素解析などテキストマイニング技術は、非常に多様な表現のある自然言語に対して、機械的な処理を施すものです。
適切な使い方をしないと、時間や労力をかけてなんの情報も得られないダッシュボードを作ることにもなりかねません。
そうならないために、テキストマイニングの本質的な部分や取り扱いの注意点などを知っておくのに、以下書籍をお勧めします。
【本のタイトルリンク】
2006年出版のため、分析を行う技術面では2024年現在では古い部分もありますが、分析結果を元にどう考えるか、運用する際はどういった環境作りが理想的なのかなどの部分は現代でも通じる部分があるかと思います。
今回行った形態素解析についても、処理の裏側を解説していたりもしますので、ご興味があればぜひ手に取ってみてください。
ではでは。
ここまでお読みいただき、ありがとうございました!
この記事が少しでも参考になりましたら「スキ」を押していただけると幸いです!
株式会社分析屋について
弊社が作成を行いました分析レポートを、鎌倉市観光協会様HPに掲載いただきました。
ホームページはこちら。
noteでの会社紹介記事はこちら。
【データ分析で日本を豊かに】
分析屋はシステム分野・ライフサイエンス分野・マーケティング分野の知見を生かし、多種多様な分野の企業様のデータ分析のご支援をさせていただいております。 「あなたの問題解決をする」をモットーに、お客様の抱える課題にあわせた解析・分析手法を用いて、問題解決へのお手伝いをいたします!
【マーケティング】
マーケティング戦略上の目的に向けて、各種のデータ統合及び加工ならびにPDCAサイクル運用全般を支援や高度なデータ分析技術により複雑な課題解決に向けての分析サービスを提供いたします。
【システム】
アプリケーション開発やデータベース構築、WEBサイト構築、運用保守業務などお客様の問題やご要望に沿ってご支援いたします。
【ライフサイエンス】
機械学習や各種アルゴリズムなどの解析アルゴリズム開発サービスを提供いたします。過去には医療系のバイタルデータを扱った解析が主でしたが、今後はそれらで培った経験・技術を工業など他の分野の企業様の問題解決にも役立てていく方針です。
【SES】
SESサービスも行っております。