見出し画像

NIリサーチャーコラム #28 奥が深い集計 クロス集計表から見えるもの~なんとなくながめていたらもったいない!~(2022年12月執筆)

執筆者: 営業推進部 シニアリサーチャー S.T
※NIリサーチャーコラムでは、当社の各リサーチャーが日々の業務等で感じた事を自由に紹介しています。

今回のコラムには、集計に関する様々な用語が登場します。
何のことかな?と思ったら、以下当社HPにも用語集がまとめてありますので、合わせてご確認ください。
マーケティングリサーチ用語集 はこちら


1)今さらですが、クロス集計表のお話

知りたいことがあり、調査票を練って練って、無事にデータも集まりました。

さて、その次にやることは「集計」です。

例えば以下のように性年代を割りつけて400サンプルを回収しました。

集計には大きく2つの方法があります。

GT=単純集計 400サンプル全体の結果を集計すること (下表の「全体」にあたる)
クロス集計 下表のように様々な属性ごとに集計したもの

【クロス集計表の一例】

もちろん、20代~50代の男女を均等に取った400サンプルの回答(全体)を見るだけでも意味がないわけではありません。

ただ、せっかくなら、「属性別」に集計を行い属性による特性を明らかにした方が、調査結果の活用の幅は広がります。

これが「クロス集計」です。

この「性別」「年代別」「ライフステージ別」をBD(Break Down)=集計軸と言います。

このように、「全体」だけでは見えないそれぞれの属性の特徴がクロス集計をすることで見えてきます。

仮にこれが「性別」「年代別」「ライフステージ別」どの軸で見ても大きな差がなかったとしたら、それは「気にする度合いは属性に関わらない」=(ここで分析した)誰にでも等しく気にされているということがわかります。

一番右の「平均」は、とても気になる=5点/やや気になる=4点/どちらともいえない=3点/あまり気にならない=2点/まったく気にならない=1点として、その属性の平均点を出したものです。

このような数値もまた%だけではなく結果を見る時には参考になります。

つまりクロス集計表とは「どの属性とどの属性にどんな差があるのか」を明らかにすることができるのです。

このクロス集計表に全体と比較して±5ポイント、±10ポイントでハッチング(色をつける)などの加工をすると、より結果が見やすくなります。

A 性別でみると、男性と比較して女性の方がより気にしています。

B 年代別でみると、若い世代の方がより気にしていて、20代では「とても気になる」+「やや気になる」の合計(TOP2)は65.0%を占めています。逆に50代では「あまり気にならない」+「まったく気にならない」の合計(BOTTOM2)が43.6%で、4割以上の人が気にしていません。

C ライフステージ別でみると、既婚でも「子どもあり」の人はより強く気にしていますが、「子どもなし」の人はあまり気にしない割合も高くなっています。


2)集計軸の視点を変えると違うものが見えてくる

集計軸は「性別」「年代」「ライフステージ」など、その人の特性を表すものだけに限りません。

例えば、別の問でいくつかの商品を示し、その中から「最も買いたい商品」を聞いていたとします。それぞれの商品を選んだ人がこの〇〇を気にする度合いを見てみましょう。

この結果からみると、「最も買いたい商品」として商品Dを選んだ人は、他の商品を選んだ人と比較すると〇〇について気にする傾向が強いと言えます。

逆に商品Aを選んだ人は、〇〇をあまり気にしていない傾向が強いようです。

しかし、縦軸の「全体」で表されているそれぞれのn数(サンプル数)を見ると、商品Aは125人に選ばれていますが、商品Dを選んだ人は50人しかいません。

とはいえ、「商品Dを最も買いたいと思う人は、〇〇という要素を気にしているはずだ!」という仮説があったとしたなら、それは正しかったとも言えます。

表頭(選択肢)と表側(集計軸)を入れ替えてみると、また違うものが見えてきます。

400人全体でみると、「最も買いたい商品」として商品Dを選択した人は12.5%です。

「最も買いたい商品」としては商品A、商品Bの二つがともに35%前後、合わせて7割弱選択されています。

つまり商品だけで見ると、商品Dはこの中ではあまり人気のない商品といえます。

一方、「○○がとても気になる」人だけで見ると25.0%が商品Dを選択しています。

しかし、商品Cと同じ割合で、商品Aを上回っていますが、商品Bよりは下回っています。

つまり商品Dは全体と比較すると「○○がとても気になる」人に限れば2倍の割合の人が選択しますが、「○○がとても気になる人」の中でも商品Dは特に選ばれる商品ではないことがわかります。

つまり、この2つのクロス表から商品Dについて言えることのひとつは、

「最も買いたい商品として商品Dを選んだ人は〇〇について気にしている人が多いが、〇〇について気にしている人が最も買いたい商品として商品Dを選ぶわけではない。ただし、全体と比較すれば商品Dを選ぶ割合は高い。」

ということです。

だんだん混乱してしまいますね。


3)クロス集計表で何を明らかにしたいかを意識して調査票を設計しよう


このようにクロス集計表では横軸・縦軸を工夫することで様々なことがわかるのですが、データの読み方には注意が必要です。

また、そもそも聞いていないことは集計できません。

長年の経験から、私が調査票を作る場合は、このクロス集計表を、レポートがある場合はレポートで何を明らかにしたいのかをイメージしてから調査票の設計をするようにしています。

時に「あれも聞きたい」「これも聞きたい」とどんどん設問数が膨らんでいき、予算の関係もあって問数は限られているので、最終的に削除してしまった設問が実は分析にとても重要なものだったということがあります。

そのようなことにならないためにも、

・何を明らかにしたいのか
・何と何の差を知りたいのか
・どんな仮説を検証したいのか

等、調査の目的を整理し、最終的に出すクロス集計表やレポートでそれが示せるかどうかを調査票の最後のチェックの際に今一度イメージすると、その調査はより意義のあるものになると思います。

また、集計軸にしたいと思っている属性や要素のサンプル数が極端に小さくならないことも考慮した方がよいでしょう。

一般的にブレイクダウンする軸のn数が30未満になると、1サンプルの持つ%が大きくなりすぎて、調査結果を見誤る危険性が高くなるので、避けられることが多いです。

具体的には、100人のうち1人が「あてはまる」と答えても1%ですが、30人のうち1人なら3.3%、20のうち1人なら5%、10人に1人なら10%になってしまいます。

このようなことも踏まえて、当社の経験豊富なリサーチャーが、より有意義な調査にするためにご予算やスケジュールに応じた調査設計をご提案いたします。

また当社の担当チームが、「このようなクロス集計を行うと、より有益な結果がみられるのではないか」「このクロス集計結果からは、このような知見が得られるのではないか」という視点で、集計・分析を行います。

貴重なご予算を使って行う調査です。より多くの知見が得られ、クライアント様の業績向上につながり、さらにはより良い商品やサービス等が消費者の皆さんや社会全体に提供されることを願い、私たちは日々の業務を進めています。

「こんなことが知りたい」「こんなことを明らかにしたい」「消費者に求められているサービスを提供したい」・・・そんな時にはぜひ当社にお問合せくださいませ。


執筆者プロフィール

営業推進部 シニアリサーチャー  S.T

工学部工学研究科博士課程都市・交通計画専攻で道路計画、交通計画、都市計画を学ぶ
公共系シンクタンク、大学研究所では総合計画・各種計画・施策の立案、住民参加型まちづくり事業の推進を担当

高速道路建設の経済効果等を研究する中で、「満足度をお金に換算して経済効果に計上できないのか?」と思い立ち、マーケティング理論に出会う

39歳でマーケティングリサーチ会社に転職

その後は各種公共施策の立案と並行し、商品開発、市場分析等を担当
海外調査(グローバルリサーチ)については、気づいたら16か国延べ40都市で50以上のリサーチを実施

7年前から現職