ソーシャルリスニングでSNSデータをどう見るべきか
皆さんこんにちは。
前回は本noteの最初の投稿ということで「ご挨拶」させていただきました。
それでは、今回から少しずつソーシャルリスニングの中に踏み込んでいきましょう。
まず、ソーシャルリスニングをテーマにした最初の記事としては、「SNSデータをどう読むべきか」を考えてみたいと思います。
ガーベッジイン・ガーベッジアウト
「ガーベッジイン・ガーベッジアウト」って言葉がリサーチの世界にはあります。
リサーチャー駆け出しのころはよく耳にした気がするんですが、なんとなく最近はあまり聞かなくなった気もしますね。
ソーシャルリスニングも調査・分析のひとつなので、やっぱりこの原則って当てはまると思うんですよね。
SNSデータをどういうものだと理解して、その上でどう正しく扱うのか、っていうのは、「機械学習が~」とか「人工知能が~」とか「NLPが~」とかの前に、そもそも論として1番大事なことだと思います。
ソーシャルリスニングって、従来型の定量リサーチと比べて、「業界標準」みたいなルールが整ってないので、人によって考え方とか処理の仕方とかが違うんじゃないかなと感じてます。
普段、クライアント様側でどんな分析をしているのかをたまーに拝見できる機会があったりするんですが、「へぇーそんな風にやるのかぁ」と目から鱗のことも少なくありません。
やっぱりデータの見方が全ての基本
この「データをどう見るべきか」って根っこの部分て、その後の「どう分析するべきか」みたいな部分とつながっていると思います。ここがクリアになる事で、「データ」の次の「分析」でも何に注意すればいいのか、みたいなところも自然とクリアになってくる気がします。
「データの整備」とか言えば簡単なんですが、ここ本当に奥の深い世界だなぁと日々仕事をしながら実感するし、今でも新しい発見や学びに出会うことばかりです。
正直、データ整備がうまくいけば分析の半分くらいは終わってるんじゃないかと思うくらいです。
データ整備にも色々な側面があるんですが、その中でも一番大切でクリティカルな視点が、「関連データと有効データ」なんじゃないかと思っています。
関連データと有効データ
データ分析をする時には、必ず答えるべき「問い」が先にある、、、、はずです。
「、、、」となったのは、問いがないままソーシャルリスニングを始めるケースみたいのも実はあるあるだったりしるからだなぁと思ったので(汗)
最近はさすがに減りましたが何年か前までは、本当になんのテーマもないのに「とにかくインサイトを見つけてくれ」みたいなプロジェクトもありました(笑)
いや、最近は無くなったってことはないですね。むしろ、そういうリクエストへの答え方を編み出しているって言うのが正しいかもです。
この辺はまた別の機会で取り上げてみたいと思います。
話を戻しましょう。
この問いを答えるために意味のある何かが含まれているデータを「有効データ」と呼んでいて、ここに注目することがソーシャルリスニングではすごく大切だと思ってます。
問いに関係はしているんだけど、問いに答えるための素材にならないデータは「関連データ」と呼んでいます。
関連データ: 分析テーマに少しでも関連のあるデータ
有効データ: 問いに答えるために利用可能なデータ
例えば、「爽健美茶のブランド資産」を理解したい、みたいな問いがあった場合、「爽健美茶」の4文字が含まれてさえいれば全てのSNSデータが「関連データ」です。
でも、その投稿に含まれる意見やエピソードを通じて、その人が爽健美茶をこんなブランドだと思っていそうだ、というのが読み取れなければ、それらは「有効データ」にはならない、といったイメージです。
ここを明確に区別せず、「爽健美茶」が含まれるデータを全部一緒にして扱ってしまおう、とうするとあまり面白い分析ができない、と思ってます。
いわゆる「表面的」で誰でも知っているような分析しかできない、というのがこの辺に大きな要因があるんじゃないかと思います。
ちなみに、経験的にはこの「有効データ」は、関連データ全体の5%以下、くらいしか含まれてないことが多いです。
データの生まれ方の違い
リサーチって定量であっても定性であっても、消費者の認知や態度、心理・思考、行動を理解するために行うと思います。なので、すべての設問や質問は、これらのいずれかに関連するように設計されます。
でも、リサーチというある意味で人工的な営みによって生み出される「調査データ」とは違って、SNSデータなどの「天然の生データ」は、分析者の意図や設計とか無関係のところで作られるデータなので、「関連しているけど使えない」というデータがたくさん含まれます。
ソーシャルリスニングでは「ノイズ」を削除しようと意識されるんですが、これってお茶ではない爽健美茶を除外する、という意味で語られることが多いかも。つまり「無関係」のデータですね。
無関係なデータはもちろん削っていいんですが、「関連しているけど使えない」データにも惑わされてはいけない、というお話です。
データと向き合う際のキーポイント
という事で、ソーシャルリスニングをする際、データを整備する段階で以下のポイントを意識するといいのかもしれないと思います。
このソーシャルリスニングで答えを出すべき「問い」って何だろう
その問いに答えるためには、どんなデータが必要なんだろう
目の前に並んでいるデータは、その条件を満たしているのかな
逆に言うと、以下のようなプロセスになっている場合、分析に失敗する可能性が高いんじゃないかと私自身も注意するようにしています
とにかくデータがあるので、そこから「面白い何か」を見つけ出そう
データはたくさんあるので、うまく分析できたら面白い発見があるはずだ
あとがき
最後までありがとうございました。
今回はソーシャルリスニングする時のデータ周りをテーマにしてみました。最初に書いた「ガーバッジイン、ガーベッジアウト」そのものだなぁと思います。
海外では「big dataよりもright data」みたいな標語もあるみたいですが、問いに対して本当に意味のあるデータを扱うって言うのが全ての始まりだと思います。
Big dataをBigなまま分析しても何も見えてこない、みたいなことはよくある話。
この記事が気に入ったらサポートをしてみませんか?