ソーシャルメディア上のクチコミデータを漏れなく収集するには?
ソーシャルリスニングでは、目的に沿ったソーシャルメディア上のクチコミデータを漏らすことなく収集することが求められます。今回は、所望するクチコミデータをできるだけ多く収集するための検索条件の設定方法を紹介します。
▼この記事をざっくり説明すると▼
・ソーシャルリスニングをはじめる前に、目的を定めることが大切
・目的により、収集する対象データや期間が決まる
・必要なクチコミデータだけを抽出するポイントは検索条件。より良い検索条件を模索することで、より効果的なソーシャルリスニングが可能になる
・"OR"条件で単語の表記ゆれに対応し、検索対象を広げる
・"AND"条件で必要なクチコミデータを絞り込む
・"NOT"条件で不要なクチコミデータを除外する
検索条件の設定が重要である理由
ソーシャルメディア上では様々な人々が商品やサービスに関する評判などを自由気ままに書き込むため、クチコミデータは同じ対象物でも異なる言葉で表現されます。また、販売促進の一環として意図的に生み出されたクチコミデータも存在します。
このように混沌とした情報源から、所望するクチコミデータだけを漏れなく完全に取得することは困難です。また、仮に厳密な検索条件を見つけ出したとしても、日々新たな表現が生まれ続けており、時がたてば最初に設定した検索条件が陳腐化することも考えられます。ソーシャルリスニングは精緻な結果を目指せば目指すほど、その調整に膨大な時間を費やすことになります。しかし、作業に費やせる時間には限りがあります。
そのため目的に沿ったクチコミデータの収集精度と検索条件を調整する作業量とのトレードオフから妥協点を見出すことが現実的です。今回は、クチコミデータの検索条件を決定する方法を手順に沿って紹介します。
ソーシャルリスニングをはじめる前の準備
検索条件について考えていく前に、ソーシャルリスニングはしっかり目的を定めてから行うことが大切です。ソーシャルリスニングを活用する目的は、例えば以下などが挙げられます。
▼ソーシャルリスニング活用目的(例)
1. ブランド調査
ブランドイメージ、認知度、利用実態などの把握。
2. エンゲージメント分析
ソーシャルメディアアカウントの分析・効果測定。
3. インフルエンサー分析
影響力の大きいインフルエンサーの特定、集客への活用。
4. 風評リスク対策
炎上リスク検知・モニタリング、風評対策。
ソーシャルリスニングを活用する目的が定まったら、いよいよ検索対象とするクチコミデータの収集方法を考えましょう。
クチコミデータの収集方法は、「どのような手段」(ソーシャルリスニングツール)で、「どのようなクチコミデータ」を収集し(検索条件、プラットフォーム、期間の決定)、「どのようなアウトプット」を得たいのか(レポートフォーマットの設計・設定)をもとに検討します。
このうち「検索条件」について詳しく考えいきます。
目的に沿ったクチコミデータの収集方法
目的に沿うクチコミデータだけを収集するには、クチコミデータの検索条件を丁寧に設定することが大切です。
例えば、9月に発売された「Apple Watch Series 6」に関するクチコミデータを収集する場合を考えてみましょう。単純に「Apple Watch Series 6」が含まれることだけを検索条件とした場合、「アップルウォッチ6」と表現したクチコミデータは収集対象から外れてしまいます。
一方で、BOTと称されるようなアカウントから機械的に生成されたクチコミデータは、収集対象から除外することが必要になります。
そのため検索条件を考える上で、以下のように「検索対象を広げる作業」と「検索対象を狭める作業」が大切になります。
【ステップ1】検索対象を広げる
以下の検索条件を追加し、できる限り目的に沿うクチコミデータを収集する
(1)表記のゆらぎ
(2)略称
(3)俗称・愛称
(4)打ち間違い、誤変換
(5)抽象的な表現 ※AND条件で絞り込み
【ステップ2】検索対象を狭める
以下など、できる限り目的に沿わないクチコミデータを取り除く
(1)プレゼント企画やアフィリエイト
(2)その他 スパム、BOTなど
(3)目的単語固有の問題
検索対象をどこまで広げるか、狭めるかは、冒頭でも述べたとおりソーシャルリスニングを活用する目的によります。「どの程度の取得精度が必要か」「この作業にどの程度のリソース(作業工数)がかけられるか」などを考慮の上、検索条件の作成手順の社内標準化を図りましょう。
【ステップ1】検索対象を広げる
ここからはソーシャルリスニングツールを使い、検索条件の設定を実践していきます。最初に、検索を行うためのキーワードを追加し検索対象を広げ、できる限り目的に沿うクチコミデータを収集する手順を紹介します。
今回は、Twitterの全量データを検索・分析対象とすることが可能なソーシャルメディア・アナリティクスツール「Brandwatch」を使用し、生活者のクチコミデータ収集を行います。
・今回のソーシャルリスニングの目的
「Apple Watch Series 6」に関するTwitter上のクチコミ把握
・ツイート取得期間
2020年9月15日〜2020年9月21日の1週間
・ツイート取得量の参考値
英数表記の正式名称(Apple Watch Series 6)で検索した場合
ツイート取得量:7,507件
(1)表記のゆらぎ
生活者がTwitterに投稿するとき、商品・サービス名を正式名称(完全一致)でツイートしない場合もあります。商品・サービス名の表記をかな・カナ・漢字・英数に置き換え、キーワードを追加してみましょう。各表記をハッシュタグ化したものも合わせて追加します。
▼追加したキーワード
アップルウォッチシリーズ6、あっぷるうぉっちしりーず6、Apple Watch シリーズ6、#アップルウォッチシリーズ6、#AppleWatchSeries6、など
これによりさまざまな表記の正式名称が使われたツイートや、ハッシュタグを含むツイートなどを取得することができました。
ここまでのツイート取得量:8,426件(+919件)
▼取得できなかったツイート
・正式名称(完全一致)が使われていないツイート
(2)略称
次に、商品・サービス名の略称をキーワードに追加していきます。一般的によく使われている略称、ハッシュタグなどで使われやすい略称などを追加します。
▼追加したキーワード
Apple Watch 6、アップルウォッチ6、Apple Watch S6、AW6、など
略称を追加したことで、正式名称だけでなく略称を含むツイートも取得できるようになりました。しかしその一方、以下のようにプレゼント企画・アフィリエイトなどを目的とするツイートまで取得されるようになりました。
このような関連性のないツイートは後ほど検索対象を狭める工程で除外していきます。
ここまでのツイート取得量:9,900件(+1,474件)
▼取得できなかったツイート
・よりくだけた表現の略語や愛称が使われているツイート
(3)俗称・愛称
商品・サービス名の略称とは別に、俗称や愛称がある場合はキーワードを追加していきます。俗称・愛称は地域や世代によって異なる場合もあるため、事前に自社の商品・サービスがインターネット上でどのような呼ばれ方をしているのか調査した上で愛称を追加してみましょう。
▼追加したキーワード
新型アップルウォッチ、新しいApple Watch、新しく出たアップルウォッチ、りんごウォッチ、など
俗称や愛称を追加したことで、話し言葉に近いツイートも取得できるようになり、ツイート取得量がさらに大きく増えました。
ここまでのツイート取得量:11,145件(+1,245件)
▼取得できなかったツイート
・打ち間違い、誤変換など、人為的ミスが含まれるツイート
(4)打ち間違い、誤変換の追加
生活者がTwitterに投稿するときに商品・サービス名を打ち間違えてしまった/誤変換してしまった場合を想定してキーワードを追加していきます。
入力ミスや誤字脱字だけでなく、スペースや記号(「・」など)の有無をはじめ、事前にどのような誤表現で検索やツイートが行われているか調査した上で追加してみましょう。
▼追加したキーワード
Applewatch Series6、アップル・ウォッチ、アプルウォッチ、など
純粋な打ち間違い、誤変換のツイートが取得できました。商品・サービスに愛称的に親しまれている打ち間違いや誤変換的な表現がある場合は、該当するキーワードを追加することで、ツイート取得量を増やす手段として有効といえます。
ただし、打ち間違いや誤変換をキーワードに追加したことで、プレゼント企画やアフィリエイトなどに関するツイートがさらに増えてしまいました。
ここまでのツイート取得量:14,799件(+3,654件)
(5)抽象的表現の追加(AND条件で絞り込み)
ここまでは「新しいApple Watch」であることが単体で分かるキーワードを追加してきましたが、これだけでは取得できないツイートがあります。
例えば、Apple Watch Series 6の目玉である「血中酸素濃度の計測機能」について言及しているものの、「1」〜「4」で追加してきた正式名称や略称などが使われていないツイートは取得できていません。このような抽象的な表現が使われたツイートを取得するために、AND条件を使い、目的に沿うツイートを絞り込んで取得していきます。
AND条件は、ソーシャルリスニングのキーワード検索において「キーワードA・Bいずれも含む」ものを取得する命令です。これにより、目的に沿う表現が含まれるツイートを取得していきます。
▼追加したキーワード
以下のグループ【A】と【B】をAND条件で追加。
【A】Apple Watch、AppleWatch、アップルウォッチ、など
【B】血中酸素、ウェルネス、高度計、睡眠時無呼吸症候群、チタニウム、品番・モデル名、など
AND条件を追加したことで、正式名称や略称などが使われていないものの、目的に沿うツイートを取得することができました。
ここまでのツイート取得量:16,509件(+1,710件)
検索対象を広げる:結果
ここまでは検索対象を最大化するために、キーワードを追加する手順を紹介しました。各手順ごとのツイート取得量の増加数を見てみると、略称の追加以降で大きく増えていることが分かります。
【ステップ2】検索対象を狭める
検索対象の最大化によりツイート取得量が大きく増えた一方で、目的に沿わない不要なツイートも増えてきましたので、ここからは不要なツイートを取り除く手順を紹介します。"NOT"を使った除外をしながらツイート取得量の違いを見ていきます。
ソーシャルリスニングツールのダッシュボード上で確認できる不要なツイートをもとに除外を行っていきます。
(1)プレゼント企画やアフィリエイト
現状、プレゼント企画やアフィリエイトなどに関する不要なツイートも取得されてしまっているので、NOT条件を使い、できる限り目的に沿わないツイートを除外していきます。
NOT条件は、ソーシャルリスニングの検索条件において、「キーワードAを含むものから、Bを含むものを除外する」命令にあたります。これにより、目的に沿う表現が含まれているが、不要な内容を含むツイートを取り除いていきます。
▼追加したキーワード
プレゼント企画関連のキーワードを除外するために、以下などをNOT条件で追加。
プレゼント企画、#Amazonギフト、#懸賞、など
NOT条件を追加したことで、不要なツイートを除外することができ、より目的に沿った内容だけを取得することができました。
ここまでのツイート取得量:16,222件(-257件)
(2)その他 スパム、BOTなど
ソーシャルリスニングツールによっては、スパムキーワードやBOTなどのアカウントを指定して除外することができるため、これらを組み合わせることで検索対象を狭める作業を簡略化できます。他にも地域の絞り込みやリツイートの除外など、目的に沿って検索対象を狭めることができます。
(3)目的単語固有の問題
今回のデータ収集では該当しませんでしたが、検索対象によっては目的単語固有の不要なツイートが取得されてしまう場合があります。
例えば「セブンイレブン」などは、建物の住所を示すために「セブンイレブンの隣」といった表現を使うケースがあります。また、「アップル」なら果物と会社名の両方を拾います。また、会社名でもGAFAのアップルと、自動車の購入販売会社のアップルなどがあります。
このように表記が同じながら、目的に沿わないツイートが取得されてしまう場合は"AND"条件で必要なクチコミデータだけ絞り込むようにしましょう。
検索対象を狭める:結果
今回は(1)の"NOT"条件だけで、スパムやBOTを含む目的に沿わないツイートを取り除くことができました。ツイート取得量の変化を見てみると、不要なツイートの精査が行われていることが分かります。
まとめ
ソーシャルリスニングでクチコミデータを漏れなく収集するために、キーワード追加に関するチェックポイントをまとめました。
【検索対象を広げる】
☑表記のゆらぎ(ひらがな、カタカナ、漢字、英数)の追加
☑略称の追加
☑俗称・愛称の追加
☑打ち間違い、誤変換の追加
☑抽象的表現の追加(AND条件による絞り込み)
【検索対象を狭める】
☑"NOT"条件の追加(プレゼント企画、アフィリエイトなど)
☑特定のアカウント・キーワードの除外(スパム、BOTなど)
☑目的単語固有の問題の解消(AND条件による絞り込み)
これら検索対象を広げ、狭めることにより、企業の目的に沿ってデータ収集ができるようになります。ソーシャルリスニングを活用する場合は、上記のチェックポイントを参考に、検索条件の最適化、作成手順の社内標準化に役立ててみてはいかがでしょうか。
【今回使用した「Brandwatch」の特徴や機能についてはこちら】
ループス・コミュニケーションズでは、ソーシャルリスニングの戦略立案から導入、運用サポートまで、ソーシャルリスニングのビジネス活用支援を行っています。まずはお気軽にお問い合わせください。
【関連記事はこちら】