見出し画像

Webとマーケティング 授業資料(15)

Tweetから抜き出した会話の断片

しばらく空いてしまいました。継続していた課題に関して、学生さんのワークをもとに考察して行きましょう。

課題①最終

課題は女性の大学生のペルソナを設定して、さらにその層、その人に向けた商品やサービスを考えるという、非常に抽象的で、取り留めも無いものです。
完成度を高めるのではなく、手法としてのソーシャルリサーチをエスノグラフィック的に行い、それを元に設計問題を考えて行くという、プロセスの体験を目的としたものです。
尚、あえてもう「女子大生」という言葉は使いません。
自らを女子大生と自称する女子大生は、まずいませんし、何より特別なタームとして余計なニュアンスを使いたくないというのがあります。なぜわざわざ女子大生などと用語化しなければならないのか、なんとなく気持ち悪いのです。JDだのJKだの、平気で使う人もいますが、言葉には神経質になってもいいでしょう。

いろいろなやり方、考え方があると思いますが、再度確認です。

①ある女性大学生を中心としたクラスター(集団)を発見してください。
たくさんの人の中から、ソーシャルグラフを抽出して、その中の対話、発話を可視化するためです。
何億人もいるTwitterのユーザを全部抜き出してソーシャルグラフ化することはできません。
そこでソーシャルグラフを単純化するために、特定のノードを決めて、そことの繋がりだけに着目します。

グラフ

300人の繋がりを持っているユーザなら、直接の繋がり(第一世代)だけで、相当の量になりますが、さらにその直接の繋がりのあるそれぞれ(第二世代)に関しても見ていくと、その300人がまた300人の繋がりを持っていたとすると、300×300-300=89700の繋がりになります。300引いているのは、最初のノードの300人の繋がりを除くわけです。重複がかなりあるとしても、これはとてつもない数です。
ですので、人力でしたら直接の繋がりだけで精一杯でしょう。

その誰か、つまり「典型的」な女子大生(あ、使っちゃいました…)を発見して作業をしてみます。別にその人が、厳密な意味のネットワークの中心性を持っていなくても構いません。繋がっているので同じことです。

繰り返しになりますが、その人がTwitterでフォローしている人から、デモグラフィックが共通している繋がりを抽出します。すなわち、女性の大学生を抜き出します。

その集団(クラスター)を調べるための手がかりは、以下が考えられます。
・その集団の中で、特徴的なサイコグラフィック属性には何がありますか?
・その集団の中の多くの人々がやっている行動や購買しているものなどで、特徴的なものには何がありますか?
・その集団の中でのやり取りで、頻出する話題、特徴的な話題、用語、などには何がありますか?

こうして、行動や表現、言語などから、サイコグラフィックを明らかにしたいわけです。その上で、それらを列挙して、さらに特徴的な、属性、行動、言動を抜き出します。
こうしたデータ分析は、大量のデータを手に入れ、統計処理などを行うのが定石です。
ただあくまでも、感覚的に分析したいので、データの量よりは、リサーチする側の「感性」に委ねたいと思っています。要するに、人間によってフィルタリングを掛ける、そのための基礎データを作ります。

先日、面白いニュースがありました。

「新型コロナ、19年夏に発生していた可能性」と題されたもので、

「せき」の検索数は例年のインフルエンザの流行に合わせて増加していたため、よりCOVID-19に特有の症状とされる「下痢」の検索数を調べた。この結果、8月に増加がみられたことが分かった。

人間は、現実世界でもネット世界でも、様々な行動をとりますが、ネットの世界では特に情報の受発信を中心とした情報行動と呼ばれるふるまいをします。間違いなく、それらは記録され、こうして分析されることにもなります。
この真偽には立ち入りませんが、こうしてデータとして収集し、分析、判断をしていくことができるということを理解しておいてください。

図は、学生さんに、収集してもらったTweetの断片です。全てデモグラフィックが分かっており、Twitterで鍵付きのアカウントでは無いユーザのTweetを抜き出してもらいました。余り詳細に決めずに、学生さんの感覚に委ねてしまったので、バラバラです。

断片


やり方がわからないとか、何がペルソナ作りに有効なのかわからなとか、いろいろな反応をもらっています。
これはあくまでソーシャルグラフを用いた、エスノグラフィ調査、すなわち調査対象者の行動観察にしか過ぎません。そこに実際の「女子大生」が、共感するものや面白いと思うことなどのフィルターを掛けることで、ペルソナに接近して行きます。

本来この授業の履修者は120人以上います。
それぞれがネット上の一人の数日分のツィートを集めたとしたら、その120倍のコミュニケーションが集まるわけです。
残念ながら、難しかったせいか、あるいはオンライン授業で課題が多く、手が回らなかったのか、約半分60名ほどからのレスポンスがありました。

本来でしたら、プロフィールや関係性なども評価していくわけですが、ここでは、学生さんがそのクラスター(集団)から抜き出したTweetを集めてみました。
個人のプロファイリングではないため、個人を特定するようなものは除外しますが、流石に一般市民ですので、そのあたりは注意深く表現しないようにしているという印象です。要するに「下心」などは、持ちようも無いわけだ。

それらをテキストにしてみました。
これを舐めるだけでもなにか見えて来そうではありますが、まずは形態素に分けてみます。形態素とは、言語学での概念で、意味をもつ最小単位の表現要素を意味します。
ここでは、国立国語研究所が公開している形態素解析ツール「Web茶まめ」というシステムを使ってみます。これはテキストデータやファイルを、自動的に形態素に分けてくれるツールで、非常に使い勝手がいい、優れものです。

これを使って、一連の断片ツィートを、一旦形態素に分けてみます。
現代語と現代話し言葉の辞書があるので、その両方を指定し、CSV形式で出力をしてもらいます。

形態素

その結果が、図に示したようなものになります。
読みや品詞、活用形まで徹底的に解析してもらっていますが、ここから有意な形態素を抜き出してみましょう。
まずは名詞、普通名詞、固有名詞などに着目します。
何について、女子大生たちはTweetし、それに女子大生達が着目したのでしょうか。既に女子大生って言葉を、たくさん使っています、お許しください。

Web茶まめからダウロードしたデータから、
書字形(=表層形)、語彙素、品詞、大分類、中分類
位を使います。
まずデータにフィルターを掛けて、名詞以外を消してしまいましょう。
名詞だけを抜き出して、別な表にコピーします。
次に並べ替えをします。
その上で、重複を取り除きます。

並べ替え

こうして得られたのが、この一連のツィートを構成している形態素になります。
では、その形態素の出現回数を、関数couintifを使って数えてみましょう。
その上で、回数順に形態素を並び変えてみます。
そのままデータの並び替えを行うと、関数couintifの引数がエラーになってしまうので、出現頻度を求めた列を、数値でコピーして、その列を使って並び替えを行います。エラーになる理由は、Excelのデータ並び替えは、コピーではないので、元の参照アドレスをそのままにしてしまうためです。
降順で並び変えると、図のようになります。

回数

中々に興味深いデータではないですか?
この中から、頻度が複数であり、特徴的だろうと思われるものを抜き出してみます。
もうこれだけである程度の傾向が見えてくるはずです。

その他にも最近は、言語解析をしてくれるサービスがあります。
持続的なサービスか否かはわかりませんが、AIテキストマイニングというサイトで、充実した結果を提供してくれます。
ワードクラウドや単語の出現頻度などが、簡易にわかります。
これらの基本原理は、ここで解説したものと同じです。

さらにもう一つ、言語解析をしてみましょう。
共起度解析です。
共起とは、任意の文書や文に、ある文字列とある文字列が同時に出現することを意味しています。
前述の、AIテキストマイニングサイトでも表示されますが、考え方を示しておきます。このデータでは、「ディズニー」や「授業」という言葉が頻出しています。ディズニーは連呼している人がいますので、授業で考えましょう。

授業と言う語を、KWIC方式(文脈付き索引)で表現したものが以下の図です。この中に、マスクと言う言葉が出てきます。
同じように「マスク」を集めてみると、「リップ」が出てきます。また元の授業の文には、「化粧(メイク)」があり、こちらには、「カラコン」が頻出しています。
これらをまとめてKWICで示します。

画像7

厳密な言語解析ではありませんが、文脈として、こうした概念が繋がって登場します。どうやらオンライン授業なので、カラコンが話題になっているようです。
これは、AIテキストマイニングでも同じような共起のネットワークが示されていました。

まだまだデータが少なくて、女性の大学生のペルソナまでは至らないかもしれませんが、現在の環境下で、彼らがどういうふうに生きているか、その一端は見える気がします。

この後は、そういった「2020年の女子大生」を消費者として考えた場合、どういう商品、サービスが彼らに「刺さる」と思いますか?
適宜、データを補充しながら、つまり根拠に基づいて、最終課題に向かってください。


※トップ画像は、mamikoさんの対話をテーマにした写真をお借りしました。こうした穏やかな対話の空気感のようなものは、なかなかTwitterのような荒廃した世界には望めないようです。お礼申し上げます。




この記事が気に入ったらサポートをしてみませんか?