![見出し画像](https://assets.st-note.com/production/uploads/images/108875046/rectangle_large_type_2_521db2e235cc98bd08ef55b56c73db6b.jpeg?width=1200)
検索データから作った漢字で2023年上半期を振り返る
こんにちは、データアナリストの小川知紘です。
早いものでもうすぐ2023年も折り返しです。
私としてはこの前新年を迎えた印象ですが、本当に半年間も経ったのでしょうか…
皆さまご存じの通り、毎年その年を象徴する漢字が発表されていますが、
今回は検索データから「各月」を象徴する漢字を作り、2023年上半期はどんなことがあったのか振り返ってみたいと思います!
検索データから見る、2018年~2022年の漢字
まずは本当に出せる可能性があるのか、2018年~2022年を対象に各年の漢字を作って確認していきます。
今回は以下の条件で集計しました。
一言で言うと、「前年と比べて特徴的に検索されたキーワード」から漢字を抽出しています。
■定義詳細
対象とするキーワード
・集計時期の検索者数上位10,000キーワードを抽出
・昨年と比較して、特徴的な上位1,000キーワードを対象とする
ただし、人名、令和〇年・2022年といった各年に関する検索、昨年検索のないキーワード、弊社ポリシー上NGと判定したキーワード等は除外
・頻出しやすい漢字の影響を除くために、昨年と比較して非特徴的な上位のキーワードを比較対象とする
漢字の抽出方法
・漢字があるキーワードに絞り、漢字1文字ずつに、出現回数、比較対象での出現回数、検索人数合算を集計
・出現回数-比較対象での出現回数 → (同数の場合)検索人数合算の多い順 を見て1位の漢字をピックアップ
では結果はどうなったのか。こちらが抽出された2018年~2022年の各年の漢字です。
![](https://assets.st-note.com/img/1687840782650-q5J6NcPjuG.png?width=1200)
漢字が含まれたキーワード例を見てみると、
・2018年は春夏連覇の大阪桐蔭
・2019年は急激に注目された業務スーパー
![](https://assets.st-note.com/img/1687140466009-bmH646JTeq.png?width=1200)
・2020年はとにかく鬼滅の刃
・2021年は子宮頸がんワクチンの積極的干渉の再開
・そして2022年は新型コロナウイルスの本格流行
などが見られ、納得感は一定あると言えるではないでしょうか。
検索データから見る、2022年各月の漢字
では、これを月単位で見ることはできるのでしょうか?
試しに2022年の各月で出してみた結果がこちらです。
集計定義は基本先ほどと同じで、以下のみ変更しています。
・検索者数上位「10000キーワード」→「1000キーワード」
・特徴的な上位「1000キーワード」→「100キーワード」
・「昨年」と比較→「昨年同時期」
![](https://assets.st-note.com/img/1687840835878-HRViB9H4Tz.png?width=1200)
結果を見てまず感じたのは、新型コロナウイルス関連が1月,8月,11月と多く出て来ていることでした。
不安になり実際の新規陽性者数の推移と見比べてみると、7月は統一教会のニュースがあったため例外的に8月に現れていますが、大きく増加したタイミングときちんと一致していることが分かります。
![](https://assets.st-note.com/img/1687841869831-gnrhND4LNe.png?width=1200)
https://covid19.mhlw.go.jp/の「新規陽性者数の推移(日別)」データを基に自社作成
他のキーワードを見ると、スポーツの国際大会など各月に大きなトピックがある時は関連する漢字となっており、
それほど大きなトピックがない月は話題になった作品名などが出て来ていました。
検索データから見る、2023年上半期の各月の漢字
各月で見ても違和感ない様子が見えたので、いよいよ本題の2023年上半期を振り返ってみましょう。6月は15日までの結果を用いています。
結果はこうなりました!
![](https://assets.st-note.com/img/1687841932155-epLKkZYioa.png?width=1200)
1月は新型コロナウイルスが再流行したことで、また関連キーワードが挙がってきています。
2月と3月は同じ「大」となりました。しかし中身を見ると、
・2月は東日本大震災(トルコ・シリア地震の影響)
・3月はWBCでの伊藤大海さんや大勢さん
といったキーワードの違いが見られました。
![](https://assets.st-note.com/img/1687395564178-Ybgq9Ts35k.png?width=1200)
※検索ボリューム:日本全体でどれくらいの人がキーワードを検索しているかの推定値
4月は黄砂、5月は作品名が出てきており、2022年各月で見た傾向を踏まえると、月を代表するほど大きなトピックが無かったとも言えるかもしれません。
6月は15日までの結果になりますが「状」となりました。
こちらは線状降水帯の発生による大雨やヘルパンギーナの流行などが影響したようです。
![](https://assets.st-note.com/img/1687140932443-bGgE3WVjdS.png?width=1200)
『感染症発生動向調査(IDWR)』(国立感染症研究所)https://www.niid.go.jp/niid/images/idsc/idwr/IDWR2023/idwr2023-22.pdf (2023年6月19日に利用)
最後に
検索データを基に、漢字でこれまでを振り返ってみましたがいかがでしたか。
皆さんなら毎月をどんな漢字で表すでしょうか。考えながら日々過ごしてみるのも面白いかもしれません!
筆者プロフィール
小川 知紘(おがわ ともひろ)
2018年よりヤフー・データソリューションの立ち上げに従事。
現在はDS.ANALYSIS(オーダーメイドの課題解決サービス)にて、クライアントに対する分析企画・アナリスト業務を担当。
副業として、幼児教室の先生 と 事業会社でのデータ分析 を行う。
データ分析が身近に感じられるネタでnoteを投稿中。
twitterもやっています。ご連絡はこちらまで→@tomohogawa
他note記事→アナリストの分析日誌
※今回公開したデータを含め、ヤフー・データソリューションは、お客さまのデータを統計データとしたうえでデータの可視化や分析結果をご提供するサービスであり、個人を識別できるデータ (パーソナルデータ) については、お客さまから新たに同意をいただかない限り外部に提供することはありません
提供:アフロ
※本記事の内容は公開日時点の情報です。
この記事が気に入ったらサポートをしてみませんか?