見出し画像

社内slackの流行語があまりにも感染症っぽかったので、フィッティングしてしまいました...

こんにちは、imaimaiです。

自粛生活が始まって2ヶ月ほど経ちました。我が社iSTCでもリモートワークは継続中で、リモートワークを快適に遂行すべくいろいろな取り組みをしてきました。だいぶ進化したと思います。中には業務と(一見)無関係と思われる独自の進化をslackが遂げ始め、その内容は前回のnoteで書いた次第です。

さて、このnoteでも書いてあるように、私は社内活性化の一環として、slackのリアクションランキングを毎日つけていました。その中で「ッス」というリアクションが大流行してやべぇ。というところまでが前回のお話。

画像3

しかし、GWが明けた頃、私はある異変に気づくのです。

「あれ?"ッス"・・・使われなくなったな...」

そう、空前の「ッス」ブームが収まってしまったのです。

爆発的な増加
時間とともに徐々に収束

・・・あれ、これは「感染症の流行と同じではないか?」と、ふと思ったのです。奇しくも最近では「感染症モデル」を使ったコロナ対策が一定の効果をあげ、広く認知されるようになりましたね。というわけで、「ッス」ブームを感染症モデルで捉え直してみました。

社内slackリアクションの分析(全体)

まず、このリモートワーク中に社内のslackでどのようなリアクションが使われているかを収集しました。適当にAPIを叩いて、4/1からのリアクション累計TOP100を並べた結果がコチラ!

画像1

割ときれいなベキ則が成り立っていました。実はこういうのはジップの法則と言って、多くの言語でこのような分布が成り立つことが知られています。我々は法則の上で踊らされている...?

そして、やはり「ッス」が、抜きん出ていますね。その風格、まさに"王"。

時系列を追うと・・・

しかし、そのリアクションも、時系列を追っていくとあることが判明します

画像2

急激に一大ムーブメントを築いた後、徐々に流行は収束していくのです!パンデミックが起こり、その後回復に向かっていく、、、これはもう感染症と同じと言ってもよいでしょう!

感染症モデルとは

感染症モデル、実はかなり歴史のある数理モデルです。最もシンプルなSIRモデルでは、人の状態を下図の様に3種類に分け、各状態へ移り変わる様子を数式で表現します。

画像4

このSIRのアナロジーとして、次のようなイメージを持ってもらうと良いかなと思います。(人数じゃなく割合なので、少し強引なところはありますが...)

S : まだ「ッス」にしっくり来ていないが今後使い始める可能性がある割合
I  : 「ッス」に感染し、使いまくっている割合
R : 「ッス」に飽きた割合

加えて、「一定数、ずっと使い続けるだろう」という仮定を置き、今回は下図のように、SIRモデルに、R'の中で完全に飽きた人と、定着した人(感染症でいう死亡のアナロジー?)を分けるようなパラメータαを入れることで、実際の現象に近づけられないかと試してみました。

画像6

モデルを実際にフィッティングさせる

さて、使うモデルが決まったので、いよいよ現実のグラフとフィッティングさせます。slackモデルでのパラメータであるα, β, γをうまく設定し、現実に近いモデルにしていきたいのです。

このようなパラメータの探索は、全部調べているとキリがないので、賢く探索する方法が色々と知られています。今回は、Optunaを使って最適なパラメータを探索してみました。流行りのベイズ最適化ですね!パラメータと評価関数を設定するだけで、あとはよしなにやってくれるので、めちゃくちゃ良いですね。実際の実装をgithubにあげておきました(間違っていたらコッソリ教えて下さい)

実際のフィッティングを行った結果のグラフがコチラ

画像5

かなりうまく表現ができている気がします!

パラメータを少し眺める

さて、フィッティングしたモデルのパラメータを眺めてみると、次のようなことが考えられます。

☑ 1時間に健全な人たちの中で14%の人が「ッス」を使い始める(βより)
☑ 25時間くらいで強烈なブームへの飽きがはじまる。(1/γより)
☑ 一方で9.6%は定着し、これからも使われ続ける。(αより)

未だに毎日、総リアクションの10%を占めていることから考えても、「ッス」はオワコンに見えて、実は一大ブームの後、オレたちの心に定着したのかもしれません・・・

まとめ

今回はこんな感じでシンプルな感染症モデルを使って現象を捉え直してみました。こうやって、パラメータから現象を考えることができるのが、数理モデルの好きな点です。数理モデルは、パラメータが少ないと表現力が足りない場合もありますが、うまくハマると現象をスッキリと解釈することができます。今回のコロナの予測などではSI(E)Rモデルによる予測から導かれた施策がある程度うまくハマったのではないかと思っています。機械学習のようなデータから外挿して予測を行うアプローチも面白く、また一定の成功を収めていますが、このように現象を観察し、モデルに落とし込んでそれがハマったときの気持ちよさは格別なのでオススメです!

次なる流行は・・・?

さて、「ッス」は定着したと言えど、一時期のブームは過ぎ去りました。しかし、iSTCには次なるブームが来ています。こちらをどうぞ・・・

プレゼンテーション2

・・・。

画像8

ではではっ

サポートいただけると励みになります! よろしくおねがいします!!