見出し画像

1日1ファクトで徳を積む善行のススメ

教育スタートアップでデータまわりのお仕事をしている内藤と申します。
毎日膨大なデータの海の中で素敵なサムシングをよしなに何かできないか企みながら日々生きております。


これは何の話?

さてさて。LLMの台頭でデータサイエンティストは不要になるとかならないとか、そんな昨今の技術革新の荒波の中でなんとかChatGPTに仕事を奪われないように必死に生きているのですが、最近コツコツやってきた仕事がある程度の量たまってきました。

そんなわけで、そろそろいろんなことを忘れそうだし、未来の自分のため、あとはデータサイエンティストとか目指している人の参考のために、なんでやったのかとかやってどうだったのかを言語化してインターネットの世界に残しておこうと筆を執った次第です。

長いからざっくりまとめると

あとから見直したら長すぎるのでサマリー先に書いておきます

  • 毎日分析アウトプットしてみんなに共有するということを粛々とやったよ

  • その小さな分析の積み上げが社内にいろいろ良い変化を起こしたよ

  • 個人としてもプロダクトを完全に理解できた感を得られるのでとてもおすすめだよ

  • だからみんな徳を積むようにファクト積もう!

諸々の文脈やらを読みたい方は以下どうぞ

背景と課題

データの専門家として感じていた課題感

atama plus社に転職してからいろいろデータをみたり人と話したりしてみて以下に課題がありそうだなぁと個人的に思っていました。

  • 利用者や導入意思決定者が多様かつ複雑であるため、単純な指標では事業の状態を把握できない

  • 数字に基づいた会話・意思決定が少ない

  • プロダクトの仕様やメトリクスの因果関係が複雑で全体像が掴みづらい

  • 施策の効果検証プロセスが確立していない

データ屋の方々は何をハックするのかという考え方をすると思いますが、結局何を最大化すればいいのかがいろいろな人の話を聞いても全然見えないなぁという感じがありました。ミッションやビジョンのような抽象的な言葉ではなく、もう少し具体的に定量化できる指標として、一番今魂込めて爆上げしたい目的変数は一体なんなのかというシンプルな問いに対する答えが全社で揃い切っていない感覚があり、結構ずっと戸惑っていました。

ただこれはこの数年EdTech領域におけるデータの大海でもがいてきたから分かるのですが、これらの課題はそもそもビジネスの構造としてBtoBtoCで複雑であることや、CVRや売上といったようなわかりやすい成果指標を定義しづらいことなど、教育事業というドメイン特有の事情がかなり大きいと思います。また教育というのはおおよそ誰しもが何かしらの原体験があり、その各自の経験からくる思想や意見が入り混じっているため、どうしても定性的かつ主観的な話になりやすい傾向もあります。私もいろいろな事業領域に関わって仕事をしてきていますが、データ分析者として今まで経験してきたドメインの中で一番難しいと今でも感じています。

課題が明確なら自分で解決すればいいじゃない

データを知見にする

データはたくさんあるし、コンフルに情報もいろいろまとまっている。それにも関わらず、なんだか全体感がよくわからんという状態をとにかくなんとかしたいという感覚が個人的に強くありました。これらをクールでセクシーに解決できる銀の弾丸的なものを考えていたのですが、まぁそんなものは当然ないわけで、考えている暇があったらとにかく手を動かして単純に何かやろうと思い立ったわけです。

そこで何をするべきなのかを思案していたのですが、単なるデータや情報をナレッジやインサイトにしたらいいだけの話という結論に行き着きました。データをお仕事にしている人であればたぶん見たことある図のやつです。
一見複雑で理解するのが難しいような事象でも、一つ一つファクトを積み重ねてそれらの関係性を理解していけばいつか全体像が見えるようになるはず、単なるデータがナレッジとなり、インサイトに昇華し、最終的には真理にたどり着くはず、という楽観的な確信がありました。

というわけで、とにもかくにも社内における定量的に導出されたナレッジを自ら増やし、インサイト量を爆増させてデータドリブンカンパニーにしちゃえばみんなハッピー、ということになりました。

ファクトを積むといいことあるという話

それでは何をやったのかとういうと、やったことはとても単純です。
できるだけ毎日1つなんでもいいからファクトを出してSlackとNotionに貼る
たったそれだけです。データとか詳しくなくても誰でもできますね。
今まで出したファクトの全体像を出すと以下の感じです(重要情報も多分にあるのでモザイクかけてます)

ファクトはすべてNotionでデータベース化

一連のファクトたちはNotionのデータベースで一元管理しています。
このようにNotionはギャラリービューという機能で一覧化でき、検索も柔軟にできるため、なんだかポケモン図鑑のようで個人的にとても気に入ってます。

※このあたりのナレッジ管理方法についてもいろいろ悩みながらこの形に行き着いたので、また気力があればこの試行錯誤を紹介したいと思います。

一つ一つのファクトは以下のように、グラフが1枚、下に補足、観察、考察テキストというシンプルな構成でフォーマット化しています。

1つのファクトは必ずグラフ、観察、考察の3セット

いくつか続ける中でのコツみたいのはあるのですが、
①観察と考察を分けて書くこと
②当たり前に思える結果だとしても考察を必ず書くこと

この2点はこだわってきました。要は社内のより多くの人に興味をもってもらうためにはどうすればいいのかということを常に試行錯誤してきた感じです。

これを作る過程をもう少し具体的に書くと以下の感じです。

  1. みんなが注目しそうなネタを考える

  2. データ加工+可視化コードを書く(※コードはGithubで管理)

  3. 観察と考察を書く

  4. Slackに投稿+Notionに格納

  5. 余裕があればデータ基盤に反映してBQだけでも再現可能にする

慣れてきたらライトなものだと1個15分〜30分くらいで終わります。
最初はとりあえず100個のベーシックなファクトを出すところまでやるかくらいのノリでした。ただ100個にたどり着いてみると、さらに知りたいリサーチクエスチョンがどんどん生まれ、あれも調べておこうあれとあれの関係ってどうなってんねん、、、とやっていたらいつの間にか現在300個を超える大作になっているという状況です。

このデータサイエンティストとか関係なく誰にでもできそうなことの積み重ねなんですが、個人的に続けて来てよかったなと思う瞬間が多々ありまして、全人類及びビジネスマンに向けて、この善行をおすすめしていきたいと思っているわけです。

ファクトを積むと何かいいことある?

あまりこういうのは短期的な何かを求めず、とにかく粛々とやった先に幸せがあると思うので、具体的な成果を目的とするのはよくない気もしますが、これがよかったという推しポイントを書いておきます。

因果関係、相関関係のあたりが付くようになった

いくつもいくつもファクトを出していると当然ながらいろいろな数値感覚というものが身についてきます。まさに単なる情報がナレッジになりインサイトになっていくような感覚です。数値の規模感や関係性が頭の中で想像できるようになると、たとえばこの施策をやったらどうなるのか、このKPIに効く特徴量はどれか、みたいなことがなんとなくあたりがつくようになってきます。やってみるとわかりますが、このような解像度が上がっているような効果が業務をしているときに感じられるはずであり、これが特にデータサイエンティストにかかわらず様々な職種においておすすめしたい理由でもあります。

社内でデータドリブン度が高まった

最初はこの取り組みはほとんどの人に知られていなかったのですが、自社プロダクトに関する分析やグラフはビジネスチームも開発チームも職種に関係なく興味を持ってくれる人が多く、この活動が結構色々な人に注目してもらえるようになってきました。その結果、数年前は定性的な話が多かったところから、やっぱりちゃんと定量データを見よう、定量的に効果検証しようというムーブメントがそこかしこで起こってきており、確実にデータドリブンな会社になりつつあることを肌で感じています。自分でやった取り組みなので言うのはなんですが、これがデータ活用を促進する機運を作った部分は結構あるような気がしています(たぶん)。

データ基盤がぐんぐん育った

1つのファクトを出そうとすると、こんな基本的なファクト(ex. DAU/WAU/MAU)でも結構計算するのめんどうだなとかいろいろな発見があります。またSlackに投稿することでその反応から社内の興味所が見えるため、こんな簡単な数値でも結構みんな見たかったのか、知らなかったのかということもわかったりします。データ基盤におけるwarehouse層、mart層の設計のノウハウはいろいろありますが、とにもかくにもこういったニーズがあるもの、多くの人の分析において使用しそうな特徴量を、毎回クエリで計算しなくても良いようにテーブルを拡張していくことでいつのまにか結構なデータ基盤に育ちました。もともとwarehouse層のテーブルが10個もなかったところから現在は100以上にも増加しているため、確実にデータを分析する仕組みは整いました。

1つずつ確実に強くなっていく感覚が得られる

これは気持ち的な部分でもありますが、特にデータに関わる人にはこの施策の一番オススメしたいポイントかもしれません。データ界隈で周りを見渡すと、論文書いたり大勢の前で講演しているようなスーパーマンばかりが目に入ってきたり、因果推論やらLLMやらの知らない技術の話を全員知っているような感じだったりで、自分だけが取り残されているような感覚になる人もいるかもしれません。しかしながら、どんなにその日タスクが思い通りに進まなかったとしても、嫌なことがあったとしても、とにかく一つだけでも真理を解き明かすことができた、会社にコミットすることができたという小さな進捗は精神的にめちゃくちゃ安心感が得られます。またこれらの積み重ねが確実に自分自身が強くなっている成長実感にも繋がり、一石二鳥のお得感があります。

とどのつまり

さて、なんだか当たり前のようなことをつらつら書いてきましたが、もう一度3行まとめを再掲すると

  • 毎日分析アウトプットしてみんなに共有するということを粛々とやったよ

  • その小さな分析の積み上げが社内にいろいろ良い変化を起こしたよ

  • 個人としてもプロダクトを完全に理解できた感を得られるのでとてもおすすめだよ

という話でした。データドリブン組織の作り方みたいな本や記事はたくさん出ていますが、具体的に自社で何をどうすればいいのかわからないっていう方は、たとえ自分しかデータ人材がいないとしてもまず始めやすい取り組みかなと思います。

そしてとにもかくにも言いたかったのは、
どんな簡単なファクト1つでも、それをナレッジとして共有したら組織の貢献だよ、徳を積んでいるに等しいよ
ということです。

さぁみんなも明日からデータで徳を積もう!

※長くなるので割愛しましたが、分析する際には具体的にどんなことに気をつけたほうがいいのか、どのように再現性を担保して管理しているのか等々は、別記事で技術的な観点で書きたいと思います。

こぼれ話

300個目の記念ファクトをシェアしたら同僚から褒めをもらいました。「徳を積む」とは「心の筋トレ」だそうで、積極的にこの表現を使っていこうかと思います。(草がついているのはお気になさらず)

なぜかボディビルの応援風に褒めてくれる会社の方

この記事が気に入ったらサポートをしてみませんか?