見出し画像

エンジニアでなくても、データリテラシーがないと食べていけない説

筆者には専門的なバックグラウンドはないが、会社を経営している中であらためてデータを日常的に意思決定に活用することの重要性を痛感し学習してきて、社内への普及活動もしている。

かなり煽り的なタイトルになってしまったが、もとは、弊社でデータに関わるツールを普及しようとしていて、
「そもそもなんでデータ・ツール(SQL等)を学ぶ必要があるのか?」
「そこはエンジニアがやった方が効率がいいのでは」
「ツールの学習は手段であって、データを活用した業務が目的なのに、SQLの学習に時間をかけるのは手段の目的化ではないか?」

などの声があり、あらためて考え直す契機になったので、書くことにした。

データと意思決定の欠かせない両輪

経営は、「企業体として(個人であっても同様)目標に向かい、継続的・計画的に、現在ある資源を最大限に活用する意思決定を行っていくこと」からなる。言い換えれば、打てる手数(限られた時間あたりの試行回数、ヒト・モノ・カネなどのリソースによって限定される)の中で、最大限の効用をもたらすように正しい選択をしていくことだ。

これだと抽象的で当たり前のことしか言ってないように感じるので、例えを導入する。例として簡単にしたあるゲームを仮定したい。

赤い玉白い玉が混じって入った袋が100袋ある(1袋に10個以上入っているが、個数や比率は袋によって違う)5人が1チームで、全員が30ターンの間毎ターン袋に手を入れて(見てはいけない)1つずつ玉をとることができる。ただし取った玉は戻せず、合計で取っていい玉は100個まで(実際にはカネやモノなどのリソースにより限定される数値だと想像してほしい)全部で20チームで争い、終わったときに、赤い玉をより多く持っていたチームが勝つ。

と、こういう感じならわかりやすいだろうか。赤い玉の存在(目標)という不確実性に対して、いかに限られたリソースでマネージしていくかという例えで、簡単そうで意外と難しい(示唆深い)と思う。

とりあえず多くのチームは初めのターンはいくつかの袋から玉を取ってみて、袋ごとの比率やその分布を理解しようとしてみる。赤い玉の多く出る袋が見つかったら、その袋に集中して取ればいい。
また、このルールの上では5*30=150個だが、100個までしか取れないので、いい袋が見つかるまでは5個フルには取らないで節約することもできる。
あるいは取った玉の色はわからずとも、他のチームがどの袋を選んだのかはわかるので、他のチームの様子を観察することもできる。ただ、よさそうな袋の中身は先になくなってしまうかもしれない。

全体の戦略を立てる上では、袋に入っている赤い玉の割合の確率分布がかなり肝になる。もし、赤白を1/2の確率で1個ずつ袋に詰めてあるとしたら、各袋の赤の割合の確率分布は二項分布になるし、袋に入れる全体の個数に対して完全ランダムで充填する赤の個数を決めているとしたら確率分布は平坦になる。

真の分布はゲームプレイヤーにはわからないが、だいたい二項分布とわかればどの袋からとってもあまり変わらないので、なくなる前にできるだけ多く取れるだけ取ればいい。(現実にはチーム人数も違うゆえ、人数が多ければ勝てる労働・資本集約的な市場)逆に、平坦だったり山が二つに割れているような分散の大きい分布だとするなら(より不確実性の高い市場)慎重に確かめた方がいい。このようなことをしっかり観測しながら、チームの動きをマッピングしていく=経営していく必要がある。

他にも現実世界をよりよく表すために、それらしいルールを導入してみる。

もしエリアごとにその分布が違うとしたら
簡単に赤が取れるエリアの袋からはすぐに玉がなくなり、「一見白が多いエリアだが局所的に赤ばかりの袋がある」など難しい場所は敬遠されるが、そこで赤を取る方法論があれば、そのチームは優位になる。
→不確実性の高い市場(例えばスタートアップ)で勝つにはより戦略が重要
5ターンごとに赤い玉の数で着順ボーナスがある
現実には市場シェアの順位は高いほど優位になる。少しでも先に他のチームより多く取ることがその後に大きな差になって効いてくるとすると、戦略が変わってくる。
→市場の状況がわからなくても突っ込めば先行者優位を得られるかも
もし2ターン使って1人で3個取れるルールがあるなら
チーム内で一度持って帰れば他の人が取った色の把握と戦略の練り直しができる。しかしこんなルールがあり、個々の判断で取っていいとするならどうだろう。個々が全体の戦略に理解があり、取るか取らないか、あるいは周りの状況を見て判断するなどが出来れば、より多くの玉を取れる分有利になる。但し、戦略を勘違いしていると無駄に枠を使い損をしてしまう。
→各自が戦略を定量・定性的に理解し、自ら判断できることが重要
赤い玉と白い玉を判別するのが難しいとすると
例えば、もし全ての玉が何かで包まれていて、すぐに赤か白かわからず、各チームに1人の限られた人しかそれを剥がして見分けられないとする。但し他の人も5ターン取りに行かず待機することで剥がすスキルを習得できるとする。
→スキルに先行投資することで各自の判断能力・生産性が上がる

当然、現実はこれよりも遥かに複雑だ。玉の色も無数にあり、どの色の価値が高いかもわからず、チームの人数も全く違う。玉の価値を見分ける目を持つ人もいれば、1ターンで玉を大量に持って帰れる人もいる。市場によっては、人海戦術で勝てる「かもしれない」が、そういう市場があるかもわからない。

いずれにせよ、与えられたチームと状況で少しでも勝ちに近づくためには、より多くの構成員がータ(統計・確率・モデル)を利用して不確実性を的確に把握し、それに対して戦略的に意思決定していくべきだということは間違いないだろう。

データ普及による意思決定のレベルアップ

ここまで長々と例えてきたが、改めて我々が今生きている時代、自分が今力を注いでいる会社の話をしたい。

現代の人類の進歩は、「情報技術」がドライバーになっている。

昔なら玉の色も、どの袋もいいからとにかく持って帰れというような戦略でも通用したかもしれない(例えば産業革命からのモノの製造などが人類の進歩のドライバーになっていた時代)が、今はそうではなくなっている。
情報量・流通速度の飛躍的な進歩は、より大きな価値の偏りを生み、それらを戦略的に活用できることによって、人々の生産性の格差があらわになった。例え少人数のチームでも、市場(エリア)によっては価値の高い玉に絞り戦略的に探索することでものすごい成果をあげられるようになり、そうでないチームは淘汰されていく時代になった。

筆者は今「スタートアップ」で仕事をしている
カテゴリとしても不確実性が高い領域で、各自の力が成果に直結しやすいエリア・状況であると思っている。
また、別にスタートアップにいない人の戦略で成果が左右されないとは思っていない。あくまで相対的な話であり、すべての人に市場と可能性は開かれており、当然不確実性も遍く存在する。

なので当然チームのメンバーには、戦略を理解していてほしいし、玉を効率よく取れるなら各個単独行動してほしいし、赤と白(玉の価値)をしっかり見分けるリテラシーがあってほしいと考えている。それも、チームのメンバーに限らず、世の中のより多くの人がそうある方がベターだと思う。
もちろん、世の中仕事や成果がすべてじゃないし、そうしたものに影響されず幸福を追求する自由もある。ただ、広義での仕事が人類の進歩・繁栄・幸福を支えてきたし、個々がものごとをしっかりと把握して意思決定し、生産性を高める努力をしていくことはよいことだと考えている。競争は激しくなるかもしれないが、人類は一つのチームだ。

では、どうデータを学ぶべきか

ものすごく話を広げてしまったが、データを学ぶ重要性はここまで述べてきたような内容に集約されると考えている。それでは、実際にどうやってデータを学び活用するべきかを書いていきたい。

実地訓練

まず、実地訓練。当然かつ単純だが、一番役に立つのは実際に仕事の中で試行錯誤しながら、データを活用し戦略的に振舞うことだと思う。

全体の戦略を練るのはチーム単位で補いながらやるのが効率がいいが、少なくとも数ターンは赤か白か見分けながらいくつか玉を取ってくるように、つまり各自で単独行動できる方がより生産性が高まる。

例えば弊社のように、toCサービスの運営をするスタートアップであれば、サービスのユーザー流入やリテンションなどの重要KPIはもちろんそうだが、より細かくあげると、

・今行っている施策・新機能追加などはどれくらいの割合のユーザーが使っていて、それが高いのか低いのか。
・低いとしたらそのデモグラを調べて、使ってない人に刺さるためにはどういうペルソナを想定すればいいのか。
・すでに存在する機能の使われ方(その機能のUUの割合や継続率・ファネル)はどうなっているのか調べたうえで新しい施策を考える。
などなど、、、

卓越したサービスは例外なくそういった細かい意思決定の積み重ねに支えられている。

日々の意思決定のサイクルをスピーディに回すには「チームはどういう戦略を取っていて、自分はこう動くべき」「今取っている玉が赤いのか白いのか、それは価値があるのか」を全員が理解すべきだ。そのためにはユーザーデータに限らず、セールス=売上・マーケ=獲得などさまざまな投資活動を定量・定性面からリアルタイムに各自で分析し、そしてそれを次のターンの意思決定に繋げねばならない。「玉の色と価値を確認する為だけにチームメンバーに頼んで2ターン時間を取って」とやっているとスピードで遅れを取ってしまう。

弊社の場合

業界や事業内容にも寄るだろうが、弊社の場合は、戦略は全員で把握して、データに関わるツールは全員(といわずとも、大半の人=たとえば、エンジニア以外の職種でも3,4割は)使える、くらいが理想だと考えている。

実際に活用できるように、弊社では、Redashを全社員向けに公開し、様々なサービスに関するデータをオープンにしている。
また、SQLとサービスのデータに関する勉強会を定期的に行い、レベル別のテスト(redashを使いSQLを書いて実際に活用するテスト)に受かるとエンジニア以外の職種では月5000〜20000円のインセンティブを用意している(エンジニアは全員受かって当然)。当然、勉強することで業務上それ以上の付加価値を出してもらえると考えているからである。

実際に、レベル別テストの合格者(現在はデザイナー全員と、ディレクター1人でまだまだ増える予定)のパフォーマンスは例外なく高く、新機能のリサーチやちょっとした数値検証(特定のページを見てる人のデモグラと行動とか、新しい機能のUUや継続率とか)なら1人でやってくれる。

マーケティングやセールス関連でも、直近獲得のユーザーの行動や、お取引させていただいているブランド様の関連数値をインスタントに調べ、行動(クリエイティブや訴求の調整だったり、コミュニケーション内容だったり)に反映できればかなり費用対効果はいいと思うので、是非それら職種のメンバーにもどんどん合格者を出していきたい。
サービスとの距離が近いところで仕事をしているほど、このあたりのリテラシー不足は長期的にじわじわと成果を蝕む。
リテラシーやツールがあるだけですぐにできる/簡単にキャッシュしておける程度のデータ処理をするための単純作業を繰り返し、生産性は上がらず、各々意思決定の精度は落ちる。スキルがないことが社内で評価されないなどという小さな話ではなく、会社としての競争力がなくなってしまうという話だ。

その他弊社が行っている文化面での施策や努力は以下を参考にされたい

データ/ツール/SQL初学者のためにおすすめのサービスやツール

Progate
https://prog-8.com/
のSQL講座はわかりやすくよくできている。運営会社も非常にユーザーフレンドリーで尊敬している会社だ。

SQLZOO

最近話題になっていた「SQLZOO」英語だが、そこそこしっかり基礎を演習含みで学べる良サイト。

Redash

これは1人で初学者が使うものではないが、データベースと接続し、簡単にGUIで分析をかけられるツール。複数のデータソースにつなげる汎用性と、シンプルでわかりやすいUIで非常におすすめ。他のツールの導入検討もしたことはあるが、安い上にわかりやすいので、最初はこれで十分と思う。

Python(jupyter-notebook)/R

より進んだデータの分析をしたり、予測モデルを作ったりするためにはSQLのみでの簡単な分析では事足りなくなってくるので、pythonを使うといい。

googleのcolaboratoryはクラウドでjupyterを使ってデータ分析をできるリソースだ。実際の分析方法は様々なところの講座などを探してみるか、ライブラリのドキュメント(や論文)を読むか、周りの詳しい人に教えてもらうか、はたまたkaggle(参加とまではいかずとも)のコンペのデータをみるなどするといい。

Rは筆者は使っていないが、pythonよりもエンジニア以外にフレンドリーで、そこそこ活用できる印象があるので参考まで。

書籍

ここまでに述べた、世の中と情報・統計・データについて学ぶために参考になる(近年話題になった)書籍をいくつか並べておく。

西内啓著「統計学が最強の学問である」先に述べたゲームの仮定などを理解する一助になる(かもしれない)、統計の基礎的な話と有用性について書いてある。煽りっぽいタイトルで内容についても賛否両論あるが、初学者としては参考になった。より進んだ話は大学の基本的な統計の教科書などを参考にするとよいかもしれない。

ハンス・ロスリング著「FACTFULNESS」観測されたデータから、世の中をより確からしく把握できるようになった。その有用さと、如何すれば「正しく」世界を観測・把握できるかについての示唆となるよい書だと思う。

スティーブン・ピンカー著「21世紀の啓蒙」少しジャンルは離れるが、科学技術が人類の進歩に貢献し、世界が実際によりよい方向に向かっているということをデータから語り、その中で人類がどう方向付けをし、どう生きていくべきかについて書かれている。

中でもさらに一歩進んで「不確実性」にフォーカスし、どう振舞うべきかの示唆を与える内容になっているのがこのナシーム・ニコラス・タレブ著「身銭を切れ」や、「反脆弱性」などのシリーズ。本筋とは関係ないが、タレブ氏はピンカー氏を批判しているようだ。

さいごに

ただ、

「データに関するリテラシーを身に付けることは、遍く重要である」

ということを言いたいがためにかなり長文を書いたが、中身は参考になると思っている。何かしらのためになれば幸いである。

あと、弊社に興味がある、データに自信ニキがいたら是非ご連絡ください。私が直接弊社について説明・面談させていただきます。

この記事が気に入ったら、サポートをしてみませんか?気軽にクリエイターを支援できます。

211
株)AppBrew代表取締役 / 東京大学工学部中退 / エンジニア(https://github.com/yfuka86) / 社会におけるあらゆるインタラクションを科学して、新しい流れを生み出したい。https://twitter.com/yfuka86
コメント (1)
ファクトフルネスやベイズ統計など、最近の騒動を見ると、数学的な教育が大切であると感じます。中央値と平均値のような初歩的なことも理解してない人が多いですし、世界中で基礎的な数学、そして正しい情報を取得するための英語力が必要な時代だと感じます。
コメントを投稿するには、 ログイン または 会員登録 をする必要があります。