見出し画像

統計・データ分析を1,500名に語った講師が自分の本の売上を統計・データ分析で予想したお話

自己紹介

こんにちは表と申します。普段はミツカリというHRTechのSaaS企業を経営しています。仕事柄お客様のデータを分析することも多く、統計の学びを深め、学ぶために講師などもやっているなかで1,500名以上の方に講師として語っております。ストアカさんの教室ページはこちらです。(ストアカさんだけで累計1,077名ありがたいっす)

本を出すことになりました

ありがたい機会を頂き、本を出すことになりました。

ゴリラ部長が教えてくれた統計の超入門

略して

#ゴリラ統計

です。

予約開始当初はECサイトのビジネス経済というかなり大きなカテゴリーで新着ランキング3位を頂くなどしております。2021/11/17現在は落ち着いて全体で数千位台です。

コミュニティメンバーからのささやき

私の統計講座を受けてくださった方達のFBグループを作っていて、時折統計に関してのネタなどをポストしたりしております。現在400名を超える方が入っているグループ。そのメンバーの方からこんなご依頼が!

スクリーンショット 2021-11-17 22.08.04

いつも

身近なお題で統計を好きになってもらう

と言い続けてきた自分のブーメランが自分に突き刺さる形となり、自分の本の売上を予測すると言う外れたら自分の分析能力の無さを示し、当たっても誰も特にならないまさに誰得分析をやってみることにしました。

分析の目的は?

特に統計の入門コースや準備コースでは

分析するのに一番大切なのは(手法なんかより)分析の目的です!

と言いまくっているので分析の目的を考えてみました。

スクリーンショット 2021-11-17 22.18.00

(ゴリラ統計本より抜粋)

今回どれくらい本が売れるか?を予測し、結果が出てきたとします。そこに繋がって自分が行えるアクションを考えることが超重要。結局数値がでてもアクションができなかったら徒労に終わることもあるので。

(例:配属でこの組み合わせがよい!とわかっても引っ越しを伴う異動ができない社員の方が多くて徒労に終わったことがありました涙)

ここで考えられるアクションは、、

予測した数値がすごく少なかった場合本を書くのをやめる

というものが一番最初に思い浮かびました。が、なんと、

もう書いてもうてるやないかーーーい!!!!(エセ関西弁)

ということで後戻りはできないので、

目的:身近な事例で分析することプロセスをお見せすることで分析の面白さをしってもらう(よかったら本も買ってね)

おまけ目的:めっちゃ売れそうなら編集者の人に早めの増刷を匂わす

こちらを目的に分析してみようと思います!

1つじゃ不安だから4つくらいはやってみよう!

需要予測の神であり、私が尊敬して病まず私にとっての、スティーブ・ジョブズにとってのプラトンのような存在、つまり会ってランチできるならなんでもやるよ!という人であるのが森岡毅さんです。(ご参考: https://www.a-inquiry.com/ijin3261/)

森岡さんが書かれた私個人的には人類史上最強の本である

確率思考の戦略論

にこんな一節があります。

現実は、昆虫のように複眼でみる(P209)

つまり1つの手法や分析でなく、いくつかの手法で予測をたてて落とし所を探していくという話です(森岡さん、熱い、熱すぎる!最高の本なので是非読んでください)。

そこで考えたのが

①ガンマポアソンリーセンシーモデルを使った予測モデルによる需要予測

②積み上げた類似の本のデータを使った需要予測

③自分のSNSや講義の受講生数などからの予想(ちょっとざっくり)

④経験による予測

の4つのやり方です。①②③は市場、競合、自社という3Cの観点を無理やり織り込みました

前提

ここで少し前提を考えたいです。

まずは期間に関してです。この後でも述べますが統計に関する書籍は息が長く売れる可能性があり、私の本もそうなって欲しいと言う願いを込めて書いています。それゆえここから2年間でどれくらい売れるのか?という視点で考えます。

次に統計を学ぶことに関する市場に関してです。なんか伸びてそうだなと思いませんかね。統計ってよく聞くようになっているし、猫も杓子もデータデータと。

これを端的に表しているのではないかというのがこちらのデータです。統計検定という統計の検定が2011年から開始されています。私も受けたことがありまして、2級なので受かりました(ほっ)。こちらの受験数のデータをみるとある程度綺麗な右肩上がりのグラフとなっています。(2021年6月はおそらく新型コロナウィルスの特殊要因で大規模会場受験が難しいなどの理由で大きく減っていますがこちらは除外します。)

スクリーンショット 2021-11-17 22.35.38

データ分析を考える上で前提をやんわり抑えておくことは非常に重要かと思います。こちらのデータをみて言えることは

統計を学ぶ人は基本的に増える方向で、急激に減ることはない

ということなのかなと思っています。

次に大体どれくらい統計の本は売れているのか?というものです。ここで確率統計の売れ筋ランキングをチェック。

(ランキングは変動しますが上位には統計検定関連の本があります。なので統計検定と本の市場は関係があると言えそうです。)

この中の上位のマンガでわかる統計学をみてみると

1600位程度です(11/17日現在)

次に上位の統計学入門をみてみると

1700位程度です。

この2つの例から言えそうなことは

①統計カテゴリーで1位を取るには大体1500-2000位になる必要がある

②統計の内容や学びへのニーズ自体は大きく変化していく旬があるものではないので一度しっかり定着すると長く売れ続ける(#1と#3の2つの本はそれぞれ2012年と2006年に発売)

③マンガでわかる統計学が発売から10年で8万部なので2年で2万部売れるというのが1つの上限の目安になる

になるのかなと。

データ分析(特に実務に活かしている自分の立場からみると)の基本はこのように

数字を見てできる限り数え範囲を絞り込んでいくこと

だと思っています。

①ガンマポアソンリーセンシーモデルによる需要予測

モデル名が長いので略してGPRモデルとします。こちらの凄さに関しては前述の確率思考の戦略論をご覧いただければと思います。一緒に学びたい方はこちらで講義もしておりますので割愛します。

一言で言うと

最近いつ最後にXXしましたか?というアンケートをすることでその割合から市場構造が把握できる

という魔法がこのモデルからは可能です。もちろん活用していくと注意点や、それって本当なの(K一定という仮定ってどれくらい成り立つんだろうかとか)という点はあるのですが、それでもパワフルなモデルであることは間違い無いと思っています。

スクリーンショット 2021-11-17 22.58.24

(講義内のスライドより)

アンケートも本来は抽出方法をきちんとやるべきなのですが簡易的に表のツイッターでのアンケート機能で結果をあつめました。N=107です。

スクリーンショット 2021-11-17 22.59.27

統計に興味がある人の人数推定は少し難しいのですが、統計検定を受験された方が5年間で約5万人程度。Amazonでも統計検定関連の本が売れていることからその5倍程度学びたい人がいると想定して、興味がある潜在的に統計の本を買おうと思っている層を25万人を市場全体としました。

このままGPRモデルに入れて計算をすると

スクリーンショット 2021-11-18 12.59.50

17万冊くらいが市場全体で、トップが10%のシェアだとすると年間1.7万冊。ちょっと多いかなと感じます。

モデルの結果が多くなった理由を考えるとアンケートの結果には大きなバイアスがあります。表が11/6ごろから統計の本を宣伝しているTwitterアカウントでアンケートを取っているので。そのため7日以内の割合5%と8-14日以内の割合の2.5%をそれより前のグループに入れる、超ざっくりなアジャストを行います。

そうすると期間別の浸透率Pnは上の7日以内から

スクリーンショット 2021-11-18 13.05.26

となります。

以上のデータを活かしてモデルを走らせると、

スクリーンショット 2021-11-18 13.04.25

計算結果がこちら。

市場全体で売れる予想数=合計購買数は年間で10.5万冊。トップの本になればざっくりこの10%程度の冊数で1万冊程度/年の販売を狙えるのかなと想定します。2年で2万冊の上限にもなんとなく近いです。また3位の統計学入門もAmazonの売れ筋ランキングは大きくは変わらないので3位までに入り続けられれば2年で2万部というのは見えてくるのかもしれません。

ここまでの結論ですが

潜在層が25万人と仮定すると、どんなに売れても2年で3.5万冊程度。2万冊いけばヒットと言えそうな市場である

とします。

②積み上げた類似の本のデータを使った需要予測

私に本を書くきっかけをくれて同じ出版社&編集者さんで書かれた松上さんんこちらの本。

資料作成でいうと多くの人が目にしたであろう、こちらの本は現在発売から2年10ヶ月で8刷なので4万部ほど売れていると想定します。全体の順位は3,586位。こちらの本が対象としているパワポの作成のように中長期で大きくは変わらない領域で、定番として困ったらまずは手に取ってもらえるような本になっていって欲しいという思いもこめて

シナリオ①

発売当初100位台→1ヶ月間は1000位→その後2000位→最後5000位と推移

シナリオ②

発売当初300位台→1ヶ月間は2000位→その後5000位→最後8000位と推移

した場合の2つのシナリオでざっくり販売数を2年間で試算してみました。

ちなみに100位台で1ヶ月に売れる札数が2500冊、300位台で1200冊、1000位台で600冊、2000位台で450冊、4000位台で350冊、5000位台で200冊、8000位台で80冊としました(こちらは編集者さんの現場の感覚と他の方の書籍販売数から予想数を作成)。

スクリーンショット 2021-11-18 15.26.20

結果がこちら。理想的なシナリオで2年で1万冊。ベースケースだと2年で5200冊。こちらはAmazonのみでの売り上げで、表の場合Amazonの割合が多いと想定し、こちらの冊数の倍程度が売上となるのかなと思ってます。

ただ前提の②で定義した

定着すると長く淡々と売れることが多い特徴

を鑑みても、平均からのばらつきである標準偏差はあまり大きくならないのかなと想像していて、95%の確率でどれくらいの売り上げになるかに関しては

いいシナリオで約18,000-22,000冊程度が2標準偏差分

ベースシナリオで約9,500冊-11,000冊が2標準偏差分

になりそんなの大きくは上下しないのかなと考察しています。

スクリーンショット 2021-11-18 13.24.54

(ゴリラ統計本より抜粋)

③自分のSNSや講義の受講生数などからの予想

表のTwitterはフォロワー数が現在約2,600名

FBの友人が約3,300名です。

スクリーンショット 2021-11-19 11.58.15

またストアカさんを中心とした講義の受講生が1,500名。重複はもちろんあるのですが、合計すると約7,400名。

本の初回の投稿に対していただいたいいね(感謝でございます)が350程度でそれ以外にも今回の本関連の投稿で406越えのいいねもあり、買いましたという温かいコメントもすでに150件越え(ご予約いただいた皆様本当にありがとうございます!)。

いいね!などのエンゲージメント数/FBの友達数の406/3303=12% から推測すると12%の方が初月に買ってくださると仮定すると888冊、更にその方が別の方におすすめ頂けたとして拡散があったとして、初月の売り上げを1,500冊と予想します。

NBDモデルのM=1 K=1の時のように、1,500冊をスタートに最初2ヶ月は半減、その後1年間は10%づつ減っていき、後は毎月60冊(twitterのフォロワー数が平均的に増える量で仮定)売れていく形で仮定しました。

スクリーンショット 2021-11-19 8.49.39

こちらだと2年で5,500冊程度となります。

④経験による予測

経験と直感も大切だと思っており、編集者さんの予測もメッセージでいただけました。1.1万部予想!さてどれが正解となるのでしょうか?

画像15

まとめ

・2年で3万冊を超えることはほぼなく、すごく売れると2万冊、普通シナリオだと1万冊程度売れる(といいな🤲)、少ないと6,000冊程度

・「統計を学ぶ第一歩の本」として定着するいい本になれば2年後以降も細く長く売れる(もちろん他に素晴らしい本が出てくる可能性はたくさんあるのでそんな甘くはない!)

ということになりそうです。わかりやすくて手が動く統計学習の定番になってくれたら、少しでも統計分析しようって思ってくれる人が増えてくれたら、本当にこれ以上嬉しいことはありません。

蓋を開けてみたら大外しして恥ずかしいかもしれませんが、1年後に答え合わせのnoteも出します。

最後に宣伝させてください🙇‍♀️

今日書いてきた分析の基礎固めにご興味あれば

まずはこちらの本を読んでみてください!

さらにマニアックな世界をご所望でしたら

に遊びにきていただけたら嬉しいです!

最後までお読みいただきありがとうございました!

自己分析、教育、自己啓発などの情報を引き続き発信していきますので、気に入っていただけたら是非是非サポートいただけたら嬉しいです!