見出し画像

データ解釈学本を書いた話

こんにちは、江崎です。大変ありがたいことにご好評いただいている、『分析者のためのデータ解釈学入門』(ソシム)の著者です。今回は、この本ができあがった経緯、どういうことを考えて作られた本なのかを紹介してみたいと思います。ただ、思いつくままに言いたいことを取り留めもなく書くだけですので、その点ご容赦頂ければ幸いです。

ちなみに、前作『データ分析のための数理モデル入門』(ソシム)の執筆に関する裏話やこだわりポイントは以前書いていますのでよろしければこちらもどうぞ:


本書を書くことになったきっかけ

前作の数理モデル本が売れ行き好調とのことで、出版社さんの方から次なにか書きませんか?というオファーを頂いたことが始まりです。実は、これらの本の前から10年近く温めている激アツテーマがあるのですが(未だにどういう形にするのが正解か全然わからない)、今度はそれを書かせてもらおうかなと思って色々検討し始めました。余談ですが、出版社さんから著者に「こういうテーマで書けませんか?」というオファーがあった場合、ある程度ニーズがあるとの見立てがある状態であることが多いので比較的スムーズにいくようですが、(全く新しい本を書きたい)著者の方から「このテーマ面白いと思うんです」と提案して書かせてもらうには結構信頼関係がいるようです(そういって全然売れないケースが沢山あるらしいので、ほんまかいな、となる)。

その温めていたテーマの具体化を考えていくと、どうしてもその前に一段、「データの扱いに関する一般論」みたいなテーマの本が欲しくなるなと思い至りました。これが、本書、『データ解釈学入門』の原型となります。当初、今よりももっとビジネスマン向けのキャッチ―でポップな企画を考えていました(温めていたテーマとの二冊でシリーズになる感じ)。しかし、編集者さんとの議論の中で、寧ろ、数理モデル入門とのシリーズになる感じで少しレベルを(ビジネスマン向けより)専門向けにしたほうがいいのではないかという結論に至ります。そうこうしてこの企画がスタートしました。

企画を考えるときに考えたこと

まず、数理モデル入門の二匹目のドジョウを狙うような企画(例えば『数理モデル入門実践編』とか)は面白くないので、なにか別のもっとインパクトがある企画にしたいと考えました。

『数理モデル入門』で敢えてほとんど触れなかったのがデータの扱い(バイアスなど)や(普通の)統計的検定などに関する話題です。特にデータそのものの性質に関する話題、どういうときにどういうバイアスが載るのか、サンプリングをどう考えればいいのか等々、に関してはきちんと説明がある入門書は意外に少ないのではないかと思い至りました。「データサイエンス」の本は沢山出ていますが、データの料理の仕方ばかりにスポットライトが当たっていて、データそのもの(=食材)に関する話が特に入門レベルで意外にすっぽり抜けている気が(私の非常に狭い視野の範囲では)しています。そこで、そういういった部分を綺麗にまとめつつ、また、同時に実務的に必要なデータの取扱いやそもそもの分析の目標設定の仕方、データ分析が引き起こしうる問題などにも幅広く触れた「真のデータ分析の入門書」となるものが作れたら面白いのではないか、というのが本書のコンセプトとなりました。

タイトルについて

本書のタイトルは企画段階では『データ分析のための基礎教養読本
~本質をとらえた分析のために~』でした。これは編集者さんの方から、もっとパンチの効いたタイトルが出せるのではないかとお題を頂いて、後に変更することになります。色々考えた結果、上記に説明したような、「データから背後にある対象の情報を引き出して利用する」という、「ただの分析の手続き」よりもメタな視点で基礎事項を解説する、ということで「解釈」というワードを使わせてもらい、「データ解釈学」という造語にしました。(「データ解釈学」と書くとややいかめしい、深い話を期待されてタイトル詐欺のようになってしまう懸念もないわけではなかったですが。)これに関連してAmazonに素晴らしいレビューを書いてくださった方(無気力 様)がいらっしゃるので一部紹介させて頂きたいと思います(全文は商品ページのレビューのトップに表示されていますのでご覧ください)。

第一部は「データの性質に関する基礎知識」で約100ページ、第二部は「データの分析に関する基礎知識」で約110ページ、第三部は「データの解釈・活用に関する基礎知識」で約60ページという三部構成。「データ解釈学入門」をタイトルに掲げる書だが、実際にデータ解釈の部分を扱ったのは第三部となる。このことをもってタイトルと内容が合っていないとなりそうだが、前の第一部と第二部では、データ解釈を行う前提として必須となる基礎知識が極めて分かりやすくまとめられており、全てを通してデータ解釈にまつわる基礎知識を解説した書として、その完成度は高い。

『数理モデル入門』との関係

本書では数理モデルの話も簡単に扱っています。本書と数理モデル入門を並べると、『数理モデル入門』が『データ解釈学入門』のスピンオフ作品のようになっていることがお分かりいただけると思います(時系列が逆だったら書いてなかったかもしれません)。データ分析の広い世界を出来るだけ網羅したのがデータ解釈学入門、その中でモデリングにフォーカスしたのが数理モデル入門です。したがって、両方の中で扱われている話題や、相補的となっている話題が多々あります。同じ話題でも違う流れの中で説明されていたり、片方で扱えなかった話題がもう片方でカバーされているといった伏線チックな雰囲気を実感していただくと、非常にマニアックな楽しみ方もできるかもしれません。このような深い関連をつけたかったので、タイトルや表紙の対称性、分量(本の厚さ)が同じになることにはこだわりました。

『データ分析のための数理モデル入門-本質をとらえた分析のために』

『分析者のためのデータ解釈学入門-データの本質をとらえる技術』

画像1

表紙を赤い色にしたのは、もちろん書店で目だたさせるためですが、数理モデル入門が黄色なので横に並べたときに負けない(かつ、いい感じになる)くらいの派手さにしたかったということもあります。

誌面に関してはほぼ数理モデル入門と同じですが、ベースカラーが章ごとに異なる(数理モデル入門では部ごと)ところとコラムみたいなボックスをところどころに追加したところが大きな変更となります。ベースカラーについては、今回章ごとに話題がコロコロ変わることと、第三部だけ分量が少ないので部ごとにすると気持ち悪いからという理由でそのようになっています。コラムについては、今回は誌面に数式が皆無なので誌面が退屈になる、ということで編集者さんからの提案で追加しました。

執筆作業について

今回、割とお話的な内容が多いので、執筆はスムーズに進むかと思われました。しかし、扱っている話題は多いので、一つ一つ詰めていくと結構時間がかかり、最終的には数理モデル本より大幅に時間がかかる結果になりました。二冊目ということで、表現の幅というか、「こういうときはこういう風に書いておけばいいな」ということが確定してきて、その意味ではスムーズに書き進めることができたと思います。今作は文中に数式が無いので、その分、文章を多めに書かないといけないということで+1万字くらい必要となりました(全体で13.5万字、執筆期間4か月)。また、図の参照や図タイトルがぐちゃぐちゃにならないようにしっかり整理しながら進めたり、数理モデル入門の時にやっておいた方が良かったであろうことを事前に潰すことができたのでその意味でも大きな混乱はなく進められました。テクニカルに気を付けた部分、こだわった部分については数理モデル入門の方の記事に書いたものと大体同じですのでよろしければそちらもご覧いただければと思います。

反響について

有難いことに、現在もいいペースで売れているようです。一作目の数理モデル入門がヒットしたこともあり、発売当初から全国の書店さんで大きく取り上げていただいたようで、多くの方にお手に取っていただけました。初速では数理モデル入門を大きく上回る売り上げとなりました。発売後8か月経った今でもAmazonのカテゴリランキング上位をキープしていますが、これは間違いなく、読者の方が周りにオススメしてくださっているおかげです(そうでなければ時間とともにどんどん落ちていきます)、本当にありがとうございます。

この本はデータ分析に関するリテラシーを上げる入門書として読みやすいように、ただし、それなりにはしっかりした内容をキープすることを目指して書いています。もしこれを多くの方が読んで理解していただければ、研究は勿論、ビジネスや政治など様々なところで行われている意思決定・分析が、より正しくデータに基づいたものになり、少しでも世の中を良くすることに貢献できるのではないかと期待しています。

おわりに

今回の二冊は、私自身が、「こういう本あったらいいのにな~」というものを、こだわって実現したものです。自分で言うのもかなりアレなのですが、入門書としてはかなり良いクオリティのものができたと思っています。もしこれからデータ分析を勉強し始めたいという方は、最初にこちらを読んでいただくとその後の学習がかなり見通し良くできてトータルで見るとかなり時間を節約できると思いますので、是非お手に取ってみていただければと思います。また、既に読んでくださった方はありがとうございました。お陰様で、より多くの方に本書を届けることができています。高評価いただいた場合は、よろしければ是非周りの方にまた紹介いただけるとありがたいです。



この記事が気に入ったらサポートをしてみませんか?