数理モデル本を書いた話
こんにちは、江崎です。大変ありがたいことにご好評いただいている、『データ分析のための数理モデル入門』(ソシム)の著者です。この本、結構こだわりと実験的な仕掛けを散りばめて作ってあるのですが、このタイミングで種明かしというか、どういうことを考えて作られた本なのかを紹介してみたいと思います。
この本を書くことになった経緯
ある日、私の元にソシムの編集の方からメールが届きました。なんでも「数理モデル」というテーマで本を書けないかとのこと。なぜ当時(今も別に無名ですが、今より)無名だった私に連絡が来たのかというと、昔書いていたブログを見て見つけていただいたとのこと。
この記事、今見ると粗いし、現代では誰に向けて何のために書いてるのかよくわからないので、もう消そうかなと思ってたくらいのものなのですが、こんなものでも後で思わぬチャンスにつながったりするものです。
「数理モデル」というテーマ
でもこんなペライチのブログ記事だけで(他のestablishされた先生でなく)私に連絡が来るということが不思議に思われた方もいらっしゃるかもしれません。
多少でも「数理モデル」というものに携わっている方ならお分かりかもしれませんが、実は、一口に数理モデルといっても、めちゃくちゃ色々なものが色々な分野に存在していて、一つのテーマとして語るには広すぎるんですね。例えるなら、「プログラミング」というテーマで本を書けと言われるのと同じくらいのざっくり感といえば伝わるでしょうか。「プログラミング」の具体的な内容としては千差万別な目的と解決手法、言語などが有りますよね。数理モデルもそれと同じで、色々な分野に色々な目的と手法があります。ですので、「統計モデルの専門家」は居ても、「数理モデルの専門家」と自称する人は普通はいないわけです。それで運よく私のところにお話が来たというわけです。
私の数理モデル観
私はこれまで(たぶんそういう人は結構レアだと思いますが)物理や応用数学の理論的な分野の「数理モデル」から始まり、脳や認知心理学のデータを説明・理解するための統計・機械学習分野の「数理モデル」まで色々やってきたという経歴を持っています。恐らく、学術レベルで使ったことのある数理モデルの「広さ」だけで言えば、少なくとも同世代以下には負けない自信がありました。そんな私が、「数理モデル」というテーマで何か書けないかという話が来た時にまず思ったことは、そんな広い内容のものを一冊の本にまとめることは不可能だということでした。もちろん統計モデリングや力学系モデリングにフォーカスした本を書いて「数理モデル」と称することはできますが、なまじ色々知っているというプライドが「それを『数理モデル本』と呼ぶべきではない」という思いにさせたわけです。
少し考えてみた
一方、最近のデータサイエンスの興隆で、モデリングやデータ分析といえば機械学習!深層学習!という風潮が強すぎるなと日々思っていたことがふと頭を掠めました。さらに、本屋さんに行くと、統計、機械学習、因果推論、確率モデル、時系列解析、力学系モデルなど、様々なキーワードの本が並んでいますが、これらは立脚する分野や前提が異なっていたり、そもそも分析の目的すら違っていたりして、初学者にとっては何がどうなっているんだか混乱しやすいだろうな、と日々感じていたことも思い出されます。
そうだ、データ分析に的を絞ったうえで、関連する数理モデル達を網羅的に綺麗に整理した本を書いたら、新しいし、面白いんじゃないだろうか?モデルの形は違っても、データや経験からモデルを作り、そこから情報を引き出すということは同じはずだから、その共通部分をハイライトしつつ「数理モデル論」のような内容ができれば、これはアツいぞ!
そう思いついてできたのが、本作『データ分析のための数理モデル入門』だったわけです。
細かい設計
さて、大まかな方針は決めたわけですが、細かくどういう本にしたいか考えてみました。
■難易度について やはり初学者に向けた本を書きたい、その上で、中上級者も楽しめる内容になればベストだなと考えました。また、幅広いモデルを扱う関係上、少しでも記述の難易度を上げてしまうと、一冊通して読み通す難易度が爆上がりしてしまうし、一冊に収まらなくなってしまいます。というわけで、このテーマならその難易度で記述するしかないのではないかという結論に至りました。
■わかりやすく「良いこと」を書く わかりやすい入門書で良くあるのが、「わかるんだけど、浅いことしか書いてない」というパターンだと思っています。一方で本質的に大事なこととか深いことは、中上級者向けのしっかりした本に、ところどころ書いてあることが多いのではないでしょうか?本書が目指したのは、その大事なことも読みやすい内容の中にしっかり(できる範囲で)含めるということです。これにより、食べやすい味のカレーなんだけどかなり深い味がする、みたいな類書にない読み味を目指しました。一つの方針として、「なぜそうするのか」という考え方を出来るだけ沢山記述しています。また、脚注ではマニアックな面白ネタもガンガン突っ込んでスパイスになるようにしています。
■統合性 こういう色々な内容を紹介する本だと、話題があちこち飛んでバラバラの寄せ集めみたいになってしまいやすいので、その点にはかなり気を付けました。具体的には、他の章に対する言及(この時はこうしたけど、ここではこうする、なぜなら…とか)を出来るだけ入れて横糸の理解を促進したり、「目的や状況に応じてどのモデリングを使うか」に重点を置いてそれぞれの内容が相対的に理解できるようにしました。
■デザイン面について 誌面は図版をたくさん入れ(全部で100枚以上作りました)、デザインも見やすくカラフルでポップ(?)にしてもらいました。また、表紙も下品にならないギリギリまで目立つカラーでオシャレにお願いしました。これは上記の通り「普通の入門書ではない、別の何かである」という印象を伝えるためのものです。出版社の方々が色々とこうしたこだわりに付き合ってくださったおかげで、この点に関しても個人的に大満足な仕上がりとなりました。
一番伝えたかったこと
本書の一つの大きな軸として、「理解志向型モデリング」と「応用志向型モデリング」という対立を据えました。前者は現象のメカニズムを理解することを重視したモデリング、後者は応用に実装したときの予測精度などのパフォーマンスを重視したモデリングです。
このどちらを目指すのかによってモデルの作り方は当然大きく異なりますが、この違いに関する理解が曖昧になってしまっている結果、間違った手法を選んでしまうというケースが非常に良くあります。本書では、この軸で数理モデル全体を整理することで、正しくモデルを選ぶことができるようになることを目指しています。手法さえ選べれば必要な情報はいくらでも調べられますが、初手で間違えてしまうと挽回する方法がないので、この点は大きいと思っています。
執筆の流れ
簡単に、この本をどういう風に執筆したのかについて興味がある方もいるかもしれないので紹介します。(とはいっても、典型的な内容だとは思いますが)
1.載せうる内容を列挙しまくる 数理モデリングに関して本書に含めうる内容をひたすらリストアップしました。自分でざっと考えた必要なものに加え、様々な分野の典型的な教科書たちをざっと読んで、「この辺の内容は私の本にも必要だろうな」という内容を整理しました。またツイッターで話題になっている内容からもヒントを得たりしました。
2.内容を目次に落とす リストアップした内容を、どの章に含めるかということを試行錯誤しながら整え、全体の目次の流れを作りました。
章 > 節 > 項(ここに個別の内容が入る)
というレベルまでざっと決めます。ここまでできたものを出版社さんに提出して企画会議に掛けてもらいます。無事、企画が通していただけたので執筆に入ります。
3.項目ごとにひたすら書く 個別の項目まで落ちているので、書くのは簡単です。もちろん書きながらこの項目が必要だな、というものについてはどんどん追加していきます。図版が沢山あるということを述べましたが、基本的には説明したい内容に関するスライドをつくってそれを図版にし、説明の内容を文字で書く、というイメージでやっていました。編集者さんからいただいたフィードバックも反映しつつ進めます。
4.書きあがったものを調整 部ごとくらいに書きあがったものを読み直し、誤字脱字や、説明が微妙な部分のチェック、他の部分との整合性などをチェックします。反省なのですが、自分の場合、ある程度まとまった量でやると、集中力が保たなくて普通に抜けてしまうので、章ごととかもう少し少ない量で細かくやった方が良かったです。
5.表紙や帯などの準備 表紙のデザインをデザイナーさんにお願いしたり、帯に何を書くのかを調整します。読みたくなるような煽り文句を考えます(煽ってすみません)。
6.校閲作業 全部書きあがったら実際に紙面の形に版組してもらいます。この状態でまだ細かいところや説明がおかしいところが残っていないかを確認します。今回は慣れていなかったせいか、この段階でも大量のエラーが含まれていて、かなり大変でした。。。尚、イラストは私がパワポで作ったものをデザイナーさんにお願いして綺麗にしてもらうのですが、出来上がったものが問題ないかもチェックします。
7.発売! 大体このような手続きを経て発売に至ります。ここまでかかった時間は全部合わせて300時間くらいだったのではないかと思います。
本の反響
有難いことに多くの方からご好評いただきました(ツイッターやAmazonで感想を書いていただいた方々、本当にありがとうございました。非常に励みになりました。)。自分の書いたものをお金を出して買ってくださる方がいて場合によっては他の方に薦めてくださったりしたことは、本当に得難く嬉しい経験でした。書店でも大きく取り上げてくださっているところがあったり、Amazonランキングで上位になったりと、目に見えて沢山の方にお手に取っていただけているようです。
また、先日、本書が韓国語に翻訳されて発売されました!
この後、姉妹書『分析者のためのデータ解釈学入門』が先日発売されましたが、その話はまた今度させていただくことにしましょう。ここまで長々と読んでくださった方、ありがとうございました!
この記事が気に入ったらサポートをしてみませんか?