見出し画像

技術本の校正作業が大変だったけど実に面白かった話

実践マーケティングデータサイエンスは執筆開始から発売に漕ぎづけるまで、1年半かかりました。一般的に書籍がどのぐらいで刊行されるのかよく知らないのですが、まあまあ長い方なのではと思ってます。
時間がかかった理由のひとつが校正作業です。

表記ゆれ

まず表記揺れには相当苦しみました。このあたりはnoteに以前記載したので、そちらを参照ください。

私は結構細かいところが気になるタイプなので、パラメータかパラメーターか、みたいなところも気になりました。そこは話すと長くなるので、こちらもnoteにまとめてあります。

言葉の定義や説明

表記揺れと合わせて気を使ったのが、言葉の定義や説明についてです。

データサイエンスにはやっかいな用語がたくさん出てきます。文脈上どうしてもその用語の説明をしなくてはいけないことがあるのですが、正確に説明しようとすると長くなって理解しづらくなったり、その前に別の用語を説明しておかないといけなかったりします。

例えば「特徴量ってなに?」って聞かれたら、みなさんはどう説明するでしょうか。
厳密な定義はいろいろありそうですが、拙著第8章では「分析すべき対象の特徴・特性を表し、予測の手がかりとなる変数」としました。ですが、この表現に至るまでには5回か6回ぐらい書き直しがありました。当初はもっと長ったらしく、次の日読み返すと「何言ってんだ?これじゃ分からん…」てすぐに別の表現に書き直したりしてました。

スタンスは「この書籍の本質に関することは出来るだけ定義を明確にするが、本質に感しない点は出来るだけ分かりやすさを重視する」なんですが、「正しく言う」ことと「分かりやすく言う」ことのバランスってめちゃくちゃ難しいです。

「正しく言う」ことと「分かりやすく言う」ことのバランス

これはサイエンスコミュニケーションなどでもよく話題になるテーマなのですが、「正確さ」と「分かりやすさ」はトレードオフの関係になりがちです。
今回書籍を執筆してて、それをまさに痛感しました。

特にサイエンス寄りの方ですと、「分かりやすく言うことで正確さが崩れる」と考えている方も多いです。
ただ私は、トレードオフというより両方をうまく兼ね備えた言い方というのはあるだろうなと思っています。先ほど紹介した「特徴量」の説明も、それに近い感じに寄せました。
それはもしかしたら「最適解」というよりも「妥協点」に近いかもしれませんが、探求を続けることでその妥協点も少しずつ上にあげられるのではないかと思っています。

業界用語

もう一つが業界用語についてです。
第8章でワン・ホットエンコーディングの説明をしているのですが、なにげなく「1が立つ」と書いたんですね。それに対して編集者さんから「これは業界用語ですか?」とご指摘を頂きました。そこで初めて「あ、1が立つって一般的に言わないんだ」と知りました。

エンジニアはビット列に慣れているので、世の中は0と1で出来ていると理解しており、平気で「1が立つ」と言います。それはもう自然な感じで、日常会話の中で「1が立ったね」と言います。「フラグが立つ」というのも似たような感じですね。

自分もまったく意識してませんでしたが、確かに言われてみると「1が立つ」ってなんなんだ?「1」ってそもそも立つのか?確かにスッと立ちそうだけど、とか思っていたところで、編集者さんから「スイッチがONになるようなことですかね?」という一言をいただき、それ採用!となりました。
ですので実際の書籍では、

one-hot(ワン・ホット)とは0か1かどちらかの値を持ち、1つだけ1であり、他は0であるようなビット列のことをいう。
もともとはデジタル回路などの用語であり、文字どおり1つだけがhot(スイッチがONになっているようなイメージ)である状態という意味合いになる。

という表現にしています。
ただ、読者の方が本当にこれで理解できるのかは正直分かりません。

「1が立つ」はほんの一例で、業界用語をいかに使わないか、あるいはどうしても使う場合はいかに分かりやすく言いかえるか、その上でいかに正確性も担保できるか、そんなことをずっと考えながらうーんうーんと頭を悩ませていて、それはそれは地獄のような日々でした。

実に面白い

最初はめちゃくちゃ大変で吐きそうになってたのですが、そのうち「こういう言い方はどうかな」とか「こんな表現はどうかな」とか考えるのが楽しくなってきました。
そして、ドラマ『ガリレオ』の湯川学のようにこう思いました。

「実に面白い」

そう、世の中にはどんな言葉があって、この現象を説明するにはどのような言葉を選べばよいか、どういう言葉を使えばどういう反応になるのか、を考えるのってめちゃくちゃ面白いんですよね!

イメージとしては、さながらトランプの大貧民のようなもので(私は埼玉県民なので、大富豪とは言わず大貧民と言います)、手持ちの札(言葉のリスト)をいかにうまく揃えていくかも大事ですし、そこからシチュエーションに応じてどんなカード(言葉)を出していくかも大事になってくるのです。実に面白くないですか?

そんなわけで、技術本の校正作業が大変だったけど実に面白かった話でした。
該当の書籍はもう1年以上前に発刊されたのですが、言葉って面白いよな、と思うことがあったので、書いてみました。

以上です。


この記事が気に入ったらサポートをしてみませんか?