見出し画像

【書評】ベストセラーコード「売れる文章」を見きわめる驚異のアルゴリズム

どんな本?

元ペンギンブックスの編集者とスタンフォード大文学部教授の二人がタッグを組み、ベストセラーとなる小説の傾向を解説した本です。

NYタイムズのベストセラーのランキング入りを果たした小説には共通した傾向があるに違いないという仮説の下、テキストマイニングと機械学習を組み合わせ、謂わばベストセラー小説の遺伝子<コード>とでも呼ぶべき特徴を明らかにしていきます。

ベストセラー小説の備える傾向を知りたい人、自然言語処理(NLP)の応用事例を知りたい人におすすめです!ただし、具体の分析手法に関しては概要を述べるに留まっており、分析の内容について詳細を知りたい人にはやや物足りなさを感じる内容だと思いました。

個人的感想(※ネタバレ注意)

科学的アプローチで暗黙知を解明するプロセスが刺激的

本書を読んで得られる最大の知見は、「ベストセラーには、ベストセラーでない本に比べて確かな傾向があり、文章の内容からベストセラーになり得るか推測することが可能である」ということです。

プロットを三幕構成とすることや、主要トピックが全体の3分の1を占めるようにすること等、ベストセラー小説の傾向はいくつか紹介されていますが、概括すると私たちは読みやすく、感情を揺さぶられる物語を好んでいるということでした。

これらの傾向は、改めて言葉にすると当たり前に感じるものばかりだったため、私は傾向そのものに意外性は感じられませんでした。ただ、おそらく誰もが何となく感じとっていたのにも関わらず、これまで言語化されていなかった暗黙の了解が、科学的なアプローチによって明確に言語化されていることにはとても面白さを感じました。

Christopher Bookerはその著書「The Seven Basic Plots」において、数千もの物語に目を通し、事例を積み上げることで、世界中の物語のプロットは全て「怪獣退治」「悲劇」「再生物語」「喜劇」「冒険」「放浪と帰還」「立志伝」の7つのいずれかに大別されると説明しています。

本書において、収集した大量のテキストデータをセンチメント分析して同じ結論に至っていることには、ある種の感動を覚えました。

人間の直感や経験に基づく知識は、しばしば曖昧で具体的な形を持たない暗黙知として存在しています。それが科学的な手法や研究によって明確な形やデータとして示されると、まるで心の中の霧がパッと晴れ渡ったような爽快感を感じませんか?

余談

残念ながら私は自然言語処理の分野に馴染みが無く、本書の概略的な説明では分析手法の全容を理解することができませんでした。ただし、文章のトピック分類において「潜在的ディリクレ配分法」(LDA)という手法がキーワードなのだということだけは把握できました。

仕事ではアンケートの自由回答の分析を行う機会も多々あるため、本手法についてはまた勉強したら記事を書いてみようと思います。

また、本書を読んでいて「神経文学」(Neuroliterature)という学問があることも初めて知りました。

気になって調べてみたところ、「神経文学」とは文学作品や読者の反応を神経科学の観点から研究するもので、文学と脳の関係性や、文学が人々の脳や心にどのような影響を及ぼすかを探求する学問らしいです。こちらもどのような研究成果が出ているのか気になるところですね。


この記事が参加している募集

読書感想文

この記事が気に入ったらサポートをしてみませんか?