見出し画像

書籍制作における生成AIの活用現状

(11月19日更新)先日、AI専門メディア「AINOW」の編集長である小澤 健祐さんが「生成AI導入の教科書」という書籍を出版しました。本書籍では、生成AIの概要や企業における活用事例から、プロンプトエンジニアリングなど実践寄りの内容まで幅広くカバーされています。内容も非常に勉強になりますが、この書籍は「ChatGPTを使って執筆されている」という点も注目に値します。企画フェーズでは構成作りや見出し作成にChatGPTを活用し、執筆フェーズでも解説文を書く部分でフル活用しているそうです。また、企業へインタビューした後の文字起こしにも生成AI技術を活用しているそうです(Mapion)。なお、本書籍はAmazonでベストセラー入りも果たしています

ニュースと同様、書籍もテキストを中心に構成されるコンテンツです。本書籍がChatGPTを使って執筆されたように、書籍ビジネスは今後生成AIの影響を強く受けていくことが予想されます。

書籍を執筆するフェーズを「制作」、完成した書籍を販売したり二次展開するフェーズを「流通」と大まかに定義します。本記事では、前半で書籍の「制作」フェーズにおける生成AIの活用事例や最新サービスを紹介し、そこから書籍制作における生成AI活用の現状を整理します。さらに、生成AIがどのように既存出版社の脅威になりうるかについても考察していきます。後半で「流通」フェーズにおける活用事例と最新サービスに触れ、現状と今後考えられる新体験の萌芽について解説していきます。


ノンフィクション作品の執筆における生成AI活用事例

本記事冒頭でご紹介した「生成AI導入の教科書」以外にも、生成AIを活用して本文を執筆した書籍は複数存在します。例えば、今年7月に幻冬社新書から出版された「教養としての生成AI」。この本も、本文の半分程度でChatGPTが使用されており、執筆時間はわずか10時間ほどだったそうです(Wirelesswire)。海外では、学術書出版社のシュプリンガーネイチャー社が「財務、コンプライアンス、監査におけるGPTの応用」という書籍の執筆にChatGPTを使用しています。本書の制作開始から出版までに要した時間は、通常のおよそ半分の5カ月弱でした(Nature Asia)。

Springer Gabler

一方、米国の作家業界団体であるAuthers Guildが会員向けに実施した調査では、生成AIツールの利用目的の約半分が「文法校正」でした。29%はブレインストーミングで、実際の執筆に使用しているのはわずか7%にすぎません。ここで紹介したような書籍執筆における生成AIの活用は、非常に目立つキャッチー事例です。しかし実態としてその使用方法はかなり稀で、あくまで実証実験レベルに留まっていると言うことができます(Publisher Weekly)。

Liquid Studio

一方、商業出版ではない領域(ここではインディーズと呼ぶことにします)では、書籍全体をAIで生成している例が存在します。今年の8月にハワイのマウイ島でおきた火事は記憶に新しいですが、それをテーマに執筆された「炎と怒り: 2023年マウイ島の物語と気候変動への影響」という書籍は全て生成AIで執筆されています。その品質はひどいもので、書体がバラバラだったり不要な空白ページがあるなどかなり粗悪な内容になっているそうです。そのような実態があるにも関わらず、本書籍はKindle上でベストセラー入りしてしまい大きな物議をかもしました(Futurism)。なお、これ以外にもKindleでは料理やプログラミング、ガーデニング、ビジネス、工芸、医学など多くのカテゴリーで生成AI本が流通しています。これを受け、AIを使用した書籍をKindleで出版する場合は事前に通知することが義務付けられています。また、Amazonは同一の著者が一日に自費出版できる電子書籍の数に制限を課しました。

Amazon

また書籍レビュープラットフォームであるGoodreadsには、実在する人間の著者名を許可なく使用して出版されたAI本が氾濫しています。Goodreadsには誰でも書籍を登録することができるため、これらの本は著者のプロフィールに新刊として掲載されてしまいます。それは、当然著者のブランドを棄損することに繋がります(EWC)。

フィクション作品の生成AIツール

小説の執筆AIツールは、AIのべりすとやNovelAI、Toolsadayなど多数存在しています。その中でも、Metaでエンジニアとして活躍しSF作家としても活動しているジェームス・ユー氏によって立ち上げられた「Sudowrite」というサービスは群を抜いて優れています。創業者自身が作家ということもあり、小説執筆の進め方や構造を前提としたサービス設計になっています。ユーザーは、生成したい物語に入れ込みたい内容を「Braindump」というコーナーに記述します。その後、「Generate」というボタンを押すだけでBraindumpを前提としたあらすじやキャラクターが自動生成されます。ユーザーはその段階で生成内容を確認し、必要に応じて加筆修正を行います。再び「Generate」ボタンを押すと、あらすじを前提とした章立てが自動生成されます。ユーザーはそのタイミングで再び加筆修正を行い、その後本文の自動生成へ移っていきます。このように、Sudowriteはユーザーインターフェースが小説執筆の流れに沿ったコントロールパネル構造になっており、ステップバイステップでユーザーを巻き込んだ生成フローになっていることが特徴です。

Sudowrite

SudowriteはGPT-3.5をベースとしたサービスですが、まだ品質には改善の余地が残ります。例えば、長い物語を生成すると前の文脈を忘れてしまい支離滅裂な内容になってしまいます。また、現時点では日本語にも対応していません。しかし、Braindumpに入れた少しの情報から「限りなく小説のような」文章が生成される体験には、かなりの感動を覚えました。Sudowriteは私のような執筆経験やスキルがないインディーズ領域のユーザーにとって、小説執筆の敷居を下げる優れたサービスです。ただし、現時点では商業出版できる品質水準には至っておらず事例もまだ見当たりません。

制作フェーズにおける現状整理

以上を踏まえると、制作フェーズにおける生成AIの活用実態は以下のように整理することができます。

Liquid Studio

右上の「ノンフィクション x 商業出版」は、最初に紹介した「生成AI導入の教科書」や「財務、コンプライアンス、監査におけるGPTの応用」が当てはまります。書籍としての品質は保ちながら、制作の効率化を実現しています。左上の「ノンフィクション x インディーズ」は、KindleやGoodreadsにおける生成AI低品質書籍が当てはまります。急激に増加している一方で、プラットフォームによる取り締まりが強化されていく領域でしょう。左下の「フィクション x インディーズ」は、Sudowriteなどの小説生成AIツールが当てはまります。本数としては増加していきますが、品質はまだ低いです。右下の「フィクション x 商業出版」では特に事例が見当たりません。

現行の出版社にとって、右側の「商業出版」における生成AIは、脅威でなく機会であると捉えることができます。従来と同品質以上の作品をより効率的に制作・出版できるようになるためです。また、左上はKindleやGoodreadsなど大手プラットフォームによる取り締まりが強化されるため、時間の経過と共に減少していくことが予想されます。今後注視すべきは、左下の領域でしょう。

書籍出版における破壊的イノベーションの可能性

破壊的イノベーションとは、従来の価値基準に照らし合わせると品質が不十分ながら、時間の経過と共に品質が向上し顧客の価値水準を超えるような新興技術のことを指します。クレイトン・クリステンセンという経営学者が執筆した名著である「イノベーションのジレンマ」で提唱された概念で、過去数多くの大企業が衰退した原因として知られています。SONYが1955年に発表したトランジスタラジオは、破壊的イノベーションの代表例として語られています。当時、ラジオの世界を席巻していた真空管ラジオは音質が非常によく、米国の家庭で広く利用されていました。同時期にSonyが発表したトランジスタラジオは小さく軽く電池で動きますが、音質はよくありませんでした。真空管ラジオのユーザーにとっては検討対象外の商品でしたが、家の外でラジオを聞きたいユーザーには非常に使い勝手が良い商品でした。その後トランジスタラジオは性能を急速に向上させて、真空管ラジオに追いつきました。こうなると真空管ラジオは重いだけで、急速にトランジスタラジオに代替されていきました。真空管ラジオのメーカーはトランジスタラジオ製造のノウハウを持っていなかったため、市場の変化についていくことができませんでした。

Fostec & Company

前述のSudowriteは非常に優れた小説執筆AIツールですが、品質面ではまだまだ改善の余地があり、商業出版できるレベルには至っていません。そのため、生成AIを使ったフィクション作品を商業出版している出版社は存在しません。しかし、現在は「小説家になろう」や「Inkitt」などインディーズ作家向けの小説プラットフォームが多数存在し、あらゆる作家へ門戸が開かれています。また、生成AIの急速な品質向上は言うまでもなく、クオリティは時間の経過と共に向上していく可能性が高いです。数年後には、生成AIを活用した制作スタイルが当たり前になる可能性もあります。その時、独自の小説執筆AIツールを内製化して作家に提供したり、独自プロンプトや編集方法などのナレッジを保有する新興出版社が優れた作家を囲い込むとしたらどうなるでしょうか。既存出版社は、AIツールの使用が当たり前になっている作家を捉えることができず、後塵を拝してしまう可能性があります。これは、まさしくクレイトン・クリステンセンが提唱する「イノベーションのジレンマ」の構造そのものです。

Liquid Studio

「Inkitt」は、これに近い動きをしている新興出版社として参考になります。同社はインディーズ作家が小説を投稿、公開できる無料プラットフォームを提供しています。その小説をアルゴリズムで分析しヒットセラーになりそうな小説を選択、別に運営する有料アプリ「Galatea(ガラテア)」で正式に公開するというビジネスを展開しています。累計83億円の資金を調達しており、今年日本市場にも進出しました(Forbes)。同社が依拠しているのは生成AIではありませんが、「自社プラットフォームから得られるデータとその分析ノウハウを競争力として優れた作家を囲い込む」というアプローチは、既存出版社がなかなか取れていない戦略ではないでしょうか。

Inkitt

流通フェーズにおける現状整理

ここまで「制作」における生成AIの活用事例と現状、そして破壊的イノベーションの可能性について考察してきましたが、ここからは「流通」フェーズでも同様の検討を行いたいと思います。

まず流通フェーズにおける生成AIの活用事例を整理すると、以下の様になります。

Liquid Studio

縦軸は「テキストコンテンツか、オーディオブックなど非テキストコンテンツか」で区切っています。横軸は「AIによる既存業務の効率化か、生成AIによって初めて可能になった新体験の提供か」で区切っています。各象限における事例は後述しますが、全体で見ると左側の「既存業務の効率化」については、テキストと非テキスト両方において広く実務導入が行われています。それも生成AIのブーム以前から業務に取り入れられており、生成AIはその延長線上で品質の高度化や更なる効率化に貢献していくと考えられます。一方右側の「新体験提供」は、一部試験的な取り組みが始まっているものの、まだ本格的な商業化には至っていない状況です。特に、右上の「テキスト x 新体験提供」はユーザーを中心とした新しい楽しみ方であり、今後IPホルダーである書籍出版社にとって興味深い新事業領域になる可能性があります。

業務効率化における活用事例

テキスト領域

テキスト領域で業務効率化に最も寄与しているのは、「多言語翻訳」でしょう。Google翻訳やDeepLが広く浸透しているように、生成AIブーム以前から翻訳のためにAIは幅広く利用されていました。例えば、ニューヨークに拠点を置くMetropolitan Booksは、AIを使って“A World Without Work. Technology, Automation, and How We Should Respond”という全352ページの書籍をわずか40秒でロシア語に翻訳しました。

Metropolitan Books

この翻訳には、現在の生成AIブームの基盤ともなっている「Transformer」というディープラーニングのアーキテクチャを取り入れた「Yandex.Translate」というツールが使用されており、品質もかなり高かったそうです。翻訳後に編集者が校閲を行いましたが、わずかな修正だけですみ大幅な業務効率化に繋がりました(Mx3)。

日本でも同様の事例があります。集英社は、Mantra株式会社が提供する「Mantra Engine」という漫画に特化した翻訳サービスを使用し、日・英・中等の使用者が多い言語へ高速翻訳・サイマル配信を実現していました。一方、マンガの対訳データが少ない言語においては翻訳の品質が低いという課題がありました。そこで同社はMantra EngineとLLMを統合することで、対話データが少ない言語でも翻訳の誤りを従来の10分の1程度にまで減らすことに成功しました。今年8月には、ベトナム語での翻訳・サイマル配信もスタートしています(AI Smiley)。

Mantra Engine

非テキスト領域

非テキスト領域では、オーディオブックにおいてAIが幅広く活用されています。

オーディオブックは、書籍ビジネスにおいて若年層を中心に堅調に成長している有望マーケットです。2022年の世界全体での市場規模は6000億(market.us)で、日本では2024年時点で260億円と予測されています(PRtimes)。世代別で見ると、Z世代の47%が、ミレニアム世代の49%が利用しており、「ながら消費」の需要が強い若年層に人気のフォーマットであることがわかります(Book Riot)。

Book Riot

このようにオーディオブックは重要性が年々増しているフォーマットですが、ナレーターのアサインからレコーディングまで追加業務が多々発生するため、工数的にもROI的にも中小規模の出版社だとそこまで手を回せていないのが現状です。Appleはそこにいち早く目をつけ、「Apple Digtal Voice」というAIナレーションサービスを提供しています。同社のAIボイスは書籍のジャンル毎に最適化されており、現在「フィクション、ロマンス、ミステリー&スリラー、SF&ファンタジー」のいずれかに分類される書籍であれば、同サービスを無料で簡単に利用することができます(Apple)。本サービスはアメリカの中小規模出版社を中心に利用が進んでおり、Apple Booksを見ると「Apple Booksによるナレーション」と表示されているオーディオブックが多数存在します。

Apple Books

Googleも、「Auto-narrated audiobooks」として同様のサービスを展開しています。

新体験創出における活用事例

非テキスト領域

前述のオーディオブックにおいて、生成AIを活用し「故人の声」でナレーションするサービスを提供しているのがDeepZenです。同社は、2014年に他界した俳優「エドワードハーマン」の音声を遺族の同意の上収集・学習し、オーディオブックのナレーターとして使用しています。例えば、「The War With Mexico」という本のオーディオブックは今年の7月にリリースされましたが、そのナレーターには「エドワードハーマン」がクレジットされています(Google Play)。

Google Play

なお、同社はエドワードハーマン以外の故人についても、同様の権利を取得するために権利元や遺族と交渉を進めているそうです。

また、同様の発想で有名人の音声を学習しナレーションに使用するというアイデアも想像に難しくありません。権利関係の問題で実際にオーディオブックのナレーターとして使用されたケースはまだありませんが、既に有名人の音声をAIでコピーすることは技術的には可能になっています。例えば、Speechifyという音声AIスタートアップのHPでは、Snoop DoggやMr. BeastのAI音声を聞くことができます。

テキスト領域

最後に取り上げるのが、テキスト領域における新体験創出です。生成AIスタートアップで評価額圧倒的No1はOpenAIですが、2位につけているがCharacter.aiという企業で、1000億円の評価を受けているユニコーン企業です。同社のプラットフォームでは、ユーザーが自分の好きなキャラクターのAIチャットボットを簡単に作ることができます。また、他のユーザーが作ったキャラクターのAIチャットボットと無料で好きなだけ対話することができます。

Character.ai

既に月間サイト訪問数は1億に迫っており、ユーザーが送信したメッセージは20億以上、作成されたキャラクターは270万にも及ぶそうです(Digital Shift Times)。このサービスでは、日本のアニメやゲームのキャラクターが高い人気を誇っています。例えば、進撃の巨人のエレンイェーガーは多数チャットボットが作られており、多いもので200万回以上利用されているものもあります。

Character.ai

現状、書籍は作者から読者へ語りかける一方通行のメディアです。アニメや漫画などマルチメディア化による多面的展開もありますが、いずれにせよインタラクティブな体験は提供できていません(ゲームなど一部を除く)。一方でCharacter.aiが出している数値は、書籍や漫画に出てくるキャラクターとインタラクティブに交流したいという隠れた読者ニーズを示唆しているのかもしれません。権利問題やコンテンツモデレーションなど、IPを保有する企業が本格的に取り組むとなると課題は山積みですが、これらのユーザーを「リードユーザー」として考えてみると、未来の新しいビジネスの種として検討をする価値はあるかもしれません。

リードユーザー起点での新規事業展開

新規事業の作り方は様々ですが、歴史的にも有効性が証明されている手法の一つが「リードユーザー」に着目することです。リードユーザーとは、将来的に市場で一般的になるニーズを先取りして、「今」そのニーズ に直面しているユーザーのことを指します。 他のユーザーと比較して将来の状況に精通しているため、新製品のコンセプトやデザインを提供してくれる可能性があるとされています。もちろん、現時点でどのユーザーがリードユーザーで、どのユーザーが単なるニッチなセグメントなのか見分けることは容易ではありませんが、少なくても新規事業検討の俎上に上げる価値はあると言えます。

この手法で大成功を遂げた代表的なサービスがApple社のiPodとiTunesです。当時インターネットとPCの急速な発展・浸透を背景に、音楽ファイルを個人間で交換するNapstarという音楽P2P共有サービスが若年層の間で流行していました。いわゆる海賊版の流通を助長するサービスでCDの売り上げが激減していたため、アメリカ・レコード産業協会はNapsterに対し多数の訴訟を起こします。訴訟に敗れたNapsterは2003年に事業停止に追い込まれますが、Appleのスティーブ・ジョブスはNapsterのヘビーユーザーのインサイトに着目していました。物理的な製造や輸送が伴うCDは数曲に対し1000円以上支払わなければならない上、携帯音楽プレイヤーに曲を取り込むには様々な工程を経由する必要がありました。Napsterは非合法サービスでしたが、そういった課題にうまく対応し安く手軽な体験を提供していたため若年層に支持を得ていました。ジョブスはこのユーザーたちを「リードユーザー」として捉え、Napsterの体験を最大限維持しつつ音楽レーベルの利害関係を調整する形でiPodとiTunesを開発しました。iTunesでは、1曲100円で合法的に曲を購入することができます。また、曲を購入するストアはiTunes上にあり、購入後そのままiPodへ取り込むことができるため、ユーザー体験もシンプルで使いやすいものでした。ジョブスの予想は大当たりし、リードユーザーが捉えていたニーズはその後マスマーケットでも支持を得て、iPodとiTunesは歴史的な成功を収めました。さらに、売り上げが激減していた音楽業界を救うことにもなりました。

iTunes

Chatacter.ai上でキャラクターのAIチャットボットを作成し楽しむユーザー達も、出版社にとっては「将来の市場ニーズを先取りしているリードユーザー」である可能性があります。例えば、Z世代は世界的にメンタルヘルスに不調を抱える人が多い世代と言われていいます。彼らは、キャラクターとの対話を単純なエンターテインメントとして楽しんでいるだけでなく、自分のメンタルを癒す存在と捉えているかもしれません。このように様々なインサイトがあると思いますが、彼らの行動実態を捉えうまくサービス化することができれば、将来大きなビジネスに繋がっていく可能性があるでしょう。

Liquid Studioについて

Liquid Studioは、メディアエンタメ業界に特化したコンサルティングスタジオです。生成AIなどの先端テクノロジーに強みを持ち、ビジネスと技術の両面からハンズオンでご支援致します。これまで、大手新聞社やデジタルニュースメディア、エンタメ系スタートアップ、雑誌社など多数の企業様に対し、社内セミナーや技術導入、戦略提案、オペレーション構築など多角的な支援を提供してきました。
HP: https://www.liquidstudio.biz/

この記事が気に入ったらサポートをしてみませんか?