見出し画像

#107【驚きの要約】NotebookLMの新機能Audio Overviewがハンパなかった

おはようございます。



アナログな企業で生成AI普及を目論む3年目社員アヒルです。人生で初めて冬瓜を食べました。感想はありません。


Googleが提供するAIノートツール、NotebookLMが、新機能"Audio Overview"を搭載しました。
これがまた笑っちゃうほど凄かったのでここに記しておきます。

NotebookLMについてはこちらの記事でもまとめております。



新機能 Audio Overviewの概要


2024年9月末に、NotebookLMに次のような機能が追加されました。

ユーザーが提供したテキストやウェブサイトの URLから、リアルな音声で会話する2人の"AIホスト"によるポッドキャストを自動生成できる機能

ユーザーの入力内容に基づいて、ポッドキャストの脚本を自動生成し、
SoundStormなどの技術を用いて音声合成を行うことで、自然な会話を実現しているのだそう。

まだ試験運用中ではあります。


これだけ見てもなんとなく凄そう…とは思うのですが、やはり実際に使って確かめてみます。


Audio Overviewの使い方


使い方は簡単で、まずはいつも通り、何かしらのソースを与えます。

今回は、PwCコンサルティングという会社が実施した生成AIに関する実態調査を報告したサイトをまとめてもらおうと思います。
(参考サイト:https://www.pwc.com/jp/ja/knowledge/thoughtleadership/generative-ai-survey2024.html)

ソースを追加すると、まずはノートブックガイドに簡単な要約等が生成されます。

このガイドの右上に……

これですね。現状では英語のみ対応しているとのことですが、「生成」を押して会話のやり取りを作ってもらいます。

ソースの分量も多かったためか、約4分ほどかかって、11分弱の音声が生成されました(mp3ファイルは、ダウンロード後ChatGPTに冒頭25秒までを切り出してもらったもの)。

再生ボタンを押して聞いてみると、男性と女性の声で、まるで人間が話しているかのように調査内容についてディスカッションをしていました。


抑揚とか…相槌とか……もう完全に人間のそれでした。


なんだか英語のリスニング問題みたいで懐かしい感じもしましたが、生憎アヒルの耳はまだそこまで英語慣れしていないので、何を話していたのか文字に起こして翻訳してみました。

ちなみにNotebookLMにAudio Overviewのポッドキャストを渡して、男女どっちが何と言ってるか分かりやすく文字起こししてもらうこともできました!

絵文字が逆な気はしますがね。

話している内容はソースに基づいたものであり、要約をしながら出てきた疑問を議論して解消するなど、非常にわかりやすい音声ファイルになっていました。


Audio Overviewでできること



ポッドキャスト作成以外に、次のようなことも可能です。

生成した音声の共有


生成した音声は、リンクによって共有することもできます。


ダウンロード


また生成音声をダウンロードすることで、いつでもどこでも聞くことができます。


再生速度の変更


ちょっと英語は久しぶりだもんで……という自分にはありがたいことに、再生速度を変更する機能も備わっていました。



まとめ



今はまだ英語にしか対応していませんが、今後多言語対応になって日本語でもAudio Overviewができたら、NotebookLMをより一層楽しめそうです。

先日ChatGPTにも自然な対話を可能にする音声モードが追加され、AIとの対話ブームが巻き起こっています。


手で入力するよりも、言葉で話してしまう方が早いので、音声を使ったやり取りには期待しかないですね。


お読みいただきありがとうございました!

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?