見出し画像

AIを文房具のように使う未来が来る?ELYZA Pencilの開発背景

はじめに

この度ELYZAは、大規模言語モデルを使用した文章執筆AI「ELYZA Pencil」のデモサイトを一般公開しました。”ELYZA Pencil”は、公開11日で11万人利用の反響があり、文章要約AI「ELYZA DIGEST」に次ぐ、大規模言語AIの第2弾となります。
ELYZA Pencilは、数個のキーワードを入力するだけで日本語のニュース記事・ビジネスメール・職務経歴書などを自動生成するAIです。
以下のリンクからご利用いただけますので、よろしければぜひ触ってみてください!​

https://www.pencil.elyza.ai/

今回はELYZA Pencilの開発に至った背景や、実際の生成例について紹介していきます。

ELYZA Pencilの開発背景

大規模言語モデルの潮流

本題の前にまずは最近の自然言語処理 (Natural Language Processing: 以降NLPと略記)(※1)分野の変化について、解説します。

2012年にディープ・ラーニングが登場しブレイクスルーを起こしてから、2015年に画像認識分野では「人間超え」の精度を達成しました。一方、NLP分野はなかなか「人間超え」の精度を実現できず、社会実装も限定的な状態でした。そのような中、2018年秋にGoogleが大規模言語モデル「BERT」を発表したことでブレイクスルーが起こり、2019年にはNLP分野でも「人間超え」の精度が実現されました。

ELYZAではこのパラダイムシフトを起こしている技術「大規模言語モデル」を日本語にも適用し、独自の大規模データセットで学習することで、2020年に日本語AIエンジン「ELYZA Brain」を開発しました。

大規模言語モデルの初期モデルは文章を「読む」ことに優れたAIでしたが、「書く」AIも技術的な進歩を遂げています。中でも2020年にOpenAIが開発した「GPT-3」は、人間が書いたような文章を自動生成でき、英語圏を中心に非常に話題になりました。しかし、GPT-3並みの大規模言語モデルの開発には膨大な量のデータと計算資源(これらに伴うコストとして、実際にGPT-3の開発には総額15億円以上かかった)が必要であり、日本語での開発は遅れを取っている状態でした。

なぜキーワードからの生成なのか?

前述のように「書く」AIの研究は目覚ましく発展していますが、ここ2〜3年で進んできた「読む」AIと比較して、「書く」AIの実活用はまだ少ないのが現状です。ELYZAの仮説としては、その障壁の1つは先述の「大規模言語モデル開発にかかる莫大なコスト」ですが、もう1つは「生成文の制御可能性」です。

人が業務などで文章を書く時、その内容は何でも良いわけではなく、必ず伝えたいことが決まっています。そのため文章生成AIには、人の意図を文章に反映させる機能が必要になります。ELYZA Pencilでは、人が書きたいことを最低限の工数でAIに伝える手段として「キーワード」を採用し、キーワードを通して生成される文章の内容をコントロールすることを可能にしました。

結果として、AIに全てを任せるのではなく、書きたいことは人が考えて、文章はAIが書くという「人とAIの共存」の形で業務を効率化することを目指します。このような背景から、人がAIを鉛筆のように使って文章を書く未来を思い描き、「ELYZA Pencil」という名前をつけました。

また、キーワードからの文章生成は「メール」や「職務経歴書」のような、ある程度文章の形式が決まっているユースケースにおいて威力を発揮します。その理由を説明する前に、一般的な文章の自動生成方法について説明します。文章の自動生成を行う場合、その方法は大きく「テンプレート型」と「生成型」の2つに分けられます。それぞれ下記のようなメリット・デメリットがあります。

画像1

ELYZA Pencilでは生成型を採用していますが、キーワードからの生成を行うことで、生成型のデメリットである「意図と違う文章が生成されること」を大幅に減らすことができます。また、メールや職務経歴書のような、大枠はテンプレートで良いものの、個々の内容と細かいニュアンスや言い回しは臨機応変に変えたい業務に特化することで、テンプレート型と生成型の両方のメリットを享受することができます。

ELYZA Pencilは、弊社独自の大規模言語モデルであるELYZA Brainを用いている点と、生成文の制御可能性を高めるためにキーワード入力を採用している点で先述の障壁を突破し、文章生成AIの社会実装を進めていくことを目指しています。

ELYZA Pencilによる生成結果

ELYZA Pencilではニュース記事・ビジネスメール・職務経歴書の3種類の文章を生成することができます。入力できるキーワードは2〜8個で、キーワードを入力後「AI執筆スタート」を押すと数秒で結果が返ってきます。それぞれの生成例は以下の通りです。

ニュース記事

スクリーンショット 2022-03-30 20.44.43 (1)

メール

スクリーンショット 2022-03-30 20.45.07

職務経歴書

スクリーンショット 2022-03-30 20.45.35

また、普段のビジネスメールや職務経歴書では出てこないようなワードを入れても柔軟に文章を生成してくれます。「ルフィ様」「悪魔の実」「ご返却のお願い」「ゴムゴムの実」「麦わら」といった有名な漫画に関するキーワードを入力して生成されたメールが以下です。普段のビジネスメールでは全く登場しないようなキーワードですが、それらしいメールになっているのが見て取れるかと思います。

画像5

人間が書いた文章との比較

ELYZA Pencilによる文章生成の速度や精度評価を行うために、AIと人間(東大生)の執筆能力について比較検証を行いました。選定したキーワードを用いて、ELYZA Pencilと東大生がそれぞれ文章を作成し、「速度」「流暢性」「正確性」「キーワード含有率」の大きく4つの観点で評価を行っています。

画像6

ELYZA Pencilは「正確性」「キーワード含有率」についてはやや東大生に劣るものの、「流暢性」では同等、「速度」では56分の1と圧倒的なスピード差をつける結果となっています。そのため、AIがドラフトを作成して人間がそれを修正するといった使い方をすることで、精度面での不安を取り除きつつ業務効率化が見込めます。

また、ELYZA Pencilが人間並の文章を書けることを検証するため、実は弊社CEO曽根岡のここ最近のツイートに、ELYZA Pencilが書いた文章を紛れさせていました。気づいた方はいらっしゃいますでしょうか?

画像7
画像8
画像9

多いものだと十数件のいいねをつけていただいており、お気づきになった方はいらっしゃらなさそうですね(リプライをいただいた方、騙すような形になってしまい申し訳ございません)。このことからも、ELYZA Pencilは人間が書いたものと遜色無い文章を生成できることがお分かりいただけたかと思います。皆様も是非ELYZA Pencilをお試しください。

さいごに

さらに詳しくELYZA pencilや開発をしたエンジニアの話を聞きたいという方はミートアップイベントを開催するのでぜひご参加ください!
■大規模言語AIを活用したNLP SaaS開発チームの裏話

その他にも、ELYZAではAIエンジニア、AIコンサルタントなど、様々な職種で一緒に事業を前に進めてくれる仲間を募集しています。多少なりともご興味を持っていただけた方は、メンバーと一度カジュアルにお話をしてみませんか?よろしければ、是非下記リンクよりお問い合わせ下さい。
カジュアル面談フォーム
採用職種の一覧

※1:自然言語処理とは人間が日常的に使う言語(ex. 英語、日本語、フランス語...)をコンピュータで処理し、言葉が持つ意味表現を解析する技術のことを言います。

この記事が気に入ったらサポートをしてみませんか?