見出し画像

6 文章自動生成 日本語ではどうか

Insight Tech アイタスクラウドの営業担当です。
最近は「AIが○○を自動で○○」「㈱○○、○○AIをローンチ」というニュースが後を絶ちませんね。日々AIの勢いを肌で感じています。

我々の事業領域である文章解析、言語処理においても日々新たなニュースが飛び交っていますが、「ついにこのレベルまできたか」と、驚きと不安が入り混じったような気持ちになる記事を目にしました。

驚き

テスラやスペースXなどでお馴染みのイーロン・マスク氏が共同創設者であるopenAIという団体の文章自動生成AI「GPT-3」が取り上げられているのですが、簡単な言葉から人間が書いたような文章を生成する代物のようです。

キーワードから小説や画像を自動生成 自然言語処理の革命児「GPT-3」の衝撃 2021年01月15日  IT media NEWS

画像1

これに対する評価ですが、「高精度過ぎる」ということでマイクロソフトが独占的ライセンス契約を結ぶほどとのことでした。
事実、このAIで生成された文章をブログとしてUPしたところ、AIだと見抜いた人はほとんどいなかったようです。

「高精度過ぎる文章を作る」Microsoftが言語モデルGPT-3の独占的ライセンスを取得 2020年10月11日 Ledge.ai

人間が書いたような精度で文章が生成されるというのは夢のような話(官公庁や自治体の公文書作成業務等が大幅に短縮される?)ですが、日本語となるとどうなのかやはり疑問が残ります。

日本語

日本語の場合他の言語と異なり文章中に単語の区切りがなく、表現の曖昧さも際立つため、言語処理の難易度が高いとされています。日本語の曖昧さを紹介する際に良く引き合いに出される例として以下のようなものがあります。

 例:黒い目の大きな猫 

「"黒い目" の "大きな猫"」「"黒い"  "目の大きな猫"」 といった具合に2通りの解釈ができますよね。黒いという形容詞と大きなという連体詞が、
「目」と「猫」のどちらにかかっているのかが分かりづらいという、日本語の曖昧さを表現する代表的な例です。

英文の場合は

Big cat with black eyes か Black cat with big eyes となりますのではっきり分かりますね。故に要約もしやすいようです。


日本語においても同様のことができるようになった時のインパクトは絶大だと思います。しかしどのように扱うかは慎重になるべきかと。

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?