「生成AI」の「生成」の意味と活用法【8日目】
はじめまして、松本と申します!
株式会社メディアエイドAdvent Calendar 2023 【8日目】の記事を担当します。
東京大学大学院情報理工学系研究科修士課程に在籍し機械学習の領域で研究しながら、メディアエイドでは新規事業立案や運用事業の効率化に携わっています。よろしくお願いします!
このアドベントカレンダーも8日目となり年の瀬が迫っている中、先日発表された2023ユーキャン新語・流行語大賞ではTOP10に“生成AI”が選ばれ、画像・自然言語処理の技術に光が当たった1年になりました。
メディア・コンテンツ業界,クリエイティブ業界でも今まさに各社が対応を迫られているこうした技術について、活用の基盤となる考え方と勘所について今年のうちにキャッチアップしておこう、というのがこの記事の趣旨です。
注意:技術的な詳細・正確性についてはかなり簡略化しています。この点ご留意ください。
そもそも「生成」とは…?
この1年、「生成」という言葉がふわっと使われ続けましたが、元々この「生成」という言葉は「生成モデル」という専門用語だったはず(という認識)です。
実際、Googleトレンドでこの2つの用語の使用頻度推移を見ると、2022年8~10月頃までは”generative models”の方が優位だったのが、11月頃を境に逆転し、その後”generative AI”が圧倒的な使用頻度になっているのがわかります。
ではこの間に何があったかというと
8月22日:Stable Diffusionのローンチ
11月30日:ChatGPTのローンチ
があり、こうした「実用可能な」サービスの台頭とともに専門用語を置き換える形で広まったのが「生成AI」という言葉でした。
従ってこの「生成」を理解するには「生成モデル」の意味を理解すればよさそうです。
例えば入力画像を「犬」「猫」に分類する問題を考えましょう。このとき確率つきでわかるようにするには
入力画像に対して犬である確率と猫である確率を別々に計算できるモデルを作っておいて、入力画像に対してどちらの値が大きいかで判断する
「犬」という条件下で生まれる画像と「猫」という条件下で生まれる画像の分布をモデル化しておいて、そこから「入力画像が犬/猫である確率」を計算する
の2つの方法があります。このうち1は直接的に「入力画像が犬/猫」である確率を求めていて、これを「識別モデル」といいます。
一方2の方法で間接的に「入力画像が犬/猫」である確率を求めるモデル化を「生成モデル」と呼びます。分類することだけを考えると2は回りくどいですが、こうすることによって「犬/猫」という条件を与えたときに高い確率で生まれる画像がどんなものかがわかるようになります。つまり、データを「生成」できるモデルになっています。
このように新たな「画像」「文」などを生み出せることから、従来のように「単純作業の置き換え」ではなく「クリエイティブさ」という価値を発揮することによる大きなインパクトが期待できます。
LLMの活用法
対象タスクによって変わりますが、大まかに言うと右に行くほど使用にコストが掛かりますが、より回答の性能が上がるイメージです。特に「学習リソースを持たないが自社のデータやシステムをLLMとともに活用したい」という場合に重要になってくるのが真ん中のAugumented Language Modelsで、メディアエイドでも「過去データやトレンドを踏まえた企画・台本作成」等に向けた取り組みを進めています。
この記事が気に入ったらサポートをしてみませんか?