見出し画像

今日から始める生成AI『ロケットスタートガイド』🚀 基礎から使いこなせるようになるまで

割引あり

はじめに

こんにちは!AI-Bridge Labのこばです!
今回は「これから生成AIを始めたい」方に向けて、知識ゼロから生成AIを仕事やプライベートで使いこなせるようになるまでの知識を一気にインプットできる記事をご提供します。

AIツールの進化は速く、情報も氾濫しています。そのため、「結局、何を使えばいいのかわからない」と感じる方も多いでしょう。
本記事では、生成AI導入コンサルタントの視点から、トレンドの見極め方も含めて分かりやすく整理してお伝えします。
また、精度の高い回答を出すためのプロンプトのテクニックなど、生成AIを使いこなすためのエッセンスもぎっしり詰まっていますので、ぜひ最後までご覧ください。

この記事を読み終える頃には、生成AIに関する情報が整理され、自分にあった生成AIを使いこなすことができるようになるはずです👍


こんな方にオススメ!

  • 生成AIに興味があり、これから本格的に使い始めたい方

  • ChatGPTなど無料ツールを触ってみたものの、イマイチ使いこなせていないと感じている方

  • 生成AIの最新情報や活用事例を知り、仕事やプライベートに役立てたい方


前提:生成AI知識レベルの定義

生成AIの知識レベルを以下のように定義します。完全な未経験の方はレベル0、生成AI業界をリードする専門知識を持っている方をレベル5とします。

この記事では「レベル2」までの知識と、覚えておくと便利なAIツールを一気に習得することを目指します。
生成AIを使った問題解決力が身につく「レベル2」になれば、日常的な業務の効率化はもちろんのこと、生成AIで高品質な画像、音楽、動画などのコンテンツ制作も可能になります。

また、「レベル2」程度の知識があれば、わからないことがあってもAIのサポートを受けながら独学で進めることができます。
例えば、生成AIの応用技術を習得したい場合、API連携などの専門知識が必要になりますが、その方法をAIに適切に質問しながら進めることができるでしょう。

つまり、AIを使いこなすための最短ルートとして、レベル2までの「基礎知識」と「生成AIツールの現在地」を理解していれば、一気に最新情報にも追いつけるというわけです。

本記事を読まれる際のご注意

本記事では生成AIに関する総合的な理解を目指しています。そのため、個別のAIツールの使い方や内部的な仕組みの説明は割愛することがあります。

ChatGPTを例に挙げれば、ログイン方法や具体的な操作手順ではなく、ChatGPTを使うことでどのような成果が得られるのか、どのように活用することでより効果的な結果を引き出せるのか、といった総論的な知識を提供します。

AI-Bridge Labのnoteでは各種AIツールの個別の使い方についての情報も発信していますので、気になる方はそちらをご覧ください。



1. レベル0:生成AIとは?

生成AIは、人工知能(AI)技術の一分野で、画像や文章、音楽などのコンテンツを自動で生成する技術です。これにより、人間が行っていた作業を効率化し、さらには新しい創作の可能性を広げることができます。

生成AIという言葉は「学習したデータを基に新しいコンテンツを生成するAI全般」のことを指します。有名なChatGPTもその代表的なものの一つですが、下図のようにカテゴリーに分けて分類すると更に理解が深まります。

ChatGPTは生成AIのLLMカテゴリーの中の一つのツールです。

このようにカテゴリー分けして覚えると、名前を聞いたときにどういうものかが分かると思います。動画も作れる画像生成AIなど、複数の機能を備えている場合もありますが、それらは「マルチモーダル」と呼ばれたりします。

まずこの時点では、「ChatGPTがLLMというカテゴリー内の一つであり、他にも同じような機能を持つ生成AIがたくさんある」ということを覚えておけば問題ありません。


2.レベル1:LLMとは

生成AIの基礎知識としてLLMは欠かせません。LLMとは大規模言語モデル(Large Language Model)の略で、この先も頻出のキーワードになりますので自然と覚えられると思います。ChatGPTはこのカテゴリーで最も有名なサービスです。

LLMは、膨大なテキストデータを学習することで、言葉の意味や文脈を理解し、人間のように自然な文章を生成したり、複雑な質問に答えたりすることができるAIです。

生成AIの中でも特にビジネスシーンでの利用が多く、注目度が高いのがLLMで、その進化速度は凄まじいです。

昨年末に登場したAnthropic社のLLM『Claude3 Opus』というモデルはIQテストで100(一般的なIQの平均値)を超えたと話題になりましたが、2024年6月現在はこのモデルでも上位6番目の性能です。

LLMとしての最高性能モデルは主に、ChatGPT、Claude、Geminiの3モデルが上位争いをしている構図で、大体1ヶ月~2ヶ月単位のうちに1位が塗り替わっています。
後の章で各種LLMの特徴や違いについて詳しく掘り下げていきますので、ここではざっくりと、「ChatGPT」以外のLLMがどのような位置につけているのか把握しておければ問題ありません。

LLMの性能をユーザー評価で順位付けするサイト「LMSYS Chatbot Arena Leaderboard」より

2-1.推論とは?

LLMが一般的なプログラムで動くチャットボットと違って人間らしい返答ができる理由の一つに、推論があります。
推論は、私たちが日常的に行っている思考の過程です。たとえば、「雲が厚くなってきたから雨が降りそうだ」と考えるのも推論の一例です。これは、既に知っている情報(雲が厚いときは雨が降りやすい)を使って、新しい結論(もうすぐ雨が降る)を導き出すものです。

推論を使うことで、単に規則的なプログラムのように指示された内容に答えるだけではなく、似たような事例についても柔軟に考えることができます。

推論には、主に以下の種類があります。
・演繹(えんえき)的推論:一般的な法則から結論を導く

確実性が高い推論方法です

・帰納的推論:具体的な事例から一般的な法則を導く

多くの場合正しいですが、特殊な例もあるので正確かどうかは確率的です。

・アブダクション:最も可能性の高い説明を導く

与えられた条件や情報を元にクリエイティブな仮説を立てることができます。

これらを組み合わせることで、LLMは複雑な問いにも回答できるようになっています。

2-2.LLMの推論例

LLMはどんなことができるのか

LLMの基本的な機能は以下の通りです。

  • 質問に答える
    例えば、「天気予報を教えて」と聞くとその日の天気を教えてくれます。

  • 文章を作成する
    エッセイやレポート、メールなど、様々な文章を書けます。
    表やマークダウン形式にして出力できます。

  • 翻訳する
    異なる言語間で文章を翻訳することができます。

これらはあくまでも基礎的な機能です。ここに画像や音声の認識などあらゆる機能と連携をすることによって、LLMは本領を発揮することができます。

2-3.LLMの仕組み

では、一般的なLLMがどのようにユーザーのチャットから回答を生成しているのか、図を元に仕組みを説明します。

  1. ユーザーの入力:

    • ユーザーが「おはよう、今日の天気は?」と質問します。

  2. トークナイザー:

    • ユーザーの質問はまず「トークナイザー」というシステムで、言葉を細かく分けた「トークン」という単位に変換されます。これはコンピュータが理解しやすくするための処理です。

    • 例えば、「今日は良い天気ですね」という文章は、「今日」、「は」、「良い」、「天気」、「です」、「ね」といったトークンに分割されます。

  3. AIモデルによる処理:

    • トークン化された質問は、GPT-4oのようなAIモデルに送られます。AIモデルはそのトークンを処理し、最適な回答を生成するためのトークンを作り出します。

  4. デコーダーによる変換:

    • 生成されたトークンは、元の言語に戻されて人間が理解できる文章になります。この場合は日本語の文章です。

    • デコーダーは、AIモデルが生成したトークン列に基づいて、確率的に最も自然な単語の列を生成し、人間が理解できる文章に変換します。

  5. ユーザーへの回答:

    • 最終的に、「おはようございます!今日の東京の天気は曇りで、一日中雨が降る可能性があります。」という回答を返します。

      例えばこの文脈上では、[おはようございます!]は[今日]よりも後に来る確率が高いと判断して並べていきます。私達人間も脳内で同じように意味を持つ単語等を日本語に適した文法に並べ直して発声しているといえます。

LLMはこの一連の仕組みを使うことで、ユーザーに対して適切な回答を行っています。

2-4.本章のまとめ

LLM(大規模言語モデル)は、単なる規則的なプログラムではなく、学習と推論を通じて回答を生成しています。これはちょうど、人間の会話のロジックに近い仕組みです。そのため、まるで人間と話しているかのような自然な対話が可能になっています。
裏を返すせば、AIに対しても人間とのコミュニケーションと同様に、充実した前提条件を元に、分かりやすく具体的な質問を投げると良い結果が得られる確率が高くなることが分かると思います。

生成AIの基礎的なポジションであるLLMを理解することで、次に紹介する他の生成AIサービスについてもより深く理解できるようになります。


3. レベル1:LLM以外の生成AIについて

前章では、主に文章を扱う人工知能(AI)である大規模言語モデル(LLM)について学びました。本章では、LLM以外の生成AIに焦点を当て、画像、音楽、動画などを作り出すAIについて概要を説明します。

これらの技術を今すぐ使う予定がなくても、基本的な理解を持つことで、将来的な応用可能性を見出しやすくなります。様々な分野でのAIの可能性を探るため、以下のような生成AIの概要を把握しておくことをおすすめします。

3-1. 画像生成AIの概要

名前の通り、このAIは画像を作り出します。主な機能は、テキストの説明から画像を生成することです。内部では大規模言語モデル(LLM)も働いており、入力されたテキストを解析しています。

ここから先は

14,992字 / 21画像 / 1ファイル
この記事のみ ¥ 1,200〜
期間限定 PayPay支払いすると抽選でお得に!

皆さまの温かいサポートのおかげで、活動を続けることができています。もしよろしければ、引き続き支援をお願いできますと幸いです。より質の高い記事投稿に励みます!