見出し画像

AIの歴史

こんにちは、価値ビンです⭐️

今回は、AIとして世界を驚かせたChatGPTを中心に生成AIの歴史についてご紹介します。

AIは、今まで何度も生まれ、期待され、失望されて忘れられる…という歴史を繰り返してきています(チャットGPTなどの今回のAIブームは3回目、または4回目のブームと言われています)。

今回のチャットGPTなどに代表される、AI時代は続くと思いますか?思いませんか?
ChatGPTは教育の場面などで否定されることもありますが、うまく付き合っていくことで、とても有効であり、革命を起こすと考えられているのが現状ではないでしょうか。

大人も子供もスマホが当たり前になったように、ChatGPTのような生成AIを当たり前のように活用し、さらに個人用のパーソナライズAIとして使う時代が来るでしょう。

今回はAIの歴史から、ChatGPTの誕生について、次週は実際のAIの使い方や遊び方について記載していこうと思います。
AIの使い方の参考事例が知りたい人は、今回の記事は読みとばしていただき、来週のブログをご覧くだされば良いかと思います。


1.生成AIまでの歴史とChatGPTの登場

1-1. AIと呼ばれたものの歴史

AIの歴史を見て見ましょう。
実は現在のAIブームは第3のブームと言われており、過去にも2回のブームが来ています。
そして、実はその度に技術の発展に驚い、そしてその驚きはただのブームとして終わってきました。
果たして今回のChatGPTの登場が単なる驚きで終わるのか、いよいよAIが人類に本当の役に立つものになるのか見モノです。
そんな想いを巡らせながら、これら3回のブームで何が起きてきたか見てみましょう。

参考:AIとは?

1-1-1. 第一次AIブーム (1950年代 - 1970年代初頭)

第一のブームは、AIの基盤となる理論や手法の開発が始まりました。この時期、最初のAIプログラムが作成され、ニューラルネットワークや遺伝的アルゴリズムなどの初期のAI技術が生まれています。しかし、計算能力の制約や、高度な問題解決能力を持つAIを作る難しさから、1970年代に入ると一時的な停滞期(AIの冬)を迎えました。

ご参考:ニューラルネットワークとは?
ご参考:遺伝的アルゴリズムとは?

このころにもいくつか著名なソフトウェアが登場します。

イライザ (ELIZA)

1964年にMITのジョセフ・ワイゼンバウムによって開発されました。ユーザーと基本的な会話をすることができる初期の自然言語処理プログラムで、心理療法家を模倣しました。
当時のコンピュータ技術を考慮すると、その対話能力には驚きの要素があり、一部のユーザーはイライザとの対話に深い意味や感情を見出し、実際の心理療法のセッションのように感じることが報告されました。
しかし、ELIZAは実際には理解しているわけではなく、入力された言葉に対してパターンに基づいて反応を返す仕組みだったので、少し深い対話を試みると、その制約が明らかになりました。

ご参考:自然言語処理とは

SHRDLU

1970年代初頭にMITでTerry Winogradによって開発されました。人々が自然言語(人間が日常的な意思疎通や情報の伝達、記録、思考などのために用いる言語のこと)で問い合わせると、特定の仮想空間内での行動やオブジェクトの操作を解釈・実行できるプログラム。
人間のような言語理解能力や空間認識を持ったコンピュータプログラムとして、SHRDLUは多くの人々を驚かせました。
しかし、SHRDLUは限定された「ブロックの世界」でのみ機能し、その外の現実の世界の認識や対話はできませんでした。つまり、実世界での応用性には大きな限界がありました。

ご参考:空間認識(3次元空間を認識するってどういうこと?)

パーセプトロン (Perceptron)

1957年にFrank Rosenblattによって提案され、初期のニューラルネットワークの一形態で、基本的な画像認識タスクに使われました。
ニューロンの動作を模倣するこのシンプルなアーキテクチャが学習や認識を行うことが、当時の研究者や一般の人々には新鮮に映りました。
1969年に出版された「Perceptrons」という書籍において、パーセプトロンは線形分離可能な問題しか解決できないこと、特にXOR問題(排他的論理和)のような線形分離不可能な問題には対応できないことが指摘されました。

ご参考:画像認識タスクとは
ご参考:XOR問題とは?

少し難しい歴史が続き、理解するのは難しいところもありますが、人類が度重なる壁にぶつかっていると考えてください。

1-1-2. 第二次AIブーム (1980年代 - 1990年代)

専門家の知識を組み込んだエキスパートシステムが商業的に成功しました。しかし、これらのシステムは拡張性に欠け、維持コストも高かったため、ブームは短命に終わりました。再び、AIの冬と呼ばれる停滞期に突入してしまいます。
ここでもいくつか紹介しましょう。

エキスパートシステム

この期間中、専門家の知識をコンピュータ上で模倣するエキスパートシステムが一世を風靡した。代表的なものに「MYCIN」があります。これは特定の感染症の診断と治療のためのシステムでした。
人の専門的知識や経験をコンピュータに組み込むことで、専門家に匹敵する判断や提案ができることに多くの人々が驚きました。
しかし、エキスパートシステムは大量の専門的知識を必要とし、知識の更新や追加が困難であること、そして汎用性に欠けるため、特定の分野以外での利用が難しい状態でした。

バックプロパゲーション (Backpropagation)

1980年代にニューラルネットワークの学習方法として普及。この技術のおかげで、多層のニューラルネットワークの学習が現実的になり、以前よりも複雑な問題に対処できるようになりました。しかし、効果的なバックプロパゲーションのためには、しばしば大量の訓練データと計算リソースが必要でした。

今はこのニューラルネットワークを使っているのですが、当時はパソコンの性能が乏しかったため、なかなか先に進めない時代が続くのです。

1-1-3. 第三次AIブーム (2010年代 - 現在)

そしていよいよディープラーニングという技術が登場し、大量のデータと強力な計算能力を持つコンピュータを利用して、以前のブーム期には考えられなかったような高度な認識や予測を行うAIが登場しました。
画像認識、自然言語処理、ゲームのプレイなど、多岐にわたる分野でのAIの実用化が進められています。
ChatGPTもこの第三に入りますが、ChatGPTは第四のブームという人もいます。

ご参考:ディープラーニングとは?

いくつか紹介しましょう。

AlexNet

2012年に画像認識コンテスト「ImageNet」で突出した結果を示し、ディープラーニングブームの火付け役となりました。しかし、ディープラーニングが大量のデータと計算リソースを必要とすることが明らかになり、資源に制約がある研究者や企業は、大規模なモデルの訓練に難しさを感じることがありました。

AlphaGo

Google DeepMindによって開発されたコンピュータ囲碁プログラムで、囲碁の世界チャンピオンに勝利。深いニューラルネットワークと強化学習の組み合わせが注目されました。人工知能が、人間の直感や経験が非常に重要とされる囲碁のトッププレイヤーに勝利するとは、多くの専門家や囲碁のファンにとって驚きの事態でした。しかし、AlphaGoは囲碁の特定のタスクに特化して設計されているため、他のタスクや応用にはそのままでは使用できません。

囲碁は複雑でコンピューターは人には勝てないと言われていたのですが、ついに人を超えてしまいました。
この辺りから、AIが人に取って代わる姿が徐々に見え始めた時期と言えるでしょう。

ご参考:強化学習とは?

1-2. ChatGPTの開発からリリースまでの経緯

さて、いよいよChatGPTの登場です。
ChatGPTはOpenAIによって開発された、会話型の生成AIです。初のバージョンから、OpenAIは大量のテキストデータを学習させ、人間のように自然なテキストを生成する能力を持つモデルを目指しました。数回のアップデートを経て、ChatGPTはさらに高度になり、多様なトピックや質問に対応することができるようになりました。

ご参考:生成AIとは?

1-2-1. GPT (Generative Pre-trained Transformer)

  • リリース: 2018年

  • モデルの概要: GPTはTransformerアーキテクチャを使用しており、事前学習と微調整の2段階の訓練プロセスを採用しています。最初に大規模なテキストデータで事前学習を行い、次に特定のタスクに合わせて微調整を行います。

  • 特徴: GPTのアプローチは、タスク固有のアーキテクチャを持たない点にあります。同じ基本モデルを様々な自然言語(英語や日本語など)の解析を必要とするタスクに適用することができるという点で、非常に革命的でした。

ご参考:Transformerとは?
ご参考:アーキテクチャとは?

1-2-2. GPT-2

  • リリース: 2019年

  • モデルの概要: GPT-2は、その前身であるGPTの成功を受けて開発され、1.5億のパラメータを持つ大規模なモデルとしてリリースされました。

  • 特徴: GPT-2は文章生成能力において非常に高い性能を発揮しました。しかし、その能力が高すぎると考慮したOpenAIは、初めてのリリース時に完全なモデルを公開しないという決定を下しました。後に、間違った情報や悪用のリスクを評価した後で、完全版を公開しました。

ご参考:パラメータとは?

1-2-3. GPT-3

  • リリース: 2020年

  • モデルの概要: GPT-3は、GPT-2と比べてさらに大規模なモデルとして登場しました。1250億のパラメータを持ち、その前のモデルよりもはるかに洗練されたテキストを生成することができます。

  • 特徴: GPT-3は、特定のタスクに対する微調整なしにも高い性能を発揮することができる「ゼロショット」や「ワンショット」学習の能力を持っています。この性能の高さから、多くのアプリケーションやサービスでの利用例が登場しました。

参考:ゼロショット学習とは?
参考:ワンショット学習とは?

1-2-4. ChatGPTに当たるGPT-3.5を公開

2022年11月に対話型AI「ChatGPT」をリリース。
ChatGPTの内部で動いているモデルはGPT-3.5と呼ばれパラメータ数は3550億個。
Chatというインターフェースで誰でも簡単に利用できるようなユーザーインターフェースにしたのが画期的です。

1-2-5. GPT-4

そして、2023年にGPT-4がリリースされました。
大きな特徴として「マルチモーダル」があり、テキスト情報だけでなく、画像や音声などのフォーマットも入力データとして処理できるように設計されています。
ただし、GPT-4は安全性のリスクから詳細の設計は非公開とされていますし、まだ現状では画像や音声を生成することができません。

これらのモデルは、NLPの研究やアプリケーションに革命をもたらしました。GPTシリーズは、文章生成、質問応答、翻訳など、多岐にわたるタスクで高い性能を示しており、その影響は今後も続くと考えられます。

ご参考:NLPとは?

2.ChatGPTの活用方法

ChatGPTの登場は世界に驚きを示しました。
実際に利用者(登録者)が1億人までに到達したのはわずか2カ月です。
Facebookは54カ月、Instagramは30カ月、かなり早いTikTokでも9カ月かかっているので、かなり驚異的な数字です。

一方、大学でレポートでの利用を禁止するなど、使われ方に対する戸惑いも出てきています。
現時点で、どのような活用の仕方がよいのでしょうか。

2-1. 情報収集ではなく、アイデア発想の相談相手と考える

ChatGPTの利用として、よく調査に使っている声が聞こえます。
後述しますが、情報収集にも役立つ反面、最も有効なのはアイデア発想に活用することです。

アイデアを一人で考える際にはどうしても発想が凝り固まってしまいます。
そんな時に、チャットGPTに聞いてみると、複数のアイデアを出してくれます。
そこから得た発想を使って、さらにさらに深掘りアイデアを練っていく、そんな使い方をすると非常に有効だと思います。

2-2. 情報収集のサポート

情報収集のサポートにも有効です。
ただ、あくまでサポートと思っておいた方が良いでしょう。
というのも、チャットGPTは文章を生成するのが上手いので、一見それっぽく文章を出しますが、エビデンスを出すことにはまだあまり向いていません。
なんの情報を集めればよいかのあたりをつけるという気持ちで確認し、実際にはGoogle検索や論文検索でエビデンスやソース、一般的にはどういう意見が多いのかなど自分の手を使って調べていくのが良いでしょう。

2-3. 言語学習としての利用

言語学習としての利用も有効です。
よりかっこいい文章にする。ギャル語にしてもらう。間違ったところを修正し、改善ポイントを教えてもらう。
そんなこともチャットGPTではできてしまいます。

英語日記を書いて、添削してもらうこともできるので、試してみてください。

2-4. プログラミングとコーディング

AIを使って、コードのエラーを特定したり、コーディングの提案をしたりすることで、プログラミングの学習をサポートします。

他にもいろいろと活用方法がありますが、代表的なものを書きました。
全体的に言える注意点としては、主軸をチャットGPTに置かないことです。
つまり、最終決定者は人間であることを意識して使いましょう。

悪い例として、チャットGPTで書いたことを鵜呑みにして、それをレポートやあたかも自分の意見として言うこと。
チャットGPTはうまく文章を生成しますが、感情や信念はなく、必ずしも正解とは限りません。
最終決定するのは自分であり、あくまでサポートをしてくれるという位置づけで考えるのが良いでしょう。

チャットGPTを使用するときの注意点として、入力する情報は個人情報や機微な情報を入力することは避けてください。



(株)Kachibin
発達障がい・グレーゾーンのある10歳〜15歳のお子様に向けてマンツーマン英語レッスン&探求型学習をオンラインで提供しております。
✨お気軽にご連絡ください✨
rita@kachibin.com
✨ホームページ✨
https://www.kachibin.com/

「価値ビン」が目指しているのは以下の2つです。
1) 子ども達自身が自らの成長を感じて「僕の・私の価値がビ~ンと上がった!」と感じてくれること。
2) 彼らに関わる大人達が、子ども達の変化を感じて自分の価値がビ~ンと上がった!」と感じてくれること。

このブログが、我々が子ども達の成長のサインを見つけて受け取り、彼らと共に学びの旅を歩むための、数ある冒険の書の中の一つとなってくれることを願っています。



この記事が気に入ったらサポートをしてみませんか?