いまさら聞けないAI入門

2024年1月9日 12:31

はじめに

昨今ChatGPTやGoogle Bard、Midjourneyなど様々なAIツールが登場しています。
その中で「なんか分からないけど、とりあえず使ってる」という人も多いのではないでしょうか。
今回はそんな人向けに、入門、初心者向けにAIの基礎や周辺用語を整理していきます。
これを読むことで「よく聞くAIのキーワード」を理解できる構成になっています。

対象者

AI入門者・初心者
AIに興味がある人
ChatGPTなどの生成AIを活用していきたい人
AIの周辺用語を総整理したい人

お断り

本記事は入門者向けなので「わかりやすさ」を重視します
難解な数式等は概要のみの解説で留めます

AIの基本

AIとは何か
AIの進化の歴史
記号主義とコネクショニズム
AIの現実的な応用事例

AIとは何か

AI、または人工知能は、「人が持つさまざまな知能を人工的に再現する技術」と定義されます。

ここでいう「知能」とは、論理的思考、抽象的思考、予測、学習、言語理解、問題解決などの能力を指します。

これらは、人間が日常的に行っている複雑な思考プロセスです。

例えば、論理的思考では、AIはデータを分析し、一貫した結論を導き出します。
学習の面では、機械学習技術を通じて新しい情報を取り込み、自己改善を図ります。
言語理解に関しては、自然言語処理（NLP）を使って人間の言葉を解釈し、適切に応答します。

AIの進化の歴史

1956年: ダートマス会議で「人工知能」という用語が初めて使用される。この会議は、AIという概念が学問として確立された瞬間とされています。
1959年: ナサニエル・ロチェスターが数学的定理の証明を行うAIを開発し、AIの可能性が初めて具現化される。
1965年: ELIZAが開発される。これは初の自然言語処理プログラムであり、人間との対話を可能にした重要な進歩です。
1991年: 世界中の情報へのアクセスが可能になるwwwが実装され、AIの研究と応用においてインターネットが重要な役割を果たすようになる。
1997年: IBMのDeep Blueがチェスの世界チャンピオンを破ることで、AIの複雑なタスクにおける能力が証明される。
2011年: IBMのWatsonがクイズ番組で人間のチャンピオンを破ることにより、AIの複雑な問題解決能力が一般に認知される。
2012年: Googleの研究チームがAIに「猫の概念」を学習させることに成功し、AIの画像認識能力が大幅に進化する。
2016年: AlphaGoが世界トップレベルの囲碁棋士を破る。これは、AIが直感や創造性を要求される分野でも人間を超えうることを示す出来事であった。
2018年: AIが電話を通じて人間と対話し、サービス予約を行う能力を獲得。これにより、AIの実用的な応用の幅が広がる。
2019年: 不完全情報を扱うゲームであるポーカーや麻雀において、AIが人間のトッププレイヤーと互角に戦えるようになる。
2020年: OpenAIが開発したGPT-3が、人間と見分けがつかないレベルの自然言語生成能力を示す。

これらの出来事は、AIの能力が時間の経過とともにどのように進化してきたかを示しています。各出来事は、AI技術が特定の課題を解決し、新たな領域へと進出していく過程を物語っています。

1956年のダートマス会議

AIの概念や研究自体はこれ以前から存在していたが、この時代には先進的な研究を共有する場は少なく、この会議によってAIの存在と可能性が広がったと言われています。

記号主義とコネクショニズム

記号主義とコネクショニズムは、人工知能（AI）の研究分野において、異なるアプローチを代表する二つの重要な概念です。

記号主義は「理屈」を重視し、コネクショニズムは「感覚と経験」を重視しています。

記号主義

記号主義は、AIが「ルールと命令に従って考える」方式です。ここでのAIは、人間の思考をルールや言葉、数値といった記号に置き換えて動作します。
たとえば、ルールに基づいて問題を解決する古いスタイルのコンピュータプログラムがこれにあたります。この方法はルールが明確な場合にはうまく機能しますが、現実世界のように複雑で不確実な状況では限界があります。

コネクショニズム

コネクショニズムは、「人間の脳を模倣したAI」のアプローチです。
ここでのAIは、脳の神経細胞（ニューロン）のように動くたくさんの小さな計算部品から成り立っています。
これらは経験から学習し、自分自身を調整することができます。深層学習やニューラルネットワークがこの例です。
これらは大量のデータからパターンを学び、画像認識や言語処理など複雑な作業をこなせます。この方法は柔軟で多様なデータを扱えますが、内部の動作が複雑で理解しづらい面もあります。

AIの現実的な応用事例

ここでは代表的かつ身近なものをピックアップして紹介します。

例1: 日常生活でのAI

スマートアシスタント: SiriやAlexaのような音声認識AIは、日常の質問に答えたり、音楽を再生したり、スマートホーム機器を制御するなど、さまざまなタスクを支援します。
推薦システム: NetflixやAmazonのようなサービスでは、AIがユーザーの好みや行動を分析し、個人化された商品やコンテンツの推薦を行います。

例2: ビジネスでのAI

顧客サービス: AIチャットボットは、顧客からの問い合わせに迅速かつ効率的に対応し、顧客サービスの品質を向上させます。
データ分析: AIはビッグデータを分析して有用な洞察を提供し、ビジネスの意思決定をサポートします。

例3: 医療でのAI

病気の診断: AIは医療画像を分析して、がんなどの病気を早期に発見するのに役立ちます。
治療計画: 患者のデータを基に最適な治療方法を提案し、医師の判断をサポートします。

例4: 教育でのAI

パーソナライズされた学習: AIは学生の学習スタイルや進度に合わせて、カスタマイズされた教材や学習計画を提供します。
自動評価システム: 試験やレポートの自動採点により、教員の負担を軽減します。

例5: 科学研究でのAI

薬物発見: AIは新しい薬の候補を予測し、薬物開発のプロセスを加速します。
気候変動の研究: AIは気候データを分析し、気候変動に関するより深い理解を提供します。

これらの例から分かるように、AIは多岐にわたる分野で革新的な変革をもたらし、私たちの生活や社会に重要な影響を与えています。

AIと関係するプログラム

アルゴリズム

アルゴリズムは、ある特定の問題を解決するための手順や規則の集まりです。コンピュータ科学において、アルゴリズムはデータを処理し、計算を行い、問題を解決する方法を指定するために用いられます。
AIにおけるアルゴリズムは、特に機械が学習し、推論し、意思決定を行う方法を定義します。

基本的なアルゴリズム

以下では、コンピュータプログラミングにおける基本的なアルゴリズムのいくつかを紹介します。

探索アルゴリズム

探索アルゴリズムは、データセット内の特定の要素を見つけるために使用されます。代表的な例としては以下があります：

線形探索: データセットを一つずつ順番に調べて目的の要素を探します。簡単だが大きなデータセットでは非効率です。
二分探索: 事前にソートされたデータセットで使用され、中央の値を比較しながら探索範囲を半分に絞り込んでいきます。より効率的ですが、ソートされたデータが必要です。

データを並べるソート

ソートアルゴリズムは、データを特定の順序に並べ替えるために使用されます。よく使われるソートアルゴリズムには以下のようなものがあります：

バブルソート: 隣接する要素を比較して順番に並べ替えていく方法です。理解は簡単ですが、効率はあまり良くありません。
クイックソート: データをピボットと呼ばれる基準値に従って分割し、それぞれを個別にソートする方法です。大量のデータに対して高速に動作します。

その他のアルゴリズム

他にも様々なアルゴリズムがあるので一部紹介をします :

動的計画法: 複雑な問題をより小さな部分問題に分割し、各部分問題の解を記憶しながら全体の最適解を求めます。
グラフアルゴリズム: ネットワークや関係のマッピングに使用されるアルゴリズムで、最短経路問題やネットワークフロー問題を解くのに用いられます。

AIアルゴリズムの基本

次にAIのアルゴリズムを紹介していきます :

機械学習アルゴリズム: データから学習し、新しい情報に基づいて改善されるモデル。このカテゴリには、教師あり学習、教師なし学習、強化学習などが含まれます。
ニューラルネットワーク: 複数の層から成るネットワークで、データを高度に処理し、パターン認識や複雑なタスクを実行します。
自然言語処理（NLP）: 言語データを理解し、処理するためのアルゴリズムで、翻訳や感情分析などに使用されます。

この辺りの細かい内容は別記事で詳しく解説していくので、一旦は「こんな感じのものがあるのか」といった理解で大丈夫です。

AIのアーキテクチャ

人工知能（AI）の世界では、アーキテクチャはその機能と効率性を決定する重要な要素です。アーキテクチャとは、「AIシステムを構築する際の全体的な設計図」であり、どのようなアルゴリズムを使用し、どのようにデータベースと組み合わせるかという計画を含みます。

AIアーキテクチャは、特定の目的を達成するための戦略的な計画です。たとえば、Googleの検索エンジンは、ユーザーが検索バーに入力したキーワードを処理し、関連する情報を提供するために、複数のアルゴリズムを巧みに組み合わせています。このように、基本的なアルゴリズムはさまざまなプロセスで活用され、それらの組み合わせがAIの能力を形作ります。

AIのアーキテクチャを設計する際には、その使用目的や組み込むシステムの性質を考慮する必要があります。例えば、画像認識システムを開発する場合、「自社でデータベースを構築するか」「他社のAIサービスを利用するか」といった選択から始まります。

その後、システムの具体的な統合方法、ユーザーインターフェース、および運用上のルールなど、より詳細な設計に移行します。

AIの思考法

人工知能（AI）の思考法は、そのアプリケーションや目的によって大きく異なります。主に、ゴールベース、タスクベース、ケースベースの三つのアプローチが代表的なので、紹介していきます。

ゴールベース
ゴールベースの思考法では、AIは「特定の目標を達成するために」行動します。このアプローチは、問題を解決するために最適な経路を見つけることに重点を置いています。たとえば、チェスのAIは、ゲームに勝つという明確なゴールに向かって最善の手を考えます。この方法では、さまざまな可能性を評価し、目標達成に最も効果的な選択を行うことが重要です。

タスクベース
タスクベースの思考法では、AIは「特定のタスクや作業を実行することに」集中します。これは、ゴールベースの思考よりも具体的なアクションに焦点を当てたアプローチです。例えば、音声認識システムは、ユーザーの話す言葉をテキストに変換するという特定のタスクを遂行します。タスクベースのAIは、一連の手順やルールに従って操作を行い、特定のタスクを効率的に完了させます。

ケースベース
ケースベースの思考法では、AIは「過去の事例や経験を基に判断」を行います。このアプローチでは、過去の事例を分析し、類似した状況に適用することで問題解決を図ります。たとえば、法律相談のAIは、以前の裁判例を参照して最適な助言を提供します。ケースベースの思考は、経験と事例から学習することで、より複雑でユニークな問題に対応する能力を持っています。

これらの思考法は、AIがどのように情報を処理し、判断を下し、行動を選択するかという基本的なフレームワークを提供します。

各アプローチは、AIの目的や適用される環境に応じて異なり、それぞれが特定のシナリオや要件に適しています。

AIと関係するデータ

データの収集から分析・応用までの全体像

データ収集から分析・応用までのプロセスは下記のようになっています :

データ収集
データの前処理
データの分析と解釈
データの応用

データ収集
データのプロセスは、まず収集から始まります。これには、センサーからの自動収集、ユーザーからの入力、オンラインアクティビティのトラッキング、公共のデータセットの利用など、多様な方法があります。例えば、Eコマースサイトはユーザーの購買行動を記録し、ソーシャルメディアプラットフォームはユーザーのインタラクションや投稿を収集します。

データの前処理
収集されたデータは、しばしば未加工で不完全です。
データの前処理には、クリーニング（不完全または誤ったデータの修正）、標準化（異なるソースからのデータを一貫した形式に変換）、分類（データを特定のカテゴリーに分ける）などが含まれます。この段階は、データの品質を高め、AIモデルの訓練に適した形式にするために不可欠です。

データの分析と解釈
前処理されたデータは、次に分析されます。これには統計的手法や機械学習アルゴリズムが用いられ、データから有意義なパターンやインサイトを抽出します。例えば、消費者行動データから購買傾向を予測したり、医療データを分析して病気の早期発見に寄与したりします。

データの応用
最終的に、分析されたデータはAIアプリケーションに統合されます。これにより、パーソナライズされた推薦システム、自動化された顧客サービス、予測メンテナンスシステムなど、様々な形で実用化されます。ここでは、データが直接的なビジネス価値や顧客体験の向上に貢献します。

構造化データと非構造化データ

構造化データ

構造化データとは、予め定義されたデータモデルに従って整理されたデータです。これは通常、行と列を持つテーブル形式で格納され、各列が特定のタイプの情報を表します。例えば、データベースの顧客情報テーブルには、名前、住所、電話番号などの列があります。構造化データの特徴は、その予測可能なフォーマットと簡単な検索・分析の容易さです。

非構造化データ

非構造化データは、特定のフォーマットや構造を持たないデータです。これには、テキスト文書、ビデオ、画像、オーディオファイル、ソーシャルメディアの投稿などが含まれます。非構造化データは、その量が膨大で多様であり、従来のデータベースツールを使用して管理・分析することが困難です。そのため、機械学習アルゴリズム、自然言語処理、画像認識技術など、より高度な手法が必要とされます。

AIが扱うデータ

AI技術は、構造化データと非構造化データの両方を扱う能力を持っています。構造化データは、予測モデリングや意思決定サポートシステムに利用されます。

一方、非構造化データは、AIが複雑なパターンや文脈を理解し、よりリッチなインサイトを抽出するのに役立ちます。両方のデータタイプの組み合わせによって、AIはより包括的で正確な分析を行い、より洗練されたアプリケーションを提供することが可能になります。

AIにおけるデータサイエンスと統計

人工知能（AI）の分野において、データサイエンスと統計学は重要な役割を果たします。これらの分野は、データから知識と洞察を引き出し、AIモデルの開発と改善に不可欠です。

統計学の役割

統計学は、データの収集、分析、解釈、表示に関する科学です。統計的手法は、データの傾向やパターンを理解し、予測モデルを構築する際に重要です。
AIでは、統計学はデータを解析し、モデルの正確性と信頼性を評価するのに用いられます。たとえば、回帰分析、ベイジアン手法、仮説検定などがAIモデルの開発において頻繁に使用されます。

データサイエンスとは

データサイエンスは、大量のデータから有用な情報を抽出し、それをビジネスや科学の意思決定に活用するための分野です。この分野では、データマイニング、パターン認識、データ可視化などの手法が使用されます。AIにおいてデータサイエンスは、データの前処理、特徴抽出、モデルトレーニングの段階で不可欠です。

統計とデータサイエンスをまとめると、

統計学はデータの数学的解析に焦点を置き、データセットの傾向や関係性を分析するために仮説検定や回帰分析などの手法を使用します。一方で、データサイエンスはビジネスや技術的な問題解決に重点を置き、大量のデータから洞察を抽出し、データ駆動型の決定をサポートするために機械学習やデータマイニングを用います。

データマイニングとは

データマイニングは、膨大なデータセットから有用な情報を抽出し、パターンや関連性を発見するためのプロセスです。このプロセスには、統計学、機械学習、データベースシステムの技術が活用されます。

発見型のデータマイニング
発見型データマイニングは、未知のパターンや関連性を探し出す探索的なアプローチです。この手法は、大量のデータを分析し、新たな洞察や規則性を発見することに重点を置いています。例えば、顧客の購買履歴データから新しい市場のトレンドを発見することがこれにあたります。発見型データマイニングは、特に予測モデリングやクラスタリングに有用です。

検証型のデータマイニング
検証型データマイニングは、特定の仮説や疑問に対する答えをデータから探る方法です。ここでは、特定の理論やモデルがデータにどの程度当てはまるかを評価します。たとえば、特定のマーケティングキャンペーンが売上にどのような影響を与えたかを分析することが一例です。検証型データマイニングは、データを使用して既存の理解を深めるために使われます。

データ分析手法

ここでは下記の4つのデータ分析手法について紹介します。

回帰分析
クラスタリング分析
ベイズ推定
マルコフ過程

回帰分析

回帰分析は、例えば家の大きさと価格の関係のように、一つのこと（価格）が別のこと（家の大きさ）にどのように影響されるかを調べる方法です。この分析を使うと、特定の条件下で期待される結果を予測できます。たとえば、どれくらいの大きさの家ならどれくらいの価格になりそうか、といったことが分かります。

クラスタリング分析

クラスタリング分析は、似たような特徴を持つデータをグループにまとめる方法です。これを使って、大量のデータの中から自然に似ているもの同士を見つけ出し、分類します。例えば、顧客の購買データを分析するとき、似たような購買傾向を持つ顧客を同じグループにまとめることができます。

ベイズ推定
ベイズ推定は、「もし〇〇だったら、△△である確率はどれくらいか」ということを計算する方法です。これは、過去の経験や既知の情報を元に、新しいデータが与えられた時の予測や判断をアップデートするのに使われます。例えば、病気の診断で、「ある症状がある時、特定の病気である確率はどれくらいか」といったことを推測するのに使われます。

マルコフ過程
マルコフ過程は、「今」の状態から次に何が起こるかを考える方法ですが、その際に「過去」のことは考えません。例えば、天気予報で「今日雨なら明日晴れる確率は？」といった予測をする際に使われます。この方法では、今日の天気がわかれば、昨日や一昨日の天気は考慮しません。

最後に

いかがだったでしょうか。
今回は「いまさら聞けないAI入門」をコンセプトにAIの基礎について総まとめをしました。

本アカウントでは「AIを身近に」をコンセプトに誰でも分かるような最新のAI情報について発信していきます。よかったらフォローしていただけると嬉しいです。

この記事が気に入ったらサポートをしてみませんか？