見出し画像

AI倫理学の基本用語(第2回)

『AI 原則実践のためのガバナンス・ガイドラインVer. 1.1』は、経済産業省が策定したガイドラインであり、AIを『深層学習』、『機械学習』、『広義の人工知能』の3つの大分類に分けて説明しています。ガイドラインで使用されている単語は、どれもAIに関連する人にとっては必須知識です。

一、深層学習(Deep Learning)は、『機械学習』の一種であり、多層の『ニューラルネットワーク』を使用して複雑なパターンなどを抽出する技術です。『深層学習』は、大量のデータを用いて学習し、『画像認識』、『自然言語処理(NLP)』、『音声認識』など、多くの分野で高い性能を発揮します。
 
二、機械学習(Machine Learning)は、データを利用してコンピュータが自動的に学習し、予測や分類などのタスクを行えるようになるアプローチです。機械学習には、『教師あり学習』、『教師なし学習』、『強化学習』などの方法があり、それぞれ異なるタスクやデータに対応しています。機械学習は、深層学習を含む広い範囲の技術をカバーしています。
 
三、広義の人工知能(General AI)は、人間の知能を広く模倣したAI技術であり、機械学習や深層学習(ディープラーニング)を含む様々なアプローチが存在します。広義のAIは自然言語処理、学習、『知識表現』、『推論』、『問題解決』、『知識獲得』、『視覚認識』、『音声認識』などの幅広い知的能力を持つことを目指しています。これにより、人間のように柔軟で状況に適応できる知能を持つAIを実現することが目標とされています。
 
1.自然言語処理(NLP)
(1) 自然言語処理(NLP:Natural Language Processing)とは、人間が使用する言語をコンピュータが理解・解析・生成するための技術です。
 
(2) GPT(Generative Pre-Trained Transformer)は、自然言語処理(NLP)を行うための深層学習モデルです。NLPには、GPT以外にも様々な種類があり、多数の企業が独自のモデルや技術を開発・研究しており、様々なアプリケーションやサービスで使用されています。
 
 また、オープンソースのNLPライブラリやフレームワークも多数存在し、研究者や開発者が手軽にNLPタスクに取り組めるように設計されています。これらの詳細な説明は、専門のコーナーを作成しますので、そちらをご覧ください。
 
2.ニューラルネットワーク
(1) ニューラルネットワーク(Neural Network)とは、人間の脳の神経細胞(ニューロン)を模倣した機械学習モデルであり、機械学習および深層学習の基盤となる技術です。ニューラルネットワークは、複数の層から構成され、各層には多数のニューロンが存在します。データが層を通過することで、特徴量が抽出され、最終的に予測や分類が行われます。主要な種類にはFNN、CNN、RNN、LSTM、GRU、GAN、オートエンコーダー、VAE、トランスフォーマー、カプセルネットワーク、SNNなどがあり、タスクやデータに応じて選択・組み合わせされます。
 
3.学習方法
(1) 教師あり学習(Supervised Learning)とは、既知の入力データとそれに対応する正解ラベルを用いて、モデルがデータから学習する機械学習の方法です。
 
(2) 教師なし学習(Unsupervised Learning)とは、正解ラベルが与えられていないデータから、構造やパターンを見つけ出す機械学習の方法です。
 
(3) 強化学習(Reinforcement Learning)とは、エージェントが環境と相互作用し、報酬を最大化するように行動を学習する機械学習の方法です。
 
4.データ分析
(1) 回帰分析(Regression Analysis)とは、変数間の関係をモデル化し、予測や因果関係の推定に用いられる統計学的手法です。
 
(2) 分類(Classification)とは、データを既知のカテゴリに割り当てるタスクであり、機械学習の一つの目的です。
 
(3) クラスタリング(Clustering)とは、データを類似性に基づいてグループ化するタスクであり、教師なし学習の一種です。
 
5.データセット
(1) データセット(Dataset)とは、機械学習や統計解析に使用されるデータの集合です。
 
(2) 訓練データ(Training Data)とは、機械学習モデルが学習するために使用されるデータの部分です。
 
(3) テストデータ(Test Data)とは、機械学習モデルの性能を評価するために使用されるデータの部分です。
 
6.学習の最適化
(1) 損失関数(Loss Function)とは、モデルの予測と正解ラベルとの誤差を数値化する関数であり、学習の際に最小化する目的で使用されます。
 
(2) 最適化アルゴリズム(Optimization Algorithm)とは、損失関数を最小化するためにモデルのパラメータを更新する手法です。
 
(3) 過学習(Overfitting)とは、モデルが訓練データに過剰に適合し、未知のデータに対する性能が低下する現象です。
 
(4) 汎化性能(Generalization Performance)とは、機械学習モデルが未知のデータに対してどれだけ正確に予測や分類ができるかを示す性能指標です。
 
7.特徴量
(1) 特徴量抽出(Feature Extraction)とは、データから重要な情報やパターンを抽出するプロセスであり、機械学習モデルの入力として用いられています。
 
(2) 特徴選択(Feature Selection)とは、データセット内の最も重要な特徴量を選び出すプロセスであり、モデルの性能向上や計算コスト削減に寄与します。
 
8.モデルの評価と選択
(1) ハイパーパラメータ(Hyperparameter)とは、機械学習モデルの学習プロセスに影響を与える外部の設定値であり、手動で調整されることが多いです。
 
(2) クロスバリデーション(Cross-Validation)とは、データセットを複数の部分に分割し、それぞれをテストデータとして用いることでモデルの汎化性能を評価する手法です。


この記事が参加している募集

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?