見出し画像

ディープラーニングG検定 第2章

−1探索・推論
■迷路(探索木)=場合分け
■幅優先探索🔛深さ優先探索
 前者:最短距離でゴールに辿り着く解(メモリ不足)
 後者:メモリをあまり要らない
    運次第で時間がかかる
■ハノイの塔の解法
■プランニング=ロボットの行動計画
 前提条件⇄行動⇄結果
=STRIPS(Stanford. Research Institute Problem Solver)
■SHRDLU
 1968年〜70年テリー・ウィノグラードが開発したシステム
積み木の世界で画面上に物体を動かすことができた
■Cyc(サイク)プロジェクトに繋がる研究原点
■テリー・ウィノグラード
 HCI(ヒューマン・コンピュータ・インターフェース)研究で
 Googleのラリー・ペイジを育てる

■2016年3月9日に歴史的勝利
 韓国のプロ棋士にDeepMind社のAlphaGoが4勝1敗
■コストの概念誕生
 ヒューリスティックな知識=経験的な・発見的な
 有利か不利かを表す計算方法
■Mini-Max法
 自分が刺す時にスコアが最大になる
 相手が打つ時にスコアが最小になる
■αβ法
 Mini-Max法による探索コストを減らす手法
 αカット=探索の時点でスコアが小さいものをカット
 βカット=既に出現したスコアより大きいノードが出たらカット
■モンテカルロ法(プレイアウトさせる)
 ゲーム盤のスコア(コスト評価)の課題解決に用いる
 CPU同士のシュミレーションでゲームを終了させ評価する
 ∴数多く打って最良のものを選ぶ手法
 ブルートフォース(力任せ)の方法
■AlphaGoはディープラーニング技術での勝利

−2知識表現
■人工無脳=チャットボット、おしゃべりボット
■イライザ(ELIZA)
1964年〜66年ジョセフ・ワイゼンバウム開発
イライザ効果=パターンによる解決を対話と錯覚させる効果
■エキスパートシステム
 専門分野の知識を取り込み専門家のように振る舞う
■マイシン(MYCIN)
1970年スタンフォード大学で開発
血中バクテリアの診断支援プログラム
500のルールで質問しif、thenを繰り返し69%正当
■DENDRAL
1977年 スタンフォード大学で実用指向された
エドワード・ファイゲンバウムによる開発
■知識獲得のボトルネック(エキスパートの限界)
 専門家、ドキュメント、事例がソース
 専門家の経験は暗黙的という課題
 インタビューシステムを用い解決
 知識ベースではデータ矛盾が生じ
 知識ベースの保守が困難となる
 解決に意味ネットワーク、オントロジー研究となる
■意味ネットワーク
 「概念」をラベルの付いたノードで表現

■「is-a」の関係(「である」の関係)
 上位概念=矢印が向いている側
 下位概念=矢印の始点
・推移律が成立する(A=B、B=C、A=C)
・継承関係にある

■「part-of]の関係(「一部である」の関係)
 属性を表現
 全体と部分の関係を表し、推移律は不成立
 最低5種類の関係がある
■オントロジー(概念体系を記述するための方法論)
・1984年Cycプロジェクト=全ての一般常識をCPUに取り込む企画
・知識を体系化する方法論
・哲学用語で存在論
・トム・グルーパーによる概念化の明示的な仕様
・溝口理一郎日本のオントロジー研究第一人者
・目的は知識の共有と活用
・語彙、意味、関係性を共有できるように約束事として定義すること
■ヘビーウェイトオントロジー(重量オントロジー)
・対象世界の知識をどのように記述すべきかを哲学的に
 考えて行うもの
・人間が関わり、時間とコストがかかる
■ライトウェイトオントロジー(軽量オントロジー)
・使えるものであればいいという考え
 ウェブマイニングやデータマイニングで用いる
■セマンティックWeb
・Webサイトが持つ意味をCPUに理解させCPU同士で処理する
■LOD(Link Open Date)
・CPU処理に適したデータを公開・共有する技術
■ワトソンと東ロボくん
 ワトソン=IBM開発 2011年クイズ番組で人間に勝利
 質問応答分野の成果、ライトウェイト・オントロジー
 質問に含まれるキーワードと関連しそうな答えを高速に検索
 医療診断に応用、コールセンター、人材マッチング、広告
 東ロボくん=2011年東大合格を目指す
       2016年偏差値57.8 読解力が不可能 研究凍結

−3機械学習・深層学習
■機械学習
プログラム自身が学習する仕組み
サンプルが多いほど望ましい結果が得られる
ビッグデータ時代

■レコメンデーションエンジン
■スパムフィルター
■統計的自然言語処理
 複数の単語をひとまとまりにした単位で学習処理される
■深層学習
 ニューラルネットワーク=人間の神経回路の真似
■心理学者フランク・ローゼンブラット1958年提案
 単純パーセプトロン
ディープラーニング=ニューラルネットワークを多層にしたもの
マービン・ミンスキーにより直線で分離できる単純な問題しか
解けないと指摘され下火に
■誤差逆伝播法(バックプロパゲーション)で解決
■自己符号化器でさらに4、5層と深まっていく
■ILSVRC(画像認識競技会)
2012年トロント大学ジェフリー・ヒントンsuper visionが
2位の東大のISIを10%以上引き離しエラー率15.3%で圧勝
■特徴量(=注目すべきデータの特徴)
■AlexNet
 2015年人間の4%を下回るエラー率を出す

よろしくお願い致します。 サポートエリアのご支援から、情報や感動でフィールドバック致します。