見出し画像

AIと機械学習と深層学習の違いについて

AIとは明確な定義がなく 広い意味を持ちます

つまりAIという種類の中に 機械学習があり その中に深層学習があります

AI > 機械学習 > 深層学習 となります

AIは
一般的には「人が実現するさまざまな知覚や知性を人工的に再現するもの」という意味合いで理解されます 

しかし
AIに関する研究が進んだ現在では、研究者ごとに異なる言葉で定義されているのが現状です

「AI、機械学習、深層学習」の定義は

最も広義に範囲を持つのがAI(人工知能)であり、機械学習と深層学習を内包する概念です

簡単に考えると

AIの種類に 機械学習があり その中に 深層学習があります


機械学習にも種類がある 

機械学習とは
「データから規則性や判断基準を学習し、
    それに基づき未知のものを予測、判断する技術」
のことです

機械学習にも種類があります

機械学習は 
教師あり学習 と 教師なし学習 と 強化学習 に分類


教師あり学習とは


 出力に関するデータである教師データを既知の情報として学習に利用し   
 未知の情報に対応できるモデルを構築することです

イメージは 
答えを教えて(教師データ) 学習させてから 機械学習に予想させる! 

私が医療現場でAI開発をする際には
この教師あり学習を利用することが圧倒的に多いです
深層学習でも教師あり学習はありますが
機械学習を利用します

理由は使いやすいからです
深層学習は 学習に使用するデータも大量に必要で 重く
さらに前処理もしっかりしなければいけません

これに対して機械学習は 前処理も簡単で
前処理含めてすべてやってくれる仕組みもあります
有名どころはいろんな機械学習を一気に使用できるpycaretです!


教師あり学習の答えを 
呼吸器の使用台数にして未来の人工呼吸器の使用台数を予測する
システムは

私が最初に思いついて開発した経験もあります
結果精度はあまりよくなかったです

教師あり学習では 答えを 出すもととなる 特徴量 が重要ですが

院内の未来の人工呼吸器の使用台数を予測する際に
重要な特徴量が見つけられていない
またそれを自動で集める仕組みも構築できていないことが
わかりました

現在は有益な特徴量を考えている最中です!

教師なし学習

教師あり学習とは違い 教師がない 
つまり正解に相当する出力値がないため
教師なし学習と呼ばれております

教師なし学習は 主にデータのグループ分けや情報の要約に活用されてます

データのグループ分けは クラスタリング
情報の要約は次元削減 または 次元圧縮 と呼ばれてます

クラスタリングの代表的な手法としては k-means法
があげられます

クラスタリングはpycaret でもできますが
少ないデータで行うことをお勧めします

医療シュミレーションデータで試したことがありますが
6時間ほどかかりました↓

強化学習

強化学習は学習データに正解はありませんが 
目的として設定した報酬(スコア)を最大化
するよう 行動を学習していく手法です

強化学習を適応した事例としては
将棋 囲碁 ロボットの歩行訓練があります


最初は機械学習がおすすめ 医療応用の幅は広い

機械学習で開発をしていると
教師なし学習 で特徴量を作って
教師あり学習に利用するということもあります

2022年4月現在では個人的には 最初に
深層学習はあまりお勧めしません
院内で独自開発するのであれば 機械学習でフレームワーク等を利用するのがいいかと思います

病院間の大規模研究では 深層学習 が魅力的

今後 深層学習の記事も書こうと思いますが

深層学習ではブラックボックスとなる為
病院間の共同研究では特徴量がわからなくなることが
逆にメリットとなる場合があります

連合学習、フェデレーテッド ラーニング を使う場合です

連合学習、フェデレーテッド ラーニング (Federated learning)とは
データを集約せず分散した状態のまま(社外にデータを出すことなく)
学習を行う機械学習の手法です

そのため深層学習でのフェデレーテッド ラーニング (Federated Learning)
はかなり情報が守られることが予想されます

フェデレーテッド ラーニングでは
互いに機密性の高い臨床データを直接共有せずに複数の組織が共同でモデルを開発することができます

医療関係の共同研究では患者個人情報の扱いが問題となりますが
フェデレーテッド ラーニング
を利用することでセキュリティが担保された状態での研究が可能となります

AI>機械学習>深層学習 さらに種類も多様

今回ご紹介したのは
機械学習がメインでしたが 

機械学習にも多くの種類があり
医療応用の目的によって使い分ける必要があり

内容によってはブラックボックス化できる
深層学習も必要となることがわかりました

説明責任を考えると個人的には機械学習がおすすめだとは思いますが

それは別の記事でソースコードもふまえてオープンにしていきたいと思います

この記事が気に入ったらサポートをしてみませんか?