AIとか機械学習は万能じゃない

AIとか機械学習は万能じゃない。

機械学習がブレイクスルーである点

システムは基本的に
A.インプット→B.ロジックによる処理→C.アウトプット
という形式を取る。

予期したインプットに対して(A)
ルールベースの処理を施し(B)
用意されたアウトプットを返却する(C)。

食べログとかで言えば
検索ボックスに入力された「焼き肉」という文字列インプットを受け取り(A)
システムが焼き肉関連の情報をデータベースのデータからピックアップし、今のトレンドや位置情報などからより良いものを選別し、(B)
店一覧ページを表示する(C)。

ログインページなら
メールアドレス、パスワードが基本で、他にもIPアドレス、ログイン試行回数、ユーザエージェントをインプットに
ロジックがログインさせていいユーザか、ログインさせるとして一般ユーザか優良ユーザか判断し、
ログイン成否というアウトプットを出す(対応した画面に遷移する)。

基本的には
「A.インプット」は意図されたもので
「B.ロジック」も人の手で作られ
「C.アウトプット」も用意されたものとなる(結構Bのロジックありきのアウトプットになる)

機械学習のブレイクスルーな点は「B.ロジック」を人の手で全部作らなくていいというところである。

大抵のロジック、しかも判断するロジックでは「性別が男だったら」など条件分岐を組み合わせたルールベースのロジックが人の手によって組まれる。

ただ、機械学習の場合は、
「多くの場合○○のインプットの場合アウトプットに××を出してきた」という歴史を
大量のデータ(あるインプットを受けたときのアウトプット)から学び、
判断を行う。
※もちろん学ぶ際のパラメータ設定やインプットに使うデータの整備はある程度人間が行うが。

ロジックを人の手で全部作らなくていいというのがブレイクスルーなのである。

機械学習ができないこと

機械学習は画期的だが、何でもできるというわけではない。

上記の説明からも推測できる通り以下の問題がある

・アウトプット(C)はこちらが用意したものに限られる
・判断するに十分なデータが必要になる。

「アウトプット(C)はこちらが用意したものに限られる」

スパムメールかスパムメールじゃないかといった2択や
半角英数字(半角数字10種 半角英字26*2(大文字小文字)=52)62択
など限られたアウトプットの中の分類くらいしかできない。

「判断するに十分なデータが必要になる」

前述の通り機械学習の判断は単純で、「あるインプットのときのアウトプットはこれなことが多いよね」というものである
9月に雨が降ったら土砂降りだったケースが1000回あれば、9月に雨が降ったら土砂降りが多いと判断しても妥当だと思える。
ただ、ケースが2回しかなかったとかだった場合はなんとも言えないと言わざるを得ない。

というように、あるインプットとアウトプットの結びつきのデータがある程度ないと判断を行えない、十分にデータがないと判断ができないのである。

以上のことから、機械学習は言ってしまえばベタかどうかを判断することが関の山なのである。
(それだけでもすごいことだが。熟練者の経験でしかわからなかったものをそのロジックを使うだけで他の人でも判断できるようになるので)

そういった意味で現在の機械学習は万能じゃない。
1つの機械学習システムを構築するだけでも大量のデータと時間が必要になるし、
カバーできる範囲がそんな広くない。
網羅的に機械学習がいろんな判断をできるようになるには誰か(=各企業)がコストをかけて、「機械学習で○○の分野の判断ができる」という結果を社会に出していく(それらを実装した事業を社会に使ってもらう)ということが必要になり、地道な道となる

この記事が気に入ったらサポートをしてみませんか?