《体験してみよう!》海🐠をきれいにするためのAI【後編】
こちらの記事は、音声配信もしております。合わせてお聞きください🎵
SpotifyやApple Podcastにも同時配信中🎬
----------------------------------------------------------------------------
前編で学んだことは、
機械学習とは、コンピュータがパターン(規則性や関係性)を認識し、判断する方法。
大量のデータからトレーニング(経験からの学習)をすることで、機能が改善するアルゴリズム。
後半は、データの種類、偏見を含むデータだった場合など、
AIにトレーニングするためのデータに焦点を当てましょう。
機械学習は、データがすべて
機械学習は、入力したトレーニングデータと同等の力しか発揮できません。
したがって、高品質のそして大量のデータを使用することが非常に重要です。
では、重要なトレーニングデータはどこからくるのでしょうか?
多くの場合、コンピュータは私たちからトレーニングデータを集めています。
私たちが特になにもしていなくても、ビデオストリーミングサービスはあなたが見たコンテンツを追跡し、そのデータのパターンを認識し、
あなたの好みに合いそうな作品をおすすめします。
また、直接的に情報を求められることもあります。
ウェブサイトが道路標識や写真を見つけるように問いかけるように、
機械の認識機能を向上させるためにトレーニングデータを提供しているのです。
医学研究者は、医療画像をトレーニングデータとして使用し、
コンピュータに病気の認識と診断方法を教えることができます。
機械学習には、病気を正しく特定できるまで、
何百、何千もの画像と
病気の診断に重要なポイントを理解している医師によるトレーニングが必要です。
しかし、何千もの例があったとしても、コンピュータの予測に問題が起こる可能性があります。
X線データが男性からのみ収集された場合、コンピュータの予測は男性にしか機能しないかもしれません。
女性のレントゲン写真を診断させようとしても、
病気を認識できないかもしれません。
このように、「バイアス(偏り)」を生み出してしまうことがあります。
・トレーニングデータの収集方法、
・誰がデータを集めたか、
・どのようにデータが集められたか、
を明らかにしておかないと、バイアスデータに含まれている可能性があります。
偏ったデータでトレーニングしてしまうと
一部の情報ばかり強化され、
そうでない情報は優先順位を下げたり、除外してしまいます。
つまり、バイアスデータから学習することで、
コンピュータが偏った予測を行う可能性があります。
これはコンピュータをトレーニングする人がそれを認識しているかどうかにかかわらず、発生する可能性があります。
よってデータを集めるときは、
十分に正確なトレーニングデータか、
データは偏りなく、起こりうるすべてのシナリオとユーザをカバーしているか
これは、人間としてあなたが重要な役割を果たすことができる場所です。
コンピュータに偏りのないデータを提供できるのは人間であるあなたの役目です!
データが優れているほど、コンピュータはより適切に学習します。
試してみよう!:コンピュータに新しいパターンを教えます
今回、Hour of Codeの「海洋のためのAI」で実際に体験してみましょう:
https://hourofcode.com/ai-oceans
あなたが行う十分なトレーニングでAIにパターンを認識することを伝えます。
私が実際に動かしている動画はこちら:
AIで発生しうるリスク
AIにも苦手なことや、リスクがあります。
例えば、機械学習を使用して、大学入学の合格者を評価する場合、
銀行のローンの申請者を選別する場合、
さらには犯罪を予測したり、犯罪者を探そうとする場合、
人間の偏見を含むトレーニングデータを使わないようにする必要があります。
危害や不公平を引き起こすような偏見を含まずに使用していくために、最も重要なことは人間の学習です。
AIを知ることは、それを正しく使うための第一歩です。
私もまだまだ勉強不足なので、学びながら、今後も発信していきたいと思います(^^)
AIに人間の偏見を含むトレーニングをしてみよう!
あなたの感覚で言葉の意味に合う魚を選び、トレーニングしてみてください。AIの選び方が一定でないことがわかります。
最後までお読みいただきありがとうございました。
お知らせ:メルマガ
こちらのメルマガにご登録いただくと、無料体験講座へのご案内があります。
関連記事
この記事が気に入ったらサポートをしてみませんか?