マガジンイメージ

データと人工知能のかんたんな話

出来る限り分かりやすくテックトレンドをご紹介する無料マガジン。第一回目は人工知能とビッグデータの関わり方について取り上げます。

個人の趣味嗜好などに関するパーソナル・データ。そのデータを巡って国内企業同士の争いはもちろんのこと、GAFA を代表するような世界的企業はおろか世界各国の政府を巻き込んだ議論が起きています。

なぜ、そこまでデータが重宝されるのか。その影には AI の存在があるのです。

人工知能はデータの賜物

2010年半ばにバズワードのように使われていた「ビッグデータ」。いまでは当たり前のように活用されており、ビッグデータの発展領域にスポットライトが当たっています。その領域の一つが人工知能なのです。

とりわけ、人工知能関連技術の一つである Deep Learning(深層学習)が盛んになってからは、大量のデータを消費して何らかの結果を求める動きが活発になりました。

ときには不可思議な結果を導き出す人工知能(※学習モデル)ですが、データの質や数が高くて多いほど、より一層 "それらしい" 結果が導き出されやすいという傾向があります。
※厳密には、数が多ければ良いという訳ではありませんが割愛

そして、人工知能の核となる「学習モデル」を形造るのが学習データです。学習データは何でも良いという訳ではなく、むしろ「学習データをいかに整形するか」という点に技術者は重きを置いています。それを前処理と呼ぶこともあります。

現在の人工知能と呼ばれる物は偏りが大きい

 Deep Learning の実用化に伴い、2018年頃から様々なプロダクトが世に出てきました。ところが、その結果に偏りがあること、不完全であることが顕になります。

Amazon や Google といった企業の例としては、学習データが偏っていたために差別的な表現と結果を導き出すといったことが報道されています。

日本においては、とある研究者が人工知能に対する誤った認識・発信をおこなったことで、一般社団法人 日本人工知能学会が「機械学習と公平性に関する声明(2019年12月10日)」を出すに至ります。

研究者ですら誤った考えを持つと、テクノロジーを過信しすぎて社会的に多大な悪影響を及ぼすことがあるのです(それは現代に限ったことではありませんが…)。

現在の AI のほとんどは 過去の膨大なデータを基に学習を行い、直感的な判断を下すことに長けています。AI は論理的思考を行なうと誤解されることもありますが、現時点における AI の大多数は人間の直感的思考に近い結果を出します。

過去のデータに基づいて学習モデルが構築されるのですから、学習に使用したデータに偏りがあれば結果も偏ってしまうのです。

米国国立標準技術研究所(NIST)が2019年12月19日に発表した研究結果によると、顔認証システムを構築する際に白人男女の画像データを基に学習した人工知能モデルは、アジア人での認識率が極端に下ることが報告されています。

仮に過去の新聞記事やWeb上のデータを収集してそれらを学習した際、20年前、30年前、40年前と遡るほど、現代の価値観とは違ったデータによって学習されるため、差別的な結果が導き出されることが予想されます。

データを食べるモンスターが食料不足

ここまで、人工知能の発展には過去に「ビッグデータ」と呼ばれていた大量のデータの存在が欠かせないことを記してきました。さらに、過去のデータを使う場合は問題を抱える可能性も指摘しました。

では、研究者、技術者、企業は今後どのようにすれば良いのでしょうか。実は、その鍵となるのが人間のあらゆる行動データである「パーソナルデータ」なのです*。

次回は、新しい時代のキーワードになるであろう、パーソナルデータ取引の透明性についてご紹介します。

※すべての分野においてパーソナルデータが適用できるわけではありません。映像・画像の分野で改善を試みるためにパーソナルデータが活用されるとは考えにくいものです。

さて、ここまで書くと私が AI に否定的に映るかもしれませんが、実は全く異なります。私は AI を扱う開発者であり、AI に対して肯定的です。しかし、現在の AI と呼ばれるものの多くは目的を達成できないか、または、極めて困難なものばかりであることを目の当たりにしてきました。そして、AI が持つ負の側面も…。

であるからこそ、私は、テクノロジーに触れる際には倫理観をもって取り組む必要性を社内で説いています。

もしよろしければサポートをお願いいたします! 次世代の投資家のための、執筆・公演・イベントなどの費用に使わせて頂きます。