見出し画像

AIライフサイクルにおけるAIデータディリスキングとは

AIライフサイクルは、人間の人生と同じ

今回は、AIライフサイクルにおけるAIデータディリスキング、ALMをテーマにお話しさせていただきます。
AI市場は本当に今真っ盛りという状況です。ようやく来たか、という感もあります。今AIは、さまざまな分野に広がりをみせています。
実は、わたくしどもAOSデータはAIに不可欠なデータのマーケットプレイスにも関わっております。マーケットプレイスには16の分類があり、一つ一つを見てみると少しずつAIが各分野に広まってきていると感じられます。

実際、数字をみても、大きく伸びているんですね。用途と分野によって分類したものです。どの産業においてもここ10年のあいだに、大きく伸びていることがわかります。

AIライフサイクルを見ると、まさに人間の人生と同じ、ということがAIにおいても言えます。

AIのプロジェクトが生まれてから活躍して終わる、そしてそれがさらに次の次元になっていくさまを「AIライフサイクル」という言葉を通して表しています。

AI学習データで重要なのは高品質なAIのデータ

人間は生まれたあと、父親や母親から教育を受け、記録して初めて次のステップの教育を受けることになります。記録があるおかげで、次のステップの先生が、次のレベルの教育をしっかりできるわけです。
教育ログを保存し記録することが、次の次元へつなげていくために大事ということです。人間に例えると、具体的な記録には、生活記録や通知表や教育プログラムといった例がありますが、これはAIにおいても同じです。
プロジェクトが始まり、その状況をデータとして記録して学習データセットを用意し、次の開発者につなげ、さらに次のプロジェクトにつなげていく、といったことがAIライフサイクルであり、その流れはまさに人間の人生と同じ、といえるのです。
AOSデータでは、AI学習用データに対して、AIライフサイクルを循環させるために、それぞれのステップにおいてサービスを提供しています。
高品質なAIのデータがあってはじめて『良いAI』のシステムができあがります。
 
 
当社は長くデータインフラにかかわるビジネスをしてきました。例えばAI加工センター、アノテーションや、AI学習データのマーケットプレイス、データリカバリーセンターといったサービスです。
これまではデータリカバリーセンターにおいては、さまざまな復元技術を使って警察や検察庁などの捜査機関や日本の主要メーカー様に採用いただきました。

今、犯罪においては、存在する大量のデータをどのように活用するかという課題があります。具体的には以下のようなことです。
●       犯罪者にはどのような人間関係があるのか
●       どのように資金が流れているのか
膨大なデータを解析する「フォレンジック」という分野で、当社は20年間、人間のためのデータのリスクマネジメントやデータのライフマネジメントを展開してきました。

AIのリスクと、AIデータリスクライフサイクルマネジメント

では、AI学習データの何が大事なのか? を改めて考えていきます。すでに皆さんご存知の通り、データは品質が大事です。バランスが取れている必要があり、データのセキュリティを守る必要もあります。
AI学習データは生まれた瞬間から、さまざまな危機にさらされています。
ちゃんと育つためにはちゃんと育ててあげるという環境を必要としているのです。AIデータが生まれるときに、私たちは何をしているか、をお話していきます。




まず、アノテーションでは、当社はSyntheticデータ、データ収集というメニューを展開しています。アノテーションとはさまざまなタイプのAI学習のデータのタグを付けることです。

以下はライダーというセンサー、スリーディーのセンシングの例です。

車からのセンサー、この点群データについて「どの部分が車なのか」「どの部分が障害物でどの部分が人なのか」といったことを三次元の状態でAIに教えます。
では、そもそもデータがなかなか存在しないケースはどうするか、といった課題が出てきます。大災害の時や、事故寸前の状態のデータはリアルからはなかなか取得できません。リアルでは手に入りにくいデータの場合はそ、そのような状況のデータをシミュレーションで生成します。

なかなかデータが存在しない場合は、デジタルツインの環境を作りながら、シミュレーションを行ない、学習データに利用するといったことをやっています。
では「リアルでは作りにくいデータ」とは何でしょうか。
例えば「遭難者のケース」です。リアルで誰かに遭難してもらい、かつ危険な状態に遭わせるわけには行きません。また乗車中、運転中も危険な状態が想定されます。そのためシミュレーションで天気や路面の状態を「非常に強い雨」や「大雪」といった良くない状態を作り出し、その走行データを取っていきます。

取得できたデータに合わせてセグメンテーションすると同時に、アノテーションを行なっていくわけです。
車のナンバープレートについてはデータ収集も可能ですが作業負荷が高いため、AIに自動生成をさせながら、生成されたデータを学習データとして使う、といったことを行ないます。

こちらは海難救助の状態です。

日光の入り具合や波の状態をすべてシミュレーションしながら行なうことによって、リアルでは取れない状況からデータを取ることができます。
また農業や林業といった一次産業でもAIが活用されてきています。こちらは養豚場の様子です。

動物の関節の動きや、豚の動き、生体や生育の状況をシミュレーションしてデータを取得し、設計に生かしています。
このような形で、AIの最初の入り口のデータが生まれるところで私たちは実際にデータを提供してきました。

ディープフェイクから自分を守る、AIデータディリスキングとは

ここからは、AIのデータについてお話します。本講演のテーマでもある、AIのイメージデータにも関係するものです。
2023年3月現在、ディープフェイクといった言葉が非常に流行っています。ただ良い印象を持たれている方と、悪い印象を持たれている方の両方がいらっしゃると思います。

そもそも人間に似た人工的な映像を作ることは、良いこととしてこれまで多くのケースで使われてきました。
しかしそれが今逆転、もしくは逆転する危機に差しかかっています。AIを活用する時代にやってくる、新たな脅威の到来と私たちはとらえ、AIデータに関連するリスクの低減が必要と考えています。
このような、AIに関連するリスクを最小限に抑えるための一連のプロセスを、私たちは「AIデータディリスキング」という言葉で表現しています。

「AIデータディリスキング」とは、AIによって起きているさまざまな事件から自分たちを守り、守るための対策を行なうプロセスや、サービスのことを指しています。リスクを最小限にしましょうということです。

たとえばこのゼレンスキー大統領の左側の画像はニセモノの画像です。右が本物になります。
一見、見分けがつかないディープフェイクを、どのようにみつけるかが今後大きな課題となります。ディープフェイクなどにより、AIには技術的なリスク、経済的なリスク、社会的なリスク、政治的なリスクがついて回ります。
何をやるにしても良いこともあれば悪いこともある、ということです。デメリットに対処して行くためには、まず脅威やリスクを知ることが大事です。

経済的リスクとは、多くの人が働く場を奪われてしまうリスクが想定されます。次の新しい次元の仕事に変わっていく、といった可能性にも対処していく必要が出てくるでしょう。
人とのコミュニケーションが減る、というリスクがある一方、AIを介護に活用する、といった展開や可能性も考えられます。
AIにおける技術的なリスクは、以下のように考えられています。

意思決定をするときのバイアスがかかる:
・変なデータが混じり込んだら、変な結果が出る
・プライバシーや個人情報が漏れてしまう
・法的責任の所在

リスクを回避するためには、リスクマネジメントの手法を知ることが不可欠です。AOSデータは、データに関するライフサイクルと、リスクマネジメントのための仕事に長く携わってきました。
これからはAIのためのデータのリスク管理、そしてAIのライフサイクルのマネジメントを行なっていこうとしており、準備を進めています。

これまでもパソコンの時代が来た、モバイルの時代が来た、という時代の流れの中で、さまざまなサービスを提供してきました。これからは、AIの時代において、新しい第一歩が始まっていくと考えています。

ディープフェイクは本来AIを活用した良い技術です。リスクから守る技術としてディープフェイクディテクション(ディープフェイクの検出)があり、犯罪から守る技術としてディープフェイクフォレンジック(ディープフェイクの調査分析)のが必要になります。
AI時代において「ディープフェイク犯罪、AI犯罪から守る」。それがAOSデータが目指し進めていることです。
では具体的にディープフェイクフォレンジックとは何なのか。それは人工知能で作られた本物そっくりの偽画像や、人工的に作られた動画や画像を検出したり、痕跡を検出したりして捜査をサポートし、犯罪防止に役立てることです。
例えばパソコンの時代であれば、ウイルスやマルウェアから守るためにウィルス検知ソフトが必要だったように、これからはAI時代のリスク管理としてディープフェイクの検出ソフトが一般的になってくるであろうと考えています。

AOSデータはデータとAIというコンセプトのもと、AIライフサイクルの中でデータ活用を行なってきました。

これからもさまざまなバーチャルデータルーム、フェイクデータ生成、リスク管理、ディープフェイクフォレンジックなどの製品を出しながら、お客様のAIプロジェクトが円滑に進むよう、Iデータリスクマネジメントサービスを提供していきます。

AOSデータでは、PCフォレンジックやモバイルフォレンジック、従業員の情報漏洩や業務上の横領調査で、さまざまな媒体を調査して来ました。

パソコンからスマートフォンにデータの存在場所が移行しています。そして今度はAIにおいてもディープフォレンジックといったことでAIがもたらすいろんな技術の中で存在するデータを検証して解析、調査して、守る必要が出てきました。

「AIデータディリスキング ALM」の製品概要


AOSデータは、AIデータライフサイクルの中でリスクを管理するために、データプラットフォームを開発しました。AIライフサイクルのための「AIライフサイクルマネジメントシステム」、そしてリスクから守るための「AIデータディリスキング ALM」といった製品があります。

「AIデータディリスキング ALM」とは、開発者が作ったさまざまなAIデータを的確に保存管理、共有、活用することにより、データを守り、リスクから守っていこうといった製品です。
AIの核心はデータです。そのデータをしっかりと守っていくためのエンジンをAOSデータは用意し、展開していきます。

AI学習データの作成においては、現在以下のような課題があります。
●       データがそもそもバラバラに存在している
●       バージョン管理がなされていない
●       その後の新しいシステム共有されてない
●       データを探すこともできない
これらの課題の解決に、「AIデータディリスキング ALM」が貢献できると考えています。
保存先としての性能において、AI向けストレージは非常に高性能な仕組み、スペックが求められています。高速処理やデータの整合性、セキュリティを守るといったことが必要です。そういったニーズを反映した製品が「AIデータディリスキング ALM」です。
「AIデータディリスキング ALM」の製品詳細は、こちらからご覧ください。

この記事が気に入ったらサポートをしてみませんか?