見出し画像

本当に未来に繋がる「AI」とは何かを考える

生成AIには問題もあるものの、自動運転や医療などの分野では、
今まで出来なかった革新的な良い結果をもたらすものなのではないか。
SNSなど見ていると、そう期待している人は多いのではないかと感じます。

今回はその点について、掘り下げていきたいと思います。

・ 技術による日本の経済成長に期待する人
・ 懸念はあるけどクリーンな学習なら使いたい人
・ クリーンな学習でも問題が残ると考える人
・ 国産でないことに国益の視点で懸念を覚える人
・ 過度なDX化が導く社会像に懸念を覚える人

どのような形で向かい合う人にとっても、
知っておいて損はない、ぜひ多くの人々に知っておいて欲しい。
そう思う内容になります。

ここで書く話は、以下の投稿内容を前提として進めます事をご了承下さい。

それでは長い内容となりますが、最後までお付き合い頂けましたら嬉しいです。


はじめに

最初に結論を書いておきますと、
それらの技術発展には「生成」AIが必要にはならない、
むしろ生成AIでは実現が出来ないことだとすら考えています。

こう書くと悪い側面を知っているから、
感情論で技術の「可能性」を過小評価しているのではないか?
と思われてしまうかもしれません。

しかし自分の場合は、
どちらかといえば昔から深層学習に興味があったから、
生成AI登場前の技術を知っていたからこそ、
「それって生成AIが無くても出来たよね」と疑問に思いました。

また自分は半導体関連銘柄にも投資を行っているため、
生成AIが流行することは半導体市場にもプラスに働くだろう、
と考えられていることは知っていますし、
だからこそ、政府も後押ししているのだということも理解しています。

そのように日本の経済成長や投資利益の可能性を考慮してなお、
生成AIでは、それらの成長に繋がらない
と考えるに至っています。

それでは何故そのように考えるに至ったのかを、
書いていってみたいと思います。

今回は生成AIと、その他のAIは分けて考える必要がありますので、
以降では文字として一目で見分けがつきやすいように、
「生成AI」のことは「GenAI」と表記します
「Gen」と付いていない「AI」は、生成ではないAIのこと、
だと思って読んでください。


AIに求められている前提は何か

一つ前の記事に書いたように、企業がGenAIを使わない理由は、
得られるメリットが、リスク・コスト感に見合わない
という事が大きいのではないかと自分は考えています。

この企業リスクとして大きいものには、
・ 情報セキュリティのリスク
・ 虚偽を含む(生成する)というリスク
・ 倫理的な問題に目を瞑るというリスク

といったものがあります。

そしてこの問題をはらんだまま自動運転や医療のような、
命を左右するものに利用してしまおうというのは、
あまりに危険だし無責任である、と言えるのではないでしょうか。

つまり、
未来の技術として問題解決を期待されている分野のAIには、
この問題の解決を避けては通れない、

という事が今回の話の前提となります。

この問題は、いくらGenAI提供側が安全性を上げたと言ってみても、
現状の学習の根っこに含まれる問題なので、
今のGenAIの延長線上では解決するのは難しいでしょう。

「では倫理ばかり重視して、日本の技術発展の芽を潰そういうのか。」

そういった論調をSNSでは時々目にしましたが、
そのような人々は「GenAI」=「深層学習」であると、
混同してしまっている可能性があります。

「革新性を持つ結果をもたらすのは、全てGenAIでなければならない」
などということにはならないのです。
それでは、それらを解決する日本の技術に注目していきましょう。


国内から登場した、実画像を使わない学習技法

この問題を、正面から解決するための技術が登場しました。

これはNEDOの委託事業だそうです。
NEDOとは、「国立研究開発法人新エネルギー・産業技術総合開発機構」、
つまり日本の、国の研究機関の成果として登場した技術です。

記事から引用すると、まず、

従来、画像領域分割AIを学習させるためには、大量の実画像の収集や、人間が画像内の画素ごとに教師ラベルをつける作業など膨大な人的コストと、収集された実画像によって引き起こされる権利侵害や倫理問題がありました

産総研:数式から実画像や人的コスト不要で画像領域分割AIを自動学習

と、GenAIの学習が引き起こしている、
実画像収集による権利侵害や倫理的な問題を認識、危惧しており、

現在、研究現場で使用されている画像認識AIは、学習した画像データセットの実画像によってプライバシーの侵害や、攻撃的ラベルを含むなど倫理面での問題が生じる懸念もあり、商用目的での利用が困難です。

産総研:数式から実画像や人的コスト不要で画像領域分割AIを自動学習

と、「企業が使わない理由」の記事の方で書いたような、
商用利用するには大きなリスクがあることも認識し、懸念しています。

そこで産総研はどうしたのかというと、
大量の実画像データの収集が不要な学習方法を編み出し、
学習がクリーンな「画像領域分割AI」の開発に挑戦し、成功した。

とのことなのです。

これは、本当に驚くべき技術です。
ただ驚くべきこと過ぎて逆によく分からないので、
これが何なのか、個別の要素を見ていきましょう。


■ 画像領域分割AIとは?

まず記事を引用してみます。

自動運転時のシーン認識やロボットが物体を把持する際など、画像認識AIを社会実装するにあたっては、画像中の物体を認識する画像識別だけではなく、物体の位置情報を含む画像中の詳細内容を把握できる画像領域分割がコア技術になるとして注目されています。

産総研:数式から実画像や人的コスト不要で画像領域分割AIを自動学習

引用は若干堅苦しい書き方なので、自分なりに少し噛み砕いてみます。

まず「画像領域分割AI」は、GenAIではありません。
画像生成しないなら何をするAIなのかというと、
・画像中の物体を認識する「画像識別」
・物体の位置情報を含む「画像中の詳細内容を把握」

これを目的としています。

これが出来ると何が良いのかというと、
ロボットのアームが「物」を認識して掴むことが出来たり、
自動運転時の状況把握を可能としたりする事ができ、
他にも医療などへも応用が期待される技術になると思います。

そんな画像識別のコア技術を、「数理モデル」のみ、
数学で描かれるフラクタル的な画像の学習のみで達成した
というのがこの記事です。
問題になる「無許諾に収集した大量の画像」は、
いっさい取り込まずに達成した、
という事らしいのです。

この技術は既に2022年に、
米国・ニューオーリンズで開催されたCVPRで発表されていたらしく、
学習に使った画像一覧も以下のページに公開されています。


■ 「実画像なし」の「画像学習」なんて可能なのか?

にわかには信じがたい…
という感覚になってしまうかもしれない内容です。
自分も最初は強く疑念を抱きました。

自分はこの研究の専門家でもなんでもないので、
この章の内容はあくまで自分の想像に過ぎませんが、
これが可能である事を信じられないと話を進められない方もいると思うので、
これに関する自分なりの解釈を、以下に書いていきたいと思います。
興味のない方は次の見出しに飛んで頂いても大丈夫です。

まず、りんごを「りんご」、ゴリラを「ゴリラ」と認識するために、
「りんごの画像もゴリラの画像も学習に要らないよ」
と言われたと考えてしまうと、意味が分からなくなると思います。

しかし、この技術の目的は「生成ではない」事がポイントなのかと思います。
生成しないのなら、
りんごの画像を見て「りんご」と判断する必要はないのではないか。
正しく名前を言い当てる必要がないのではないか。

単純に「物体」として認知し、
それが何かは分からなくても、
位置・大きさの関係の認識と、
それぞれ違う「属性」のものだと判別出来れば十分、
ということになるのではないかと考えました。

そんな事を考えながら調べていたら、以下のページを見つけました。

画像セグメンテーションは,(中略),対象物体の「種類」と「位置」と「形」を認識する技術であるといえるでしょう

上の記事から引用

と記事にあるので、自分の想像はそんなに間違ってはいなそうな気がします。

更に想像を加えると、例えば、
りんごを見て「りんご」だと教わったから、
りんごを「りんご」だと知っているけれど、
じゃあ「りんご」と「梨」を「区別出来る」のは何故なのか。

区別が出来るのは、梨を見て「梨」だと教わったから、ではないはず。
目に映る条件、位置に対する大きさ・形・色・質感。
名前を知らない物であっても、これらを条件に区別は出来ています。

この「区別出来る」という部分をトレーニングさえすれば、
AIが「違いを認識出来る」ようになる。
そして「違いを認識する精度」を高めるためには、
なにも実画像を使う必要はない。
という考え方なのではないか、と自分は想像しています。


■ GenAIと、それ以外のAIの、明確な分岐

この技術のスゴイところは、
本当にクリーンな学習を可能にした所です。

今までも「クリーンな学習」を謳ったGenAIはありましたが、
現時点で本当にクリーンなGenAIというものは存在しません。

現状最もクリーンに近いAdobeの「FireFly」であっても、
AdobeStockの実画像を利用する以上、
そのプラットフォームがクリーンに保たれていなければ、
本当に安全だとは言えないからです。

海賊版サイトや画像転載サイトのクローリング等よりは遥かに良いものの、
AdobeStockも、現状ではモラルのない人間によって、
倫理的ではない画像、他人の作品の転載や、権利がクリアではない画像も、
勝手にCCライセンスにして登録可能な状態である問題が残っています。

それが、この技術ならAIとしての基礎学習に、実画像は不要になります。
勿論それぞれの技術、例えば自動運転に応用する場合、
道路規則、標識などの実画像は最終的に必要になっていくとは思いますが、
基礎学習部分においては不要になるという事が大きい違いになります。

これは非常に大きな技術革新ではないでしょうか。
倫理的な問題の解決だけでなく、
基礎学習における大量ラベリングの人的コストも不要になっているのです。

そして識別を目的としている技術ゆえに、
りんごを「りんご」として「出力」する、
といったトレーニングは行われていないものなので、
生成にこの技術を応用することは理論上難しそうな気がします。
なのでコンテンツ産業の市場を荒らすような使い方や、
ディープフェイクの作成に使われる、
といった心配は比較的少ない技術だと思えます。

そうなると、ここまでで分かることは、
どちらも深層学習を利用しているものではあるものの、

GenAI
 生成が目的な為、性能向上にはクローリングなどを続けるしかない。
 そしてそれは、クリーンになることは不可能であることを意味しているし、
 クリーンではない=含まれるものを制御することができない、
 またはクリーンにすることに大きなコストと時間がかかるということ。
 つまり現状では、安全性へのリスクが大きいと言える。

生成しないAI
 これが可能なら、わざわざリスクの生まれる学習方法を通す必要がない。
 これなら安心して自動運転・ロボ制御・医療分野でも使うことが出来る。
 その他の分野でも、これなら安心して商用利用に使えるAIを作れる。

つまりGenAIとそれ以外のAIの道は、
この地点から完全に分岐することになります。

「いろいろな分野でも役に立つかもしれない」と繁く言われていますが、
「かもしれない」という可能性の段階の内容に、
わざわざ最初から「クリーンではない学習のAIを選ぶ理由」はなくなるのです。

医療の具体例の比較

「ちょっと待て、画像領域分割AIに医療の具体例は挙がっていなかった」
「それに対して、GenAIの方には具体的な医療用が登場しているでしょう」
そういった反論があるかもしれません。

検索エンジンによって生成された「消費者からよく検索されている3173件の質問」(例えば「心房細動はどのくらい深刻な問題か」といった質問)から構成されている。

上の記事から引用

しかし上記の記事の引用などからも分かるように、
これはChatGPTの医療版みたいなもので、
あくまでも答えてくれる「医学の知識辞典」のような役割のものです。

「高齢化社会において切迫するであろう臨床医の不足を補うものになる」
と考えることも出来るかもしれないですが、
その考えだと臨床医を節約するものとも言えるので、
やはり賛否が分かれるものである事を考える必要はありそうです。

また、それ自体が便利であるだろう事は肯定しますが、
もし一般公開された場合、
本来医師の判断を仰ぐべき状態でも素人が自覚症状を誤って質問し、
勝手な判断をすることを助長してしまう懸念が生まれるでしょう。

それが高齢化社会対策だとするならば、
余計に自覚症状の判断ミスが心配されることになるわけです。

そして、それは誰の責任になるのかも考えてみましょう。
責任の所在が不明瞭になってしまっていないでしょうか?

対して、GenAIではないAIによる医療革新は、
実はもう世の中に登場して活躍を始めています。
キャノンメディカルの「X線被ばく量を、最大で75%低減させたCT装置」

X線被ばく量低減技術の開発にゴールはありません。患者さんの負担軽減をめざして、画質改善・画像再構成技術の進化に取り組み、 2018年4月、ディープラーニングを用いて設計したCT画像再構成技術「Advanced Intelligent Clear-IQ Engine(AiCE)」(以下、AiCE)を高精細CTに搭載し、世界に先駆けて販売を開始しました。

上の記事から引用

引用の通り、2018年にすでに販売されています。
ウェブスクレイピングがアメリカで合法となったのが2019年、
GenAIが流行する元になったLAION-5Bの登場は2022年である事を考えると、
無許諾大量学習なんて道は通らずに、ここまで到達していると分かります。

また、同じ技術はCTだけでなく、MRIにも応用されています。

そのためには、ノイズの少ない画像データが大量に必要で、データを得るために開発者たち自らの体を何度も撮影するなどして、およそ3万枚のデータを収集し、学習させて精度を上げていきました。

上の記事から引用

引用のように、無許諾に収集するのではなく、
自分たちの努力のみで、この段階まで辿り着いているようです。
今後は基礎学習に先ほどの画像識別AIの技術を応用すれば、
もっと少ない画像で精度を上げることが可能になるのではないかと思われます。

自分はこの医療技術については、
遥か昔にNHKのサイエンスZEROで見たことで知っていました。
もう何年も番組は見ていないので、かなり昔の放送だったと思います。
番組調べてみたら、もうキャストが全然変わってしまっていますね。

当時からこの研究・開発が行われていることに、
興味関心と期待を寄せていた故に、
後から現れたGenAIこそがあらゆる分野で有効に違いない、
と騒がれている現状に疑問を抱くキッカケにもなりました。


なぜ国内の技術だと注目されないのか

まとめに入ります。

「技術で勝つ」、「日本の勝ち筋」、
GenAI関連の話題ではそういった言葉もよく聞きます。

しかし前の記事にも書きましたが、GenAIは海外の技術です。
人手を増やすのではなくGenAIを導入するということは、
短期的には目の前の問題を解決したように見えるかもしれません。

しかし長期的には、ただでさえ「デジタル赤字」な状況の中で、
国内に回るお金を減らし、海外に流すお金を増やす行為になってしまいます。

前の記事と合わせて。
国内で海外のGenAIが流行っても、
短期的にはともかく、長期的には経済成長には繋がらないでしょう。
たとえGenAIが流行らなくても、
本当に必要なAIの需要は損なわれないので半導体需要は成長します。

そうであるならば、
AI技術関連も、本当に日本の勝ち筋だと思うならば、
行政が率先して海外GenAIを使って見せるのではなく、
本来は行政が日本から生まれた技術を守り、
後押しすることが正しい動きのではないでしょうか。

社会問題を引き起こしても無責任を貫く海外テック企業から、
国内の市場と技術を守るための防波堤、ルールを築くことこそが、
最も大切な国益に繋がるのではないでしょうか。

最後に、英語ですがこの技術を丁寧に説明してくれている動画を貼っておきます。

これ程の技術なのに、記事執筆時点で、
登録者18人、再生回数180ほど、いいねは4。
あまりに知られていないにも程があります。

自分はこの研究とは全く関係の無い人間ですが、
日本からも素晴らしい技術が生まれていることの周知に、
少しでも繋がれば幸いです。

以上、末筆ではありましたが、
改めて「本当に未来に繋がる技術とは何か」、
ということを考えるキッカケになれば嬉しく思います。

ここまで長文にお付き合い頂きまして、ありがとうございました。

この記事が気に入ったらサポートをしてみませんか?