黒板の前に立ってても後ろの文字が見える?!SONYのAIプロダクト「Edge Analytics Appliance」のすごみを解説
こんにちは。AR技術に特化したスタートアップOnePlanetをやっています村上と申します。弊社はAR技術を活用した様々なソリューションを提供しており、日々世界中のAR事例を研究しています。
この記事は、エッジAIを活用して映像処理にイノベーションをもたらしたソニーの「Edge Analytics Appliance」というプロダクトの凄さと、その凄さを実現する技術についての解説記事です。
少し小難しいかも知れませんが、「新しい技術がどのように社会を変えていくのか?」と言うテーマに関心のある方々を想定読者とし、日本一の分かりやすさを目指して書いていきます。
エッジAIという技術の分かりやすいユースケースとしてSONY社のプロダクトを扱っていきます。より全体的にこの技術のことを掴みたいと言う方にはこちらの記事から読み初めてみてください。
それでは、以下目次です。
プロダクトができること概要
具体的に「Edge Analytics Appliance」がどのようなバリューを提供しているのかと端的に言うと
「この製品をカメラに接続すると、人工知能が高度な映像制作を支援してくれて、かつリアルタイム性が高いのでそのまま配信までできちゃう」
というものです。
これまでは専門知識・技術を持つ多くの制作スタッフが長時間かけて制作してきていたインパクトのある映像コンテンツを、誰でも簡単リアルタイムで制作できるようにしました。
黒板の前に人が立っていても後ろの文字が見える
同プロダクトでは、板書抽出オーバーレイ「REA-L0100」という優れたアプリケーションをライセンス販売しています。
このライセンスを活用すると、ホワイトボードや黒板に書かれた文字や図形をリアルタイムに判別・抽出し、登壇者の前面に浮き上がらせることができます。人物透過率はリアルタイムに調整することができ、板書のみの映像を生成することも可能とのこと。すごいですね。
プロダクトの紹介動画を解説
プロダクトの紹介動画では、被写体となる人物が移動するとカメラが自動でトラッキングしていく機能や、ホワイトボードを認識してその部分だけ登壇する人物を透過する機能が見て取れます。
身近な日常生活のシーンで考えると、授業や会議で活用する黒板やホワイトボードの前に先生/登壇者が立ってしまい「ちょっと、見えないんだけど」と思った人は歴史上どれだけいたのでしょうか🙋♀️♂
ホワイトボードの前に立つ人の後ろ部分までちゃんと可視化させたことは、個人的には画期的なイノベーションだと思いました。(この機能が使えるライセンス価格は他よりも高価になっていました。)
セミナーや授業などでこれを使えば、壇上で動き回る人を追いかけながら、背景にあるホワイトボード/資料まで見える状態にしたプレゼン映像を、自動で処理して配信できるというわけです。すごいですよね。
搭載されている二つのAI
この製品には、以下の二つの機能が搭載されています。
①映像内の顔の検知や、色・形状の認識などをできる学習済みモデルと
②その学習モデルを活用して推論をするAIチップ
クラウドでのデータ処理に頼らずに、現場(=プロダクト)だけで高度なデータ処理を実現できるようになっている技術のことを「エッジコンピューティング」、そこで活用されるAIのことを「エッジAI」と呼びます。
クラウドとの通信をしたデータ処理を行わず、プロダクト本体が備えたAIが先ほどのような高度なデータ処理をしてくれることでタイムラグが消えて、高度な動画をリアルタイム配信をすることができる、というわけです。
この場合、現場にある端末(=プロダクトそのもの)のことを「エッジ」と呼びます。そのためにSONYは商品名に「エッジ」とつけたのでしょう。
ソニーの「Edge Analytics Appliance」は、まさにエッジAI/エッジコンピューティングを活用した代表的なプロダクトと呼べるでしょう。
プロダクトに搭載されるNVIDIAのAIチップの存在
皆さんはNVIDIAという会社をご存知でしょうか?
その時価総額は約20兆、ランキングは世界TOP50に入る世界を代表する企業であり、日本企業で唯一時価総額を上回るのはトヨタ自動車1社のみです。
そしてSONYの「Edge Analytics Appliance」を実現するためには「AIチップ」が必要になるのですが、このAIチップの王者がNVIDIAという会社です。
エッジAIのデータ処理に使われているAIチップは、よく知られている「CPU」ではなく「GPU」と呼ばれるものになります。
このテーマだけでも大変な分厚さになってしまうため別記事に割愛しますが、エッジAI/エッジコンピューティングにおいては「AIチップの演算能力の優劣」が重要になるということと、その市場の王者が「NVIDIA」ということだけ、この記事ではお伝えできればと思います。
まとめ
外出自粛の社会において、会議や授業などのオンライン配信需要は高まっています。このようなマーケット環境にあっても、昨年リリースされたこのプロダクトには逆にモメンタムがつくでしょう。
このプロダクトを活用してセミナーや授業を使えば、壇上で動き回る登壇者をトラッキングして自動で追いかけたり、
また、背景にあるホワイトボードを自動で可視化させたりした撮影をエッジAIが自動で行ってくれるため、カメラと製品を接続さえすれば「特別な編集作業なし」かつ「リアルタイム」で素晴らしい映像を配信することができるようになります。
現在は会議や授業な人が集まるイベントはオンラインで配信する方向に市場環境が大きく変化しています。そういった企業が増えている中で、このプロダクトは事業拡大の後押しを受けることでしょう。
<最後にちょっと宣伝>
私たちはARの会社ですが、今回ご紹介をしたようなエッジAI/エッジコンピューティングと呼ばれる先端技術を活用したプロダクト開発に、弊社でもチャレンジしていきたいと考えています。
もしご興味があるよという方がおられましたら、一緒にプロジェクトを進める仲間を探しておりますので、ぜひお気軽にご連絡をください。
また、新しいプロジェクトを立ち上げたい企業様ともご縁あればと思っていますので、ぜひお声がけくださいませ。それではまた!
ありがとうございます!