見出し画像

俺のVisonPro, AIについて2017年に考えたこと

VisionProは買ったのだが、友達に頼んだので届くまで一週間かかる。その間、みんなの自慢投稿を見てグギギギとやらなければならないのだが、アメリカにわざわざ取りに行くのも馬鹿馬鹿しいし、向こうから持ってきてくれるというので待つことにした。

まあそれはそれとして、2017年にこんなものを作っていたことをふと思い出した。

俺のVisionPro

まあ簡単に言えばVisionProのプロトタイプのようなものである(違う)

この時の吾輩は故あって隠遁生活を送っていたため、少しでもプロダクトに近づきそうなアイデアをそうそう簡単に公開できる立場ではなった。仲間内に密かに見せた程度である。

見ればわかるが、VR用のゴーグルにスマホをつけただけのものだ。
これのどこがVisionProなのか?

実はこのスマホではAIが走っていたのである。

AIだぜAI

当時の非力なスペックのスマホでは、YOLO的な物体認識がリアルタイム(12FPSだけど)で走るだけで大事件だったのだ。

これぞAIと人間の融合!見るだけでAIが視界を共有し、視界を拡張オーギュメントしてくれる!!!

非常にくだらないのだが、この時は自分なりに感動したらしくFacebookにライフイベントとして記録してあった。

実際被ると最初はすごい感動がある。

「テレビを認識した!!!しゅごい!!!ペットボトルはどうか!!!認識した!しゅごい!マウスも認識する!!!」

思わずあちこち向いてしまう。
しかししばらくして気づくのだ・・・

「おかしい、今の俺はAIにご理解いただけそうな物体を探すマシーンになっていないか?」

そう。目の前にあるのがテレビだなんてことは、人間なら誰でもわかるのである。確かにAIと視界を共有しているが、AIの方が圧倒的にバカな場合、これは全く無意味なのだ。プロトタイプと言ったのはこれである。

他にも様々なものを認識してみた

しかし、当たり前だが人間がデータを作っている以上、人間以上の知識なんか出てこないのだ。

もしもこのデータセットが、ハナノナというアプリのように、植物など何らかの専門知識に特化していたら話はまた違ったかもしれないが、いわゆる一般的な物体認識をやってしまうと、「ここにマウスがあります」と言われても、「うん。知ってる」という以上の情報にならない。

だが、あれから7年。ついにApple大明神がVisionProを発売した!!
まさか本当に発売するとは!

過去のApple製品の中でも醜悪な部類のデザインだと思うが、Appleが時代を変えるところを幾度も目撃してきた人間としては期待せずにはいられない。たとえ失敗作だったとしても、それは意味のある前進に違いない。LISAだってiPod HiFiだって何らかの礎になったじゃないか。

それにAIだって進化してる。GPT4Vで同じことをすれば、当時の画像認識よりは随分マシなことを言ってくれるだろう。そんなアプリを作るのは造作もないが、あまりに造作もなさすぎてやりたくなくなってくる。

と思って作ってみました。最新版、拡張人間誕生!

スマホとVRホルダーでみてね

起動すると10秒ごとに見ているものからインスパイアされたかっこいいキャッチフレーズを音声で読み上げてくれます。

VisionProとかカメラへのアクセスに制限ありそうだからこっちの方が面白いことができるのでは?

APIキーは自分で入れてください