見出し画像

Teslaは今なにを目指しているのか?

Teslaは2021年8月19日にTesla AI Dayを銘打った大規模なプレゼンテーションをおこなった。自動運転というグランドチャレンジに対して、彼らはどういったビジョンを描いているのか、私が読み取れた範囲をみなさんと共有したい。

Vector Space

スクリーンショット 2021-09-02 11.45.37

Tesla AI チームが語る戦略は非常に野心的だ。

車周辺にある8台のカメラ画像から直接は物体認識や深度推定などの自動運転に必要なタスクを行わない。8台のカメラ画像を一度Vecotor Spaceという比較的低次元のベクトルに写像することを目指している。RegNet, BiFPN, Transformerなどここ数年で誕生した強力な新顔のNNを主体にこのVecotor Spaceは作成されている。

スクリーンショット 2021-09-02 15.28.18

別々のカメラから車線予想をしてそれらを合成する(左下)より
Vector Spaceから車線予想をしたほうが頑強でスムーズに(右下)

HydraNets

スクリーンショット 2021-09-02 11.50.30

Vector Space を作った狙いは精度向上以外にも、エンジニアリングとして優れている点がある。彼らは中間表現である Vector Spaceを使い、各種自動運転に関わるタスクを独立して解ける基盤を作成している。Vector Spaceはある種のミドルウェアなのだ。例えば通常の経路計画とスマートサモンは独立したアプローチで解決されている様子が見られる。彼らはこれをHydraNetsと表現している。Hydraというのはこういう感じ→(Google画像検索)。

時系列情報との融合 

完全自動運転(Lv5)を実現するには単純に静止画から物体認識や深度推定などができればいいだけではない。時間方向の変化もNNはうまく扱えないといけない。

例えば、ある車が停車しているのかどうか判断するのは静止画だけでは必ずしも容易ではない。他にも一時的な障害物で見えなくなったが、その先に重要物がある場合もシステムはその情報を保存しておく必要がある。

そのためSpace Vectorをそのまま使うのでなく時間方向の広がりを持つSpitial RNNを作り、現在地だけでなく時間的にも広がりを持つ地図を作るNNも彼らは開発をしている。この地図情報を使う事で人間がラベリングを行う時のコストの省力化に成功していることも言及されている。

スクリーンショット 2021-09-02 18.11.21

カメラ画像から作られた地図(右上)が車が進むと同時に拡張していく様子

車会社を超える異常な広がり

Dojoチップの担当者から高らかな宣言が出される。巨大ネットワークと大量のラベル付き走行データの学習のためのDojoと呼ばれるクラスタコンピュータを作成している。Dojoは世界5位のスパコンであると彼らは言っている。

スクリーンショット 2021-08-31 19.52.10

プレゼンテーションの最後にTesla Botと呼ばれる汎用アンドロイドに着手していることも発表された。Vector Spaceは車だけでなくロボットも扱えると考えているのだろう。Teslaは従来の車会社を枠組みを超えた領域を目指している。

トヨタの2020年の自動販売台数は1000万台、Teslaはおよそ50万台。直感的にはDojoやTesla Botを作るよりも車の生産工場を作りそうなものである。しかし彼らはより大きな画を描き、世界からTalented で red-blooded な人材を集めようとしている。

グランドデザイン

カメラや各種センサーから3次元構造を再現するという研究はなにもTeslaがはじめてでなくてSLAMやStructure from Motionと呼ばれる研究はすでに膨大にある。実際に私自身もやったことがある。

スクリーンショット 2021-09-02 16.18.02

車椅子の上にLiDAR, IMU, GPS-GNSSなど各種センサーを乗せる。
この車椅子で名古屋大学周辺の点群地図を作成した。意外とできるものだ。

現在のTeslaのLv2自動運転程度を実現するのであれば、こんな巨大なNNは完全にオーバースペックだ。ADASはカメラとミリ波レーダー、あるいは上級グレードの車ならLiDARを使って多くの車会社で実際に運用されているわけである。Lv3やLv4を目指すならHD-Mapを使うという方法で多少目星はついている。目の前の問題を順に解いていくならこうなる。

Pure vision で HydraNets というミドルウェアを作り、自動運転に関わる全てのタスクをこの上で行うとTeslaは信じているのだ。彼らはリアル世界を(動物的に)理解するAIとはこういったものであるはずと設計をしている。目の前の問題を解くだけではない強い意志が感じられる。

トップから垂直にこれほど高度なソフトウェアのグランドデザインが共有されている企業が世界にどれだけあるだろうか。

アメリカはいつも夢を見ている。

ダウンロード

人類を月に送ったその時も。

専門性のあまりの高まり故に国家が科学の分野で機能不全となっている現代でも。

ベンチャーキャピタリズムと Telented を結びつけアメリカは夢を見続けている。Elon Musk はまさにその依代(よりしろ)だ。

しかし僕らだって夢を見続けていいはずだ。


この記事が気に入ったらサポートをしてみませんか?