End to End DeepLearning が切り開く自動運転の世界

山本一成🚗TURING

2021年9月17日 20:47

将棋のルールは結構複雑で、普通に記述するとソースコード1000行くらいは必要になる。Deep Learningにどのように合法手(=ルール上可能な手)を教え込めばいいか悩んでいた。

そして結局、Ponanzaは特にルールを教えずに5億の局面と最善手(∈合法手)のペアをひたすら一致させるよう学習させた結果、ほぼ全ての場面で合法手を推薦するようになった。

コード規模1000行程度の複雑なルールを明示的に教えてなくても、学習データから勝手に学習することは当時の私にはあまりに衝撃的なことだった。

この世界のルールは複雑だ。将棋のように複雑ながらもexplicitにルールが表現されているものある。しかしルールが完全に明示されていないものもたくさんある。現実世界・ビデオゲーム内の物理法則、文法、そして交通ルール。

------　↓ここから結構主観的な意見↓　------

2008年の自動運転で(ほぼ)アメリカ横断が達成された時、そのキーとなった技術は機械学習ではない、LiDARというセンサーだ。

LiDAR+自己位置推定は悪くない。実際に私も実装してみたがサクッと動いた。ある程度想定された環境下なら極めて実用的だ。自己位置推定をLiDARなどで行って経路計画を立てて、もし前方に障害物があれば止まるなり回避ルートを計画すれば良い。

LiDARは補助輪として本当に役に立つ。しかしLiDARだけで安全な自動運転はできないと考えている。なぜならLiDARから来る情報量(解像度・フレッシュレート)がカメラ画像よりも遥かに少ないからだ。

これの議論ポイントして、レーダーやLiDARの値段じゃなくて精度(解像度やFrequency)において他のセンサーよりカメラが良いと考えている点が面白い。人間がみても正直LiDAR画像から物体認識はかなり難しいしvision のもつ潜在能力はまだまだ有効に使いきれていないと言うのは一つ真実だと思う。
— 山本一成🚗🚙🚕 (@issei_y) August 16, 2021

End to End(E2E) DeepLeaning は自動運転の夢を見るのか？

Tesla AI DAY の中で何度もE2E DeepLearningという単語がでた。現在テスラはADASを実装する上で常識であったミリ波レーダーを廃止してカメラ一本にすることを宣言している。

また最近はテスラ以外にもE2Eを掲げる企業/チームも海外では見かけるようになってきた。comma.aiのチームはシュミレーションを擬似的に作ることで強化学習を行いハンドル操作をe2e deep learningで解いた。ちなみに私はcomma.ai を実際に試して走っています。

ルールベースのプログラムモジュールで作られていたものが機械学習やDeepLearningで駆逐されていった例は情報科学の世界でたくさんある。将棋や囲碁はもちろん、画像認識も自然言語処理もそうだった。最近だと化学や物理の世界でもその傾向があると伺っている。自動運転領域でもe2e deep learningに収束するのは歴史の必然だと私は考えている。

この記事が気に入ったらサポートをしてみませんか？