見出し画像

テスラ対ウェイモ 自動運転車技術の比較 + LiDAR対テスラビジョン

5,841 文字

テスラとウェイモの自動運転技術を比べてみると、一般の人から見たらレベル4対応のフリートを持つウェイモの方が進んでるように見えるかもしれまへんな。でも、もうちょっと深く掘り下げて分析的に見てみると、テスラのシステムの方がずっと高性能なんです。
そして、テスラのFSDソフトウェアのバージョン12がリリースされたら、ウェイモを追い抜く可能性もあるんちゃうかなと思いますわ。ほな、テスラの完全自動運転技術とウェイモの技術を比較して、なんでそう考えるのか説明していきますわ。
私はジョンです。ここはクリーナー・ワットチャンネルです。
ウェイモは現在、アリゾナ州フェニックス地域でレベル4の無人タクシーフリートを運営してます。そして、ロサンゼルスとサンフランシスコでも同じ無人サービスを開始しようとしてますわ。次はテキサス州オースティンが4番目の主要都市として予定されてますが、他の市場と同じように最初は安全運転手付きで始めるんちゃうかな。
一方、テスラの完全自動運転ソフトウェアは、技術的にはまだレベル2の運転支援システムで、常に注意深い人間のドライバーがいつでも運転を引き継げる状態である必要があります。
だから表面的に見ると、ウェイモの無人フリートの方が優位に見えるかもしれまへんな。でも、自動運転技術の本当のリーダーはどっちなんでしょうか?
まず、ウェイモのシステムの地理的な制限から比較を始めたいと思います。この動画で話すレベル2やレベル4のような自動化レベルは、SAEインターナショナルの自動運転技術の説明を参考にしてます。
SAEインターナショナルは、自動化レベルの違いを非常に分かりやすく説明した素晴らしいチャートを作ってくれてます。例えば、レベル4の自動運転では、車が制御を行い、人間のドライバーは必要ありません。このチャートによると、「運転を引き継ぐ必要はない」と書かれてます。
ただし、レベル4にもまだ制限があって、このチャートでは「限定された条件下でのみ車両を操作できる」と説明されてます。ウェイモの場合、レベル4システムの主な制限の1つは、フェニックス都市圏のような非常に特定の地理的地域でしか運用できないことです。
ウェイモの無人サービスが運用できるのは、80平方マイルのジオフェンス区域に限られてます。フェニックス以外では、先ほど言うたように、サンフランシスコとロサンゼルスのカリフォルニア市場、そして最終的にはテキサス州オースティンにも無人サービスを拡大する予定です。
でも、4つの市場全部でサービスを提供したとしても、アメリカ全体から見たらほんのわずかな部分にすぎません。世界全体で見たらもっと小さな割合ですわ。
対照的に、テスラのシステムは、基本的なオートパイロット、拡張オートパイロット、完全自動運転のいずれも、レベル2の運転支援機能に分類されます。テスラのウェブサイトにある完全自動運転技術の免責事項には、「現在利用可能な機能は積極的なドライバーの監視を必要とし、車両を自律的にするものではありません」と書かれてます。
ただし、積極的なドライバーの監視が必要やとしても、テスラの完全自動運転システムは他のどのレベル2システムよりもはるかに高性能で、真の自律走行車に必要なすべての機能を備えてます。
システムはまだミスを犯すことがあるので、注意深い人間のドライバーが必要ですが、ウェイモのシステムのような地理的制限はなく、ほぼどこでも運用できます。
ウェイモがサービスを拡大するのにはかなりの時間がかかると思いますが、テスラのソフトウェアが準備でき、規制当局の承認が得られたら、テスラの拡大は急速に進むと思います。テスラのアプローチのおかげで、一夜にしてウェイモを追い越す可能性も十分あるんちゃうかな。
ほな、自動運転技術について、ウェイモのアプローチはテスラとどう違うんでしょうか?
テスラのXのポストで明確に書かれてるんですが、テスラはHDマップに頼ってません。つまり、テスラ車が走行できるようになる前に、詳細な地図を作る必要がないんです。
一方、ウェイモはHDマップに頼ってます。ウェイモのウェブサイトに掲載されてる研究論文の要約によると、「実世界の道路の地形や形状は限られてるので、新しい未知のシナリオに対して自動運転スタックをテストし、一般化する能力が大きく制限される」そうです。
テスラがHDマップに頼る必要がないのは、テスラビジョンに基づいた本当のAIシステムを構築してるからです。バージョン11のソフトウェアはコードと人工知能の組み合わせで動作してますが、まだリリースされてないバージョン12はエンドツーエンドのAIシステムで、車のカメラが観察した世界に直接反応できるようになってます。HDマップや大量のC++コードは必要ありません。
テスラの完全自動運転ソフトウェアのバージョン12のデモドライブ中、イーロン・マスクは車が特定の行動を取れたことについて、何度も「特定のコードは書かれてない」と強調してました。代わりに、ニューラルネットが実世界のデータ、ビデオ、画像で訓練されて、その訓練に基づいて車が反応する方法を知ってるんです。
イーロン・マスクの言葉を引用しますと、「これはラウンドアバウトやというコード行はありません。バージョン11の明示的な制御スタックにあるような、X秒待つというようなものもありません。バージョン11の明示的な制御スタックには30万行以上のC++がありますが、バージョン12にはほとんどそういうのはありません」
イーロン・マスクは、テスラの2023年第3四半期の投資家向け電話会議で、リリース前の完全自動運転バージョン12ソフトウェアについて次のように更新情報を提供しました。
「FSDバージョン12でも大きな可能性が見えてきてます。これはエンドツーエンドのAIで、フォトンカウントが入力で制御が出力です。実際には、大量の中間ストリームが入力されて、ごく少量のビットストリームが出力される、現実を非常に小さな出力セットに圧縮するようなもので、実際、人間もそんな風に動いてるんです」
ウェイモもある種のAIシステムを開発してますが、テスラほど堅牢ではないと思います。私の意見では、HDマップとLiDARに過度に依存してると思います。ウェイモのシステムは現在も、そして将来も、長い文字列のコードに依存し、道路の変化に対応するためにHDマップを常に更新する必要があると思います。
次に比較したいのは、各社が使用するセンサーについてです。これはアプローチのカテゴリーに入るかもしれませんが、ここでは別に分けて説明します。
まず、テスラは主にカメラを使用し、車両にLiDARセンサーは搭載されてません。最近では、超音波センサーとレーダーセンサーも車両から取り除かれました。ただし、ハードウェア4を搭載したモデルSとXにはレーダーが復活し、将来的にはモデル3とモデルYにもレーダーが追加される可能性が非常に高いようです。
それでも、レーダーを加えても、センサースイートはまだかなりシンプルです。イーロン・マスクは、人間が目と脳で光学入力を処理して運転できるように、車両もカメラと訓練されたニューラルネットで同じことができるはずだと考えてるからです。結局のところ、人間は運転するのにレーザーを内蔵する必要がないし、イーロンの意見では車両も同じです。
2019年のテスラAIデーで、イーロン・マスクは「LiDARは愚か者の道楽だ。LiDARに頼る者は運命づけられている」とまで言いました。同じイベントで、アンドレイ・カーパシーは、LiDARについて「自律性に必要な視覚認識の根本的な問題を回避している。虚偽の進歩の感覚を与え、結局は足かせになる」と述べました。
テスラのセンサースイートはかなりシンプルですが、ウェイモのIPaceフリートには51の主要センサーがあります。これらのセンサーには、26台のカメラ、6台のレーダーセンサー、5台のLiDARセンサー、14台の超音波センサーが含まれます。これは非常に多数のセンサーで、必要以上に複雑さを増してると思います。
テスラの元人工知能ディレクターのアンドレイ・カーパシーは、コンピュータービジョンとパターン認識に関する仮想会議CVPR 2021で講演し、テスラが車両からレーダーを取り除いた理由を説明しました。
具体的に、アンドレイは「カメラが車で見る知覚のほとんどの重要な部分を担っている」と述べました。カメラがレーダーよりどれだけ優れてるかについて、アンドレイは「ビジョンはセンサーがレーダーよりも100倍優れてるレベルに達している」と言いました。
「他のセンサーを圧倒し、はるかに優れたセンサーがあれば、他のセンサーは実際にあなたを引き止め、ノイズを加えることになる」
このイベントで、アンドレイはイーロン・マスクの以前のツイートも引用しました。イーロンは「レーダーとビジョンが一致しない場合、どちらを信じるべきか?ビジョンの方がはるかに精度が高いので、センサーフュージョンを行うよりもビジョンに注力する方が良い」と書いてました。
結局のところ、適切なニューラルネットがあれば、カメラは素晴らしいデータを提供し、アンドレイ・カーパシーによるとレーダーよりも優れたデータを提供します。だから、優れたセンサーがデータを供給しているなら、それらのセンサーだけに頼って、システムを過度に複雑にしないために他のセンサーを取り除くのが良いんじゃないでしょうか。
テスラは最終的にレーダーが必要だと判断するかもしれませんが、それでもウェイモのような全てのLiDARセンサーや26台のカメラは搭載してません。ウェイモは極端に多数のセンサーを使用してて、私はそれが本当に必要以上にシステムを複雑にしてると思います。
これは、テスラとウェイモの次の比較点につながります。それは各システムのコストです。
先ほど言及したタンガービジョンの記事によると、ウェイモのIPaceには51の主要センサーがあります。ウェイモのシステムのコスト見積もりについて、著者は「コストの観点から見ると、このセンサーアレイは1台あたり4万から5万ドルくらいかかってるんじゃないかと推測せざるを得ない。これは他のセンサーや、追加のオンボードコンピューター、配線ハーネスなどの設置・運用に必要なものは含まれてない」と書いてます。
つまり、この記事の見積もりに基づくと、ウェイモがIPaceにセンサーを実装するのにかかるコストで、小売価格のリアホイールドライブモデル3が買えるってことです。これはかなり極端ですよね。
しかも、もちろんテスラはリアホイールドライブモデル3を売る時に利益を出してるので、テスラがその車両を作るコストは小売価格よりも低いわけです。
つまり、テスラのシステムとウェイモのシステムのコスト差は極端に大きくて、これがウェイモのシステムを商用アプリケーション以外で将来的に実用化するのを難しくすると思います。
結局のところ、完全自動運転技術の勝者となるのは、シンプルで費用対効果の高いソリューションであって、複雑で高価なものではありません。
これが将来的に、企業がテスラから完全自動運転ソフトウェアのライセンスを受けることにつながると思います。ウェイモが提供する非常に高価なソリューションと比べると、実装が比較的安価やからです。
4万ドルか5万ドルのソリューションを選ぶよりも、はるかに安いものを選ぶ方が合理的ですよね。
最後に比較したいカテゴリーはデータについてです。ニューラルネットを効果的に訓練するには、コーナーケースを多く含む、高品質で大量のデータが必要です。
このようなデータに関して、テスラとウェイモのどちらが有利なんでしょうか?これは主に各フリートの車両数に関係してきます。
例えば、長年オートパイロットデータを収集してきた大量の車両に加えて、テスラの完全自動運転ベータは2020年10月にリリースされ、約3年後にはソフトウェアが5億マイル以上走行し、北米で40万人以上のユーザーに使用されてます。
そして、テスラはこれらのデータの多くを、車両とソフトウェアの代金を支払った顧客から得てることを忘れんといてくださいね。
道路上にあるテスラ車の数が多いおかげで、アメリカ全土や他の多くのグローバルな場所からのコーナーケースを含む多くのデータをカバーしてます。
対照的に、ウェイモは現在、アリゾナ州フェニックス地域、ロサンゼルス、サンフランシスコでフリートを運営してて、テキサス州オースティン市場にも拡大する計画があります。
ウェイモのフリートの実際の車両数については、ウェイモが公に共有してないようですが、見つけられたデータを組み合わせると、フリートの規模は1000台未満のようです。
つまり、ウェイモはすべてのセンサーで非常に詳細なデータを持ってるかもしれませんが、それは非常に特定の地理的位置に限られてます。一方、テスラはもっと広範なデータセットを持ってて、より多くのコーナーケースをカバーしてます。
これにより、テスラ車をどこに置いても動作できるシステムを生み出せるはずです。
まとめると、ウェイモはテスラより先にレベル4の自動運転を実現しましたが、深刻な地理的制限があります。加えて、ウェイモのアプローチは将来の拡大を遅く、コストがかかり、難しくすると思います。
一方、テスラには同じような地理的制限がなく、はるかに多くの車両からより多様なデータセットを収集してます。そして、完全自動運転ソフトウェアがベータ版を卒業し、規制当局の承認を得たら、その実装は極めて迅速になると思います。
このため、並べて比較すると、私個人的にはテスラが自動運転技術の明確なリーダーやと考えてます。
みなさんはどう思われますか?コメント欄で教えてくださいね。また、パトレオンを通じて私をサポートしてくださってる皆様に、もう一度お礼を言いたいと思います。皆様のサポートは大きな違いを生み出し、本当にこれらの動画を可能にしてくれてます。
パトレオンを通じて私の活動をどのようにサポートできるかについてもっと知りたい方は、動画の説明欄にリンクを貼っておきますので、ぜひチェックしてみてください。本当にありがとうございます。

この記事が気に入ったらサポートをしてみませんか?