最近レビューしたrabbit r1デバイスが大人気となり、多くの視聴者から関心を集めました。この$200のハードウェアは、自然言語を用いて様々なアクションを実行でき、主に声で操作します。rabbitから直接フィードバックを受け、視聴者の疑問や混乱を解消することにしました。特に、サブスクリプション料金が不要であり、Large Action Model(LAM)の効率性について説明しました。さらに、プライバシーとセキュリティに関する懸念にも対応し、ユーザーのデータ保護に注力していることを強調しました。
公開日:2024年2月24日
※動画を再生してから読むのがオススメです。
私は数週間前にrabbit r1デバイスについてレビューをしましたが、これは今までで最も人気のある動画でした。
rabbit r1が発表された日、私は1つ注文しました。届くのが待ちきれません。レビューして、皆さんにどう思うかをお見せしたいと思います。
私は本当にこれがコンピューティングの未来につながる第一歩だと信じています。
AIに直接自然言語を計算に変換します。
最初に作ったその動画は数週間で100万回以上再生されました。明らかにこのデバイスは多くの魅力を持っており、少なくとも人々はそれについて知りたがっています。
もしrabbit r1デバイスについて何も知らない場合、それはあなたが持ち運べる$200のハードウェアで、基本的にはあなたの自然言語を使って行動を代行するものです。
音楽を聴くことから、Uberを呼ぶこと、食べ物を注文すること、買い物に行くこと、何でもできます。
主なやり取り方法はタッチスクリーンではなく、声です。
そして私は皆さんのコメントをすべて読みましたが、製品に関する共通の質問や混乱がたくさんありました。
そして、私の動画を見たrabbitが実際に私に連絡して、あなたのコメントに直接対応してほしいと言ってきました。
そして、それが今日私がすることです。
rabbitはこのビデオのスポンサーであり、あなたの質問にたくさん答え、あなたの疑問をたくさん明らかにしてほしいと望んでいます。
私は本当にこのデバイスにとても興奮しているので、これをするのがとても楽しみです。
では、あなたのコメントで見つけた一部の一般的な質問や懸念を見てみましょう。
そして、多くのことを明確にできるといいですね。
まず、PMXさんのコメントを見てみましょう。
定期購読はありませんが、彼らのLLMはクラウド上で実行され、高価です。
そして、アプリとのやり取りは再びクラウド上で実行されるエミュレータを介して行われ、それも高価です。
数ヶ月後に定期購読料を請求し始めるか、破産してデバイスがとても見栄えの良いペーパーウェイトになるでしょう。
非常に妥当な懸念です。
人々はハードウェアデバイスを購入するだけでなく、定期購読料金を支払わなければならないことに慣れています。
多くの方々が、rabbitデバイスがたった$200であり、どんな現代のテクノロジーデバイスにも非常に安価であるだけでなく、定期購読料金も請求されていないことに懐疑的かもしれません。
今、私はrabbitにこれについて話しました。
彼らは定期購読料金を請求する予定はありませんが、もちろん将来考えを変える可能性もあります。
しかし、今のところ、定期購読料金はかかりません。聞くのが変かもしれませんが、今日の現実です。
そしてビデオの後半では、rabbit OSを実行し、Large Action Modelを実行し、クラウドで行うすべてが実際には思っているよりもはるかに安価である理由について話します。Large Action Modelは非常に効率的です。
定期購読プランはありません。
デバイスを手に入れたら、そのデバイスはあなたのものであり、使用することができます。
次に、Large Language ModelとLarge Action Modelの違いについて多くの混乱があるようです。
多くの人々が、それが単なるマーケティング用語であり、いくつかの装飾が施されたLarge Language Modelであると考えているかもしれませんが、実際には何なのかを明確にしたいと思います。
大規模言語モデルは、トランスフォーマーアーキテクチャに基づいています。
その本当に得意なことは、トークンの系列の中で次のトークン、つまり文の次の単語を予測することです。
しかし、このアプリケーションではそれがうまく機能しなかったでしょう。
rabbitが行うことは、あなたの自然な言語を取り、達成したい行動だと思うものに変換することです。
そして、実際には、隠されたオペレーティングシステム上でその行動を実行します。
自分の電話を取り出し、DoorDashをクリックし、レストランに行き、食べ物を注文し、注文を完了すると想像してみてください。それをあなたのために行っているのです。
インターフェースをクリックする方法を実際に理解しているのです。
APIに接続しているわけではありません。
そして、なぜ彼らがそれを行うことに決めたのかをすぐに示すクリップを見せます。
そして、トランスフォーマーアーキテクチャを使用していないため、実際にははるかに効率的でランニングコストがはるかに低く、サブスクリプション料金がないという点に戻ります。
しかし、ジェシー・リュウがポッドキャストで説明しているビデオクリップを見せてあげましょう。それは大規模言語モデルと大規模アクションモデルの違いを説明しています。
私たちは大規模言語モデルを作っていません。
大規模アクションモデルはニューロシンボリックです。
それは大規模言語モデルではありません。
通常、私たちが話す大規模言語モデルはGPT-4やBard、Grokなどです。
これらはTransformerに基づいており、クラウド上で訓練を行い、正確な結果を得るために膨大な量のGPUが必要です。
30億ドルを調達したスタートアップが突然自分たちの大規模言語モデルを作ることができるとは思いません。
記録のために、私たちはそれを行っていません。
私たちはすべての最高の言語モデルと小規模言語モデルと協力しています。
そして、将来的にはオープンソースの言語モデルがあれば、基本的に内部評価を設定して、これらの主要ベンダーからのパフォーマンスを継続的に監視し、必要に応じて切り替えることができるようにしたいと考えています。
それがrabbit OSの動作方法です。
しかし、私たちはLarge Action Modelに焦点を当てています。言語がより理解しやすいように設計されていることは事実ですが、少なくとも今のところ、タスクを完了する際に非常に非常に不十分なパフォーマンスを発揮しています。
そして、APIと一緒に作業する方法が好きではありません。APIを使うと、誰もがAPIを提供してくれると思っているが、それは実際にはそうではないからです。
オープンITや大手企業は、皆に自分たちのためにAPIを構築するよう奨励するのが簡単ですが、スタートアップにとっては突然、自分たちのフォーマットで2,000のベンダーがAPIを作るよう説得するのは本当に難しいです。
たとえすべてのAPIを持っていても、しばしば、それらはアプリケーションの全機能を100%再現していないことがあります。
だから私たちは、「ちょっと待って、一歩引いて考えよう」と思ったのです。
普遍的な解決策について考え、Androidアプリ、iOSアプリ、Windowsアプリなど、どんなアプリケーションにも適用できるAIを作成しましょう。
トリガーアクションを設計するために言語モデルが設計されていないことを知っているので、どのようにして普遍的な解決策を構築できるか考えてみましょう。
実際には、NeuroSymbolicを使用して基本的に始めました。
実際には、データラベリング会社と協力し始めました。
私たちは自己評価に基づいて収集を始めました。
実際に、UberやSpotifyなどのさまざまな種類のソフトウェアとやり取りする実際の人間がいるテストグループを組み立てました。
このプロセスを約2年半前に開始しました。
私たちはさまざまな種類のソフトウェアとやり取りする実際の人間を収集し、それらのすべてをビデオ録画で取得しました。
そして、NeuroSymbolicアルゴリズムを設定し、これが今日のLarge Action Modelになり、すべてのクリップをLarge Action Modelにフィードし、私たちの土地にクリップをフレームごとに読むように求めました。
これまでに見た中で最も一般的なことは、以前に作成したビデオへのコメントだけでなく、インターネット全体で見られるもので、なぜこれが単なるアプリではなく、スタンドアロンのデバイスにならなかったのかということです。
そして、私はいくつかの方法でこれに答えます。
最初に答える方法は、私はスタートアップの世界から来ています。
rabbitが完全に新しいことを試み、Appleデバイス、Androidデバイスの独占を打破しようとしている事実。
私は彼らを賞賛し、彼らは本当に私たちに、私が信じるコンピューティングの未来を示しています。
そして、彼らはただスマートフォンのアプリでそれを達成できるとは考えていませんでした。
今、携帯電話を取り出すと、デバイス全体が、指を使ってアプリを操作し、アプリ内で必要なものを見つけるためにあなたを中心に構築されています。
しかし、rabbitは非常に、非常に異なっています。
あなたは自然な言語を話し、AIエージェントがあなたの代わりにそれらのアクションを実行しています。
そして、これを単なるアプリとして構築した場合、それは可能ではなかったでしょう。
そして、さらに、2つのデバイスを持ち歩かなければならないという懸念があります。
実際、多くの人が複数のデバイスを持ち歩いています。
携帯電話、時にはノートパソコン、イヤーバッド、そして今ではARやVRデバイスを持ち歩いています。
少なくとも初期の採用者としては、私は別のデバイスを持ち歩くことを気にしません。まず第一に、私の意見では美しいし、小さくて軽量です。
そして、私がこれからコンピューティングの未来だと信じているもので遊ぶことができるデバイスを持ち歩けるなら、私は全く気にしません。
そして、多くの人々が言っているのは、SiriやGoogleアシスタントもこれを追加するのではないか、ということですか?
おそらく、彼らはいくつかの機能を追加するでしょうが、それを行うために15年以上もの時間があったにもかかわらず、それをあまりうまくやっていないという事実もあります。
もちろん、状況は変わっていくでしょうし、今後急速に変化していくでしょうが、私は市場での競争を楽しみにしています。
そして、AppleやGoogleは、革新者のジレンマの落とし穴を避けようとしています。
彼らはこれらの既存の製品と既存のフレームワーク、既存の考え方を持っています。
そして、その考え方から抜け出すのは本当に難しいです。
SiriやGoogleアシスタントが進化しても、それでも彼らは以前に構築したすべてのものの枠組みの中で作業をしなければならないでしょう。
そして、rabbitは本当に革新し、完全に新しいことをしようとしました。
そして、その姿勢を称賛します。
ここで、ジェシー・リューがなぜ自分自身のハードウェアデバイスを構築することを決めたのか、アプリになるだけでなく、その理由を説明するビデオクリップを見せてください。
それを彼は本当にうまく言っていると思います。
これを見てください。
いつ自分がiPhoneを手に取ろうと感じますか?
いつ自分がrabbitを手に取ろうと感じますか?
どちらのデバイスでも挫折ポイントに達すると感じますか?
そして、これが私が携帯電話を持参する代わりにこのデバイスを持参することを考える際にどのように影響するか、またはこのデバイスのハードウェア容量を考える必要があるかもしれないか、またはこのrabbitがあるかもしれないが、他に2つのバージョンがあるかもしれない。
iPhoneを持たずに家を出て、rabbitだけを持って行ったことはありますか?
それについて話してください。
まず第一に、どんな単一の直接的な行動でも、私は今はrabbitに傾いています。
なぜですか?
なぜですか?
そのタスクを達成しようとすると、思考のスピードが速くなるからです。
そして、それはすでに持っています。
そして、それを見ずにアナログボタンを見つけるよりも、ほぼすぐに感じ、より直感的に話すことができます。
そしてAIは正確で十分に良いので、LAMは作業を早く終わらせるのに十分速いです。
簡単な参考情報をあげます。
私は常に複数の画面を使っています。
仕事をしているときや他の人と話しているときには、いつもたくさんのことをしています。
何かわからないことがあれば、これは間違いなく速いです。
LAMのことは忘れましょう。
ちょっと検索の点で。
新しいタブを設定したり、プロンプトに移動してタイプを始めるよりもはるかに速いです。
アクションボタンがあるからです。
CB無線のようなものです。
ボタンを押して、単語iconoclasticの定義を言ったり、単語Donny Brookの定義を言います。
単語Donny Brookを知らない。
単語Donny Brookの定義を言います。
考える必要がありません、コマンドタブ、Googleに移動して、Donny Brookの定義を調べるなど、6、7ステップ。
いや、それでもない。
非常に高度な数字です。
これは、実際のケースをお示しするので、より早く理解できます。
私は、当社の既存の投資家の1人と会議をしていました。
彼らは他の企業の売上やいくつかの数字と比較してパフォーマンスについて尋ねられました。
私は本当にわかりません。
昨年の企業の収益がわかりません。
考えてみれば、Googleで検索したら200のタブがあります。
どれが正確なのでしょうか?
どれが正しいのでしょうか?
だからこそ、私たちはPerplexityとの戦略的パートナーシップを設立しました。それだけを強化するためです。
それは単なる検索です。
もう一つは音楽です。
これが音楽を再生できるだけで、あなたはきっとこれを気に入ると言えます。
これはクラシックなiPodの第2世代で、同じレベルか、もしくはよりシンプルな操作方法を持っています。
音楽を再生するだけでも、過去8ヶ月で、検索以外では間違いなく私のナンバーワンだと思います。
検索はおそらく音楽の70%を占めています。
今、プライバシーやセキュリティに関する懸念もたくさん見かけたので、その両方に触れたいと思います。
まず、プライバシーについて話しましょう。
実際、プライバシーはrabbitにとって非常に重要で、実際にそれについてのページをウェブサイトで公開しています。
では、プライバシーについて直接言及している部分を見てみましょう。
まず、ハードウェアであり、カメラが付いているため、デバイス内でカメラをブロックする物理的な方法を明示的に提供しています。それは素晴らしいことです。
もし読み続けると、r1には常にリスニングモードがないと書いてあります。
これも非常に重要です。
他にもいくつかのAIハードウェアデバイスが発売されており、常にリスニングモード、常にウォッチングモードであるものがあり、それは私をすぐに引きつけませんでした。
これは、オプトアウトよりもオプトインの方がはるかに多いです。
もしrabbitと対話したい場合、実際にボタンを押し続けるか、実際に写真を撮る必要があります。
常にリスニングしているわけではなく、常にウォッチングしているわけでもないので、私は好きです。
物理的なプッシュトークボタンを押しているときだけ、rabbitはあなたの声を聞きます。
rabbit OSには、ジャイロスコープを使用したプライバシーモードも搭載されており、r1が下を向いているときにはすべての入出力モードが無効になります。
そして、r1デバイスと共有している実際の情報があります。
私たちは、r1と共有した情報がr1に残るように確認しています。
私たちを含め誰も、あなたの名前、電話番号、メールアドレスなどの個人情報を、あなたにサービスを提供する以外の目的で使用することはできません。
rabbit OSは、rabbit holeウェブポータルを使って、覚えたり忘れたりすることを選択することができます。
それには、認証や情報の制御などを行う独自のウェブポータルがあります。
そして、あなたのデータをあなたの明示的な許可なしに、いかなる状況でも第三者と共有したり販売したりすることは絶対に約束します。
それは本当に、本当に重要です。
彼らの言っていることを信用しなくても、彼らのウェブポータルにログインして、彼らが持っていてほしくない情報を削除することができます。
そして、それだけでなく、実際にはあなたとあなたのエージェントのために独立した環境を立ち上げます。
rabbit OSとやり取りする際には、あなた専用のクラウド環境が割り当てられ、あなた自身のLAM用に独立した環境が提供されます。
私たちのrabbitsがあなたのためにタスクを実行する際には、rabbit holeウェブポータルを通じて安全に管理権限を付与していただいたあなた自身のアカウントを使用します。
たとえば、DoorDashやSpotify、その他のサービスにログインしているとします。
お客様が第三者と同様に認証許可を与えるために、SSLを使用してウェブポータルに非常に安全にログインします。
これらのデバイスのパスワードを保存しません。
ウサギは、特に支払いなどの機密行動を含むタスクの実行中に、許可と明確化を求めるでしょう。
DoorDashから$500分のスニッカーズバーを誤って注文することはありません。
rabbitは、正当なユーザーの安全で敬意を払った表現です。
偽のアカウントやスパムアカウントを作成したり、対象アプリへの異常なアクセスパターンやトラフィックに関与したりしません。
彼らが使用しているAIエージェントは、人間のように見えたり振る舞ったりします。
サービスの逆解析を試みたり、既存のAPI相当物を置き換えようとはしません。
キャプチャを解決したり、アプリのユーザーベースを大幅に変更しようとはしません。
代理人があなたの代わりに行動を行うことと、あなた自身がそれを行うことに違いはないはずです。
それをあなたのためにやることで、たくさんの時間を節約しています。
そして、私が言及したように、彼らはスタートアップであり、進化しており、物事を理解しようとしています。
彼らは非常に透明で常に改善しようとしています。
そして、再び、スタートアップの世界から来て、この種の革新を見て、私は彼らを賞賛します。
プライバシーやセキュリティに関するいくつかの懸念に答えることを願っています。
実際、デバイスにパスワードを保存していません。
すべてはクラウドで安全に行われています。
ハードウェアデバイスは、あなたとエージェントの間のやり取り方法として機能します。
そして、さて、ジェシー・リュウが認証とプライバシー、セキュリティについてどう考えているかをお見せしましょう。
これが実際に認証がどのように機能するかです。
ご覧ください。
rabbitに伝えると、すしを5人前、この量の食べ物などを注文してくれと言うと、Uber EatsアプリやDoorDashアプリを使いこなす方法を知っています。
それから、rabbitデバイスはこのリクエストをクラウド上のあなたのサービスに送信します。
私はすでにWebインターフェースで認証済みです。Uber EatsとDoorDashのアカウントを認証しました。
私はすでにウェブインターフェースで認証済みです、ねえ、Uber EatsとDoorDashのアカウントも認証しました。
そして、注文プロセスを開始します。
そして、注文プロセスを開始します。
そして、戻ってきて、これがあなたが望むものか確認したいと言います。
私ははいと言います。
それから、それは何をしますか?
それはクラウド上である種のエミュレーターがポップアップします。
そして、私のログインがすでに認証されているこのウェブエミュレーターがあります。
それはどのように機能するのですか?
まず最初に、最初の認証から始めましょう、ね?
なぜなら、デバイスについて考えると、以前の世代とはかなり異なる方法で機能するからです。なぜなら、事前にソフトウェアが組み込まれていないからです。
何も事前にインストールされていません。
それは文字通りただのAIです。
どのようなサービスを有効にするかはあなたの選択です。
そして、このデバイスをどれだけ複雑で先進的にしたいかもあなたの選択です。
もしあなたが、「ねえ、これはかっこいいiPodだ」と言うだけなら。
これを音楽を聴くために使いたいだけです。
それから、音楽機能をアンロックして、どのベンダーを選んでも、音楽だけを再生します。
しかし、明日、食べ物を注文したい場合は、その機能をアンロックする必要があります。
ログインプロセスが正しいところです。
私たちにはウェブポータルがあります。
それは、私たち自身のIQ/iCloudのミニバージョンのようなものです。
その意味で理解していただければ、すべての認証設定と機能管理が助けになります。
ウェブサイトに行って、基本的にアンロックしたいサービスを選択します。
再び、Large Action Model、Spotify、YouTube music、Apple musicなどはどれも同じです。
それはインターフェースです。
実際、ExpediaやYouTube Musicには違いがありません。
それらはすべてインターフェースです。
お好みのサービスを選択してアンロックする自由を与えました。
そこに行って、基本的にSpotifyボタンをクリックします。
そして次に起こるのは、Spotifyのログインページにリダイレクトされることです。
そして、あなたの認証情報を保存しません。
それには触れません。
Spotifyに行って、Uberに行って、DoorDashに行って、そこからログインします。
そして、私たちは認識します、ああ、このアカウントはrabbit OSと接続されています。
そして次に起こるのは、私たちのクラウドに、非常に創造的で革新的な構造があることを考慮しています。
私たちはスーパーホストを持っています。
ジェイソンがrabbit r1にハンバーガーを注文するように話すとき、最初にジェイソンがDoorDashにログインしているかUber Eatsにログインしているかを確認しますね。
そして、わかりました、ジェイソンはDoorDashを選択しました。
そしてそのスーパーホスト上で、ラムは仮想的にDoorDashのアプリやウェブサイトとやり取りしています。
そして、すべてが一度に行われるので、あなたはそれをすべて見ることはありません、それはAIだからです。
そして、結果を得るためにあなたのデバイスにrabbitテーマのUIを再レンダリングします。
あなたはホストと直接やり取りしているわけではありません。
あなたはただそれに話しかけているだけです。
意図はLLMに行き、LLMが理解し、ああ、あなたはこれをしたいのね、それならLAMが仮想環境でそれを行い、結果をあなたのデバイスに再レンダリングします。
それだけです。
私は自分のrabbit r1を手に入れることにとても興奮しています。
数週間後にそれを受け取るはずです。
手に入ったら、たくさんのレビュー動画を作る予定です。
私がr1についてとても興奮しているように、あなたも同じように興奮しているといいなと思います。コンピューティングがどのように見えるかの未来を垣間見ることができると本当に思います。
これは以前のrabbitビデオだけでなく、多くの以前のビデオでも言ってきましたが、アプリケーションは消えていくでしょう。
プログラマーはおそらく長期的には必要なくなるでしょう。
それは自然言語、AIへの直接、コンピューティングへの直接になるでしょう。
その可能性に本当に興奮しています。
あなたもr1デバイスを手に入れてほしいです。
もしあなたが私のレビューを見てから待ちたいというなら、それも素晴らしいです。
もしこの動画が気に入ったら、いいねやチャンネル登録を考えてみてください。
次の動画でお会いしましょう。