人型ロボット、Grok 2 Large、Midjourney Web、Ideogram 2.0、自動運転タクシー、悪用されるAI

2024年8月24日 06:09

AIにとってまた大きな1週間となりました。全てのニュースについてお話ししていきます。さっそく始めましょう。
まず、Unitary Roboticsから新しい動画が公開されました。彼らの素晴らしい人型ロボットを披露するもので、その動きの俊敏さはほとんど非現実的に見えるほどです。では、見てみましょう。
こちらが新しいデザインのようです。その跳躍能力、動きの良さ、バランスの取り方は信じられないほどです。間違いなく、今年は人型ロボットの年と言えるでしょう。しかも、このロボットはそれほど高価ではありません。つまり、各家庭に人型ロボットが普及する日が、思っていたよりも近いということです。
この直前に、深層強化学習を使って地形のナビゲーション方法を学習していると説明がありました。こちらはUnitaryのロボット犬です。なぜいつもロボットを押さなければならないのかわかりません。ただ意地悪に見えます。私は決してそんなことはしません。いつかAIが自我を持った時に、そのような記録が残っていないようにしたいからです。
Unitaryからのロボット関連の発表はこれだけではありません。Unitary GOTO Wも発表されました。これは基本的に同じ犬型のフォームファクターですが、オフロードタイヤを装備しています。つまり、ほぼどこにでも行けるようになったのです。こちらが元のモデルで、こちらがタイヤ付きのモデルです。明らかに、より速く移動できるようになりました。歩きながら進むことができ、大きな段差も簡単に乗り越えられます。今はスケートパークにいます。これは本当にとてもクールですね。はい、私も家に一台欲しいです。
次に、OpenAIがイランの秘密工作を阻止したようです。これが初めてではありませんし、間違いなく最後でもないでしょう。AIには大きな害を及ぼす可能性がありますが、OpenAIがこのような工作を阻止、フィルタリング、発見、妨害するツールを持っていることを願っています。
OpenAIは次のように述べています。「ChatGPTを使用してアメリカの大統領選挙キャンペーンを含む複数のトピックに焦点を当てたコンテンツを生成するイランの影響力工作に関連するアカウントを禁止しました。このコンテンツが意味のある聴衆に届いた形跡はありません」。
これは、Facebookが2016年の選挙、2020年の選挙でボットに対処しなければならなかったのと同じことです。そしてこれからはさらに激化するでしょう。なぜなら、突然、膨大な量の合成コンテンツを作成できるようになったからです。以前は、こうしたコンテンツを手動で作成するのに多くの時間がかかりました。偽のコンテンツを大量に生み出すために、建物全体を人で埋め尽くしていました。しかし今はそれが必要ありません。テキスト、画像、さらには動画も合成的に生成し、拡散することができます。そして、実際には帯域幅の制限がほとんどありません。
これは、数日前に私が作成した動画でエリック・シュミットが話していたことですが、国として批判的思考力を向上させる必要があります。そして他の国々や世界全体が、オンラインで目にするものを疑問視し、よりよく見る必要があります。学校で偽の画像、偽のテキスト、偽の動画の検出方法を教えることができれば良いでしょう。さらに良い解決策は、AIを使ってAIを検出することです。それが実現することを願っています。
今週、私たちはStorm-2035と呼ばれるイランの秘密工作のためにコンテンツを生成していたChatGPTアカウントのクラスターを特定し、削除しました。実際に、Microsoftがその発見事項を詳細に記した調査報告書があり、非常に興味深いものです。
こちらがイランの過去の選挙影響工作です。2020年アメリカ、2021年イスラエル、などです。この情報は全てPDFで見つけることができます。リンクを説明欄に載せておきます。
興味深いことに、アメリカの大統領選挙では両陣営の候補者についてコメントを作成したそうです。つまり、お気に入りはなく、単に混乱を引き起こそうとしているのです。
私たちの調査で、この工作がChatGPTを2つの目的で使用していたことが明らかになりました。長文の記事と短いSNSコメントの生成です。最初の作業ストリームでは、アメリカの政治や世界の出来事に関する記事を作成し、進歩派と保守派の両方を装う5つのウェブサイトで公開しました。2つ目の作業ストリームでは、英語とスペイン語で短いコメントを作成し、SNSに投稿しました。この工作に関与したXの12のアカウントとInstagramの1つのアカウントがあります。そして再び、Xのアカウントは進歩派と保守派の両方を装っていました。
この工作は、主にガザ紛争、オリンピックでのイスラエルの存在、アメリカの大統領選挙について、そしてより少ない程度でベネズエラについてコンテンツを生成しました。
こちらがいくつかの例です。こちらが偽の記事、こちらがもう1つ、そしてもう1つです。こちらがいくつかのコメントです。そしてこれらの画像も、DALLEの分類器を通したところ、偽物だとわかったそうです。
ですので、オンラインで読むものは非常に批判的な目で見てください。
次に、Vox.comの記事によると、人々がAIの声に恋をし、中毒になっているそうです。私はしばらくの間このことについて話してきました。Character AIは非常に人気があり、特に10代の若者がCharacter AIとの会話にどれほど中毒になっているかについて、Redditやその他の場所で多くの投稿があります。
ここでは、OpenAIもAIの声とチャットすることで感情的な依存を生む可能性があると警告しています。考えてみてください。誰かが孤独で、簡単にチューリングテストをパスできるAIと会話を始めたら、もちろんそのAIに感情的に結びつくでしょう。
長期的には、これは良いことではないと思います。特に、世界中で出生率が低下していること、孤独の流行があること、これらについて私は他の動画で長々と話してきましたが、そこにAIが加わると、AIとの付き合いを選ぶ人が出てくるのは明らかです。実際の人々と出会うという、より困難な道ではなく。そしてそれは出生率低下の問題をさらに悪化させるだけです。特に、ChatGPTの音声モードが始まると、人々がその感情的なやり取りに依存する可能性がさらに高まります。
OpenAIは、AIがユーザーと自然な会話をする能力により、擬人化（非人間的なものに人間らしい特性を帰属させること）のリスクが高まる可能性があり、それによって人々がAIと社会的関係を形成する可能性があると述べています。つまり、映画「her」のようなシナリオですね。
ここでは、OpenAIだけが高度なAIコンパニオンを作っているわけではないと続けています。Character AIがあり、若者たちは宿題ができないほどそれに夢中になっていると報告しています。また、GoogleはGemini Liveを導入しました。Wall Street Journalのコラムニスト、ジョアンナ・スターンはそれに魅了され、「GoogleのGemini Liveと話すことを実際の人間との会話よりも好むとは言いませんが、そうでないとも言えません」と書いています。
この記事で私が気に入っているのは、先ほど述べた理由以外にも、なぜこれが懸念されるのかについて実際に話していることです。
まず、チャットボットは私たちを理解しているように見せかけますが、実際にはそうではありません。それが重要です。現時点では、彼らは私たちを理解していません。彼らの承認、感情的サポート、愛、それらは全て偽物です。ただのゼロと1が統計的ルールによって並べられただけです。
第二に、自分自身の最も脆弱な側面を、最終的には営利企業によってコントロールされる中毒性のある製品に委ねることについて、正当な懸念があります。中毒性のある製品を作ることに非常に長けている業界からの製品です。これはソーシャルメディアについて話していても同じように当てはまったでしょう。
最後に、人々がAIコンパニオンに中毒になり、実際の人間との関係を築くために外に出ることを犠牲にしてしまうという懸念があります。これが私にとって最も心配なことですが、実際に最も親密な秘密をAIに共有し、それが記録され、営利企業に渡されることも非常に懸念されます。
ですので、判断はしませんが、AIをコンパニオンとして使用する場合は、それが実際の人間の代替にはならないこと、本当にあなたを理解していないこと、そしてあなたが言ったことはおそらく全て記録されているということを知っておいてください。
次に、OpenAIからのニュースです。GPT-4.0のファインチューニングが利用可能になりました。彼らの最先端のフロンティアモデルがファインチューニングを許可するようになったのは素晴らしいことです。
私はこの質問をよく受けます。ファインチューニングを使うべきか、RAGを使うべきか。10回中9回は、あなたのユースケースはおそらくRAGを必要としており、ファインチューニングではありません。レスポンスのトーン、得られるレスポンスのタイプに影響を与えたい、それらのレスポンスにガードレールを設けたい場合は、ファインチューニングを使用してください。しかし、それ以外の場合、特に大規模言語モデルに追加の知識を与える場合、ファインチューニングは正しい選択ではありません。それはすべてRAG（検索拡張生成）に関するものです。この話題については複数の動画を作成しましたので、私のチャンネルでチェックしてください。
GPT-4.0のファインチューニングは、今日から有料プランの全ての開発者が利用できます。始めるには、ファインチューニングダッシュボードにアクセスしてください。GPT-4.0のファインチューニングのトレーニングコストは100万トークンあたり25ドルです。実際のところ、他のファインチューニングと比べてどうなのかわかりません。かなり高価に思えます。推論は、入力トークン100万個あたり3.75ドル、出力トークン100万個あたり15ドルです。
以前お話ししたように、GPT-4.0ミニのファインチューニングもすでに利用可能です。興味深いことに、先週発表されたCoSigJapaneseという新しいモデルについて話しましたが、実際にはGPT-4.0のファインチューンだったことに気づきませんでした。しかし、こちらをご覧ください。ファインチューニングされたGPT-4.0モデルを使用して、Genieは新しいSBench検証ベンチマークで43.8という最先端のスコアを達成しました。明らかに、GPT-4.0をファインチューニングするだけで、非常に素晴らしい結果を得ることができます。
次に、Grok 2 Largeが利用可能になりました。ここで見られるように、すでにGrok 2 Miniがベータ版でしたが、今度はGrok 2 Largeがベータ版になりました。私はすでにテストする動画を録画しました。皆さんと共有できるのが楽しみです。もう1日ほどお待ちください。公開します。
必要なのは有料のXアカウントだけで、Grok 2にアクセスできます。もちろん、Grok 2には、リリース以来作成された素晴らしい画像も全て含まれています。
次に、先ほどAI中毒について話していましたが、Character AIがa16zのGen AIアプリランキングで2位になりました。a16zをご存じない方のために説明すると、アンドリーセン・ホロウィッツは、シリコンバレーで最も有名なベンチャーキャピタリストの1人です。彼らは上位50のGen AI消費者向けウェブ製品をランク付けしました。当然、1位はChatGPTですが、2位がCharacter AI、3位がPerplexityです。
私はPerplexityを始めたばかりで、恥ずかしながら遅れていることを認めます。SearchGPT、Perplexity、Google検索を比較する動画を作りましたが、Perplexityが勝ちました。そして、プロバージョンに課金し始めたところなので、使用するのがとても楽しみです。
ですが、Character AIが2位なのを見てください。だからこそ、彼らは絶対的に急成長しているのです。多くの利用があり、彼らにおめでとうと言いたいです。
次に、Neuralinkの2人目の患者であるアレックスが、リンクを使用してラップトップ上で一人称シューティングゲーム「Counter-Strike 2」をプレイすることに成功しました。
想像してみてください。これは彼の思考だけでプレイされています。他には何もありません。マウスもキーボードもなく、完全に思考だけです。彼はおそらく私より上手でしょう。しかし、これは非常に印象的だと思います。全ての動きがリアルに見え、ガタガタしたり飛び跳ねたりしていません。本当にクールです。そして、これは素晴らしいと思います。誰もがCounter-Strikeをプレイできるべきです。
あと2、3の話題があります。Jamba 1.5がリリースされました。Jambaをご存じない方のために説明すると、これはTransformerアーキテクチャとは異なるMambaアーキテクチャで構築されたモデルです。Transformer以外のアーキテクチャに基づく本当に有能なAIの1つです。
Jamba 1.5 Miniは12Bと52B、Jamba 1.5 Largeは94Bと398Bがあります。これらのモデルのテストを見たい場合は、皆さんご存知のように、コメントを残してください。これらのモデルのテストを見たいと思っていることがわかります。
こちらがそのスコアです。Jamba 1.5 LargeのAReNaスコアは65.4、MMLU Chain-of-Thoughtは81.2、などです。Hugging Faceのページで全てのスコアを見ることができます。Hugging Faceにあるので、オープンソースです。ぜひチェックしてみてください。
最後の話題です。Metaが将来のモデルのための新しいトレーニングデータを取得するために、密かに新しいウェブクローラーを立ち上げました。Meta External Agentと名付けられたこのクローラーは、ウェブ上のスクレイパーやボットを追跡する3つの企業によると、先月立ち上げられたそうです。この自動ボットは基本的に、ウェブサイト上に公開されている全てのデータをコピーまたはスクレイピングします。
Metaは次のように述べています。「他の企業と同様に、私たちはウェブ上で公開されているコンテンツを使用して生成AIモデルをトレーニングしています。最近、出版社がMetaのAI関連クローラーによるドメインのクロールから除外する最良の方法に関するガイダンスを更新しました」。
私はこれが好きです。出版社やコンテンツクリエイターがクロールされるかどうかを選択できるオプションを提供している限り、それが私の求めることです。著作権に関する私の立場に多くの人が同意しないことは知っていますが、選択肢がある限り、それが私の唯一の関心事です。
ですので、あなたが出版社やコンテンツクリエイターである場合、必要なのはrobots.txtを更新することだけです。これはGoogleがあなたのウェブサイトをスクレイピングするのを防いだり、許可したりするのと同じ方法です。OpenAIのクローラーを許可または拒否したり、Metaのクローラーを許可または拒否したりすることができます。
以上がAIニュースでした。この動画を楽しんでいただけたなら、ぜひ「いいね」と購読をお願いします。次回の動画でお会いしましょう。

この記事が気に入ったらサポートをしてみませんか？