【勉強メモ】AI ニュース: ロボットがやってくる!z AI News: The Robots Are Coming!z

AI News: The Robots Are Coming!z(GPTにて要約)

このビデオでは、AIニュースや最新の研究と技術について紹介されており、またYouTubeチャンネルの登録者数が50万人を超えたので、ベータ版のRaybanサングラスの当選者も発表されています。

Detailed Summary for AI News: The Robots Are Coming! by Monica

00:00 OpenAIがGPTストアを開設し、カスタムチャットボットを作成して販売できるようになる予定です。

  • GPTストアでは、最も有用で人気のあるGPTを特集し、収益の一部をビルダーに支払います。

  • ユーザーはGPTを使用する際に直接サポートメールをビルダーに送ることができます。

03:14 ニュース会社はビジネスモデルを見直す必要があり、コンテンツ作成者やジャーナリストのために将来に耐えうるモデルを見つける必要がある。

  • ニュースサイトのペイウォールや広告がユーザーエクスペリエンスに悪影響を与えている。

  • マイクロソフトはキーボードにAIを組み込むことに注力している。

  • GoogleもAIに取り組んでいるようだ。

06:30 このセクションでは、IntelがAIに特化した新しい会社articulate AIを設立したことや、脳波を読み取るAIのデモンストレーションについて紹介されています。

  • IntelがAIに特化した新会社articulate AIを設立したことが紹介されている。

  • 脳波を読み取るAIのデモンストレーションが行われており、EEGキャップを着用して思考を静かに行っている様子が示されている。

09:48 AIは裁判所の判断においてもまだ人間が必要であるが、AIは裁判官の仕事をサポートすることができる。

  • 裁判所では、被告人の真摯さを判断するために微妙なニュアンスが重要である。

  • 人々はまだ機械よりも人間を信頼している。

  • Google DeepMindは、ロボットのトレーニングを向上させるための新しい研究を発表している。

13:05 ロボットは完全に自律的に動作し、人間の操作なしで様々なタスクを遂行することができる。

  • ロボットはワインを拭く、エレベーターを呼び出す、キャビネットを使う、フライパンをすすぐ、椅子を動かす、人とハイタッチするなど、さまざまなタスクを完全に自律的に遂行する。

  • ロボットの操作は人間によって行われることもあり、訓練の一環である可能性もある。

  • テレオペレーションシステムは、料理、掃除、洗濯などの複雑なタスクを長時間継続して実行することができる。

16:20 1月9日にrabbit. Techが何か興味深いものを発表する予定で、そのデバイスは音声で操作できるポケットアシスタントのようなもののようだ。

  • rabbit. Techは1月9日午前10時(太平洋標準時)に何かを発表する予定。

  • デバイスは音声で操作できるポケットアシスタントのようなものであり、Uberの注文や冷蔵庫の中の食材の確認と注文などが可能。

  • デバイスはまだ詳細が明かされておらず、謎めいた宣伝が行われている。

19:36 CESで未来のテクノロジーやツールを発見し、ビデオにまとめる予定です。

  • CESフロアでクールなテクノロジーの映像を撮影し、ホテルで編集します。

  • 2〜3本のビデオを作成し、視聴者に未来のテックを紹介します。

  • もしCESに来ている方がいたら挨拶してください。


見逃したかもしれない先週のAIニュースです。(毎週木曜日に録画しているので、金曜日のニュースを見逃しているかもしれません。)

私からもっと発見を:
🛠️ 何百ものAIツールを探そう: https://futuretools.io/
週刊ニュースレター: https://www.futuretools.io/newsletter
😊 Discord コミュニティ: https://futuretools.io/discord
Twitter でフォローしてください:

/ mreflow
スレッドでフォロー: https://www.threads.net/@mr.eflow
個人ブログ:https://mattwolfe.com/

今日のビデオからのリソース
OpenAIストアの立ち上げ:

/ 1742988467980890471
OpenAIカスタマーサポート

/ 1742989856547262970
OpenAIパブリッシャーお得情報: https://www.theverge.com/2024/1/4/240...
AI搭載Windowsキー: https://blogs.windows.com/windowsexpe...
Googleの有料バード:https://www.theverge.com/2024/1/4/240...
I2VGen-XL: https://i2vgen-xl.github.io/
インテルのGenAIスピンオフ: https://techcrunch.com/2024/01/03/int...
心を読むAIデウェーブ: https://readwrite.com/dewave-new-mind...
最高裁レポート:https://www.supremecourt.gov/publicin...
グーグルのロボット工学の未来: https://deepmind.google/discover/blog...
モバイルALOHAプラットフォーム: https://mobile-aloha.github.io/
ラビット・テック・ホーム:https://www.rabbit.tech/
サムスンAIフォン・イベント:https://www.cnbc.com/2024/01/03/samsu...
CES 2024 ハイライト: https://techcrunch.com/2024/01/04/ces...

編集:マーク・マグタン&マット・ウルフ
スポンサーシップ/メディアに関するお問い合わせ:https://tally.so/r/nrBVlp

#AINews #AITools #GenerativeArt

タイムスタンプ
0:00 イントロ
0:13 GPTストア
1:53 OpenAIはニュースソースを支払う
4:25 マイクロソフト・コパイロット・キー
5:13 Google Gemini Ultraアップデート
5:52 新しいオープンソースの画像-動画モデル
7:04 インテルの新しいAI会社
7:46新しいAI読心術ツール
8:49 AIに取り組む米裁判所
10:45 ディープマインドの新しいロボット研究
12:43 オープンソースの新しい汎用ロボット
16:29 ウサギの技術?
18:04 サムスンの新AI?
18:26 コンシューマー・エレクトロニック・エキスポ
20:19 メタ・レイバンのメガネが当たる
21:53 最後に思うこと

AI News: The Robots Are Coming!

以下は個人的な勉強メモ

0:13 GPTストア

OpenAIは、クリエイターがGPT Builderを使ってカスタムチャットボットを構築し、承認プロセスを経て収益化できるGPTストアを開始します。最も便利で人気のあるGPTには収益分配が提供されます。

1:53 OpenAIはニュースソースに報酬を支払う

OpenAIはニュース会社と交渉し、AIモデルのために彼らのコンテンツのトレーニングを許可し、100万ドルから500万ドルの間の取引を提供している。これは、アップルが同様のアクセスに対して複数年にわたり少なくとも5000万ドルを提供すると報じられたのとは対照的である。

4:25 マイクロソフトのコパイロット・キー

マイクロソフトは、AI機能に簡単にアクセスできるCopilotキーを将来のキーボードに導入する。

5:13 グーグルGemini Ultraアップデート

Googleは、プレミアムAIサービスとしてGemini Ultra(Bard Advancedと呼ばれる)をリリースする準備を進めている。

Googleは、Bardというテキスト生成ツールのアップグレード版である「Bard Advanced」を開発しており、これはGoogle Oneの有料サブスクリプションを通じて利用可能になる可能性があります。Bard Advancedは、Googleが新しく発表した大規模な言語モデル「Gemini Ultra」によって動作するとされています。これにより、Bardは現行のGemini Proよりもアップグレードされることになります。Bard Advancedは「高度な数学と推論能力を備えた、より能力のある大規模な言語モデル」とされています。

また、開発者Dylan Rousselは、カスタムボットを作成できる「Motoko」というコードの機能を発見しました。ただし、ユーザーがこれらのボットを共有できるか、またはこの機能にアクセスするために支払いが必要かどうかは不明です。去年、OpenAIはGPT Plusサブスクリプションを持つユーザーにカスタムボットの作成と共有を許可することを発表しました。

さらに、GoogleはAIを使用してBardに提供するプロンプトを拡張し改善する「パワーアップ」機能を導入するかもしれません。Rousselの発見によれば、この「ギャラリー」セクションがあり、Bardを使用してできることを探索できるかもしれません。スクリーンショットによって明らかになった他の小さな変更点には、「タスク」タブが含まれており、Bardが現在作業中の画像生成などの長時間のジョブを追跡するために使用できるかもしれません。また、共有されたBardのプロンプトにカスタムの背景を追加する方法も提供されるかもしれません。

ただし、これらの機能が公式にいつ発表されるか(またはされるか)はまだ分かっておらず、GoogleはThe Vergeのコメントリクエストに直ちには応答していません。 Googleは過去数か月でBardに多くのアップグレードを行っており、リアルタイムでクエリに応答し、YouTubeビデオに関する質問にも答えることができるようになっています。これにより、ChatGPTやMicrosoft Copilotなどの競合製品と競争しようとしています。

5:52 新しいオープンソースの画像-動画モデル

アリババグループは、より高解像度でより長い動画を生成できるオープンソースの画像-動画生成モデル「i2v Gen XL」をリリースした。

この報告書は、高品質な画像からビデオを生成するための新しいアプローチである「I2VGen-XL」を提案しています。このアプローチは、拡散モデルの急速な発展により、ビデオ合成が大幅に進歩しているが、依然として意味の正確さ、明瞭さ、時空間の連続性の課題に直面しているという問題に対処します。これらの課題は、テキストとビデオが適切に整列したデータの不足と、ビデオの複雑な構造から主に生じ、モデルが同時に意味と品質の優れた出力を確保することが難しいとされています。

具体的には、I2VGen-XLは、2つのステージから成り立っています。第一段階では、階層的なエンコーダーを使用して入力画像から意味を一貫させ、内容を保持します。第二段階では、追加の簡潔なテキストを組み込み、ビデオの詳細を向上させ、解像度を1280x720に向上させます。多様性を向上させるために、約3,500万のテキストとビデオのペアと60億のテキストと画像のペアを収集し、モデルを最適化しています。

このアプローチにより、I2VGen-XLは生成されたビデオの意味の正確さ、詳細の連続性、明瞭さを同時に向上させることができます。多くの実験を通じて、I2VGen-XLの基本原則を調査し、現在のトップメソッドと比較し、多様なデータにおける効果を示しました。ソースコードとモデルは公開されています。



7:04 インテルのAI新会社

インテルは、クラウド・コンピューティング・サービスとAIモデルのトレーニングと実行のためのGPUに特化したArticulate AIという新しいAI会社をスピンオフさせた。

7:46 新しいAI読心術ツール

D-waveと呼ばれる新しいAIは、脳波キャップを使って心を読むことができ、麻痺患者のコミュニケーションを支援する可能性を示している。

8:49 AIに取り組む米裁判所

米連邦最高裁判所の年末報告書はAIに大きな焦点を当てており、その利点、潜在的な雇用離職の懸念、法的手続きにおける人間の判断の必要性について論じている。

10:45 ディープマインドの新しいロボット研究

ロボットのトレーニングのためのAuto RT、モデルの効率化のためのSarah RT、ロボットがタスクを汎化するためのRT trajectoryなど、DeepMindが新しいロボティクス研究を紹介します。

12:43 オープンソースの新しい汎用ロボット

自律的に、あるいは遠隔操作によって様々なタスクを実行できる汎用ロボット「Mobile Aloha」は、完全にオープンソース化されており、チュートリアルを参照しながら自作することができる。

16:29 ラビット・テック?

ラビット・テックが発表した、サービスや食料品の注文などの作業を行うパーソナル・アシスタントとして機能する新しいデバイスのティーザー映像。

18:04 サムスンの新AI?

1月17日に予定されているサムスンの発表では、AIを搭載した新しいモバイル体験が示唆されている。

18:26 コンシューマー・エレクトロニック・エキスポ

ラスベガスで毎年開催されるCESでは、様々な技術や産業にわたるAIの統合に焦点が当てられる。


この記事が気に入ったらサポートをしてみませんか?