この動画では、GoogleとMicrosoftのAIバトルの中で、OpenAIが高機能なDALL·E3を発表し、これがChatGPTと統合されることが紹介されています。OpenAIは外部専門家との協力ネットワークを立ち上げ、一方で著作権問題で訴えられています。MicrosoftはWindows 11と新しいSurfaceデバイスにAI機能を追加する予定です。GoogleはBardの新機能やYouTubeのAI関連アップデートを導入しました。AmazonのAlexaやFire TVはAI機能が向上しました。Intelは新しいAIチップとソフトウェアの開発を進めています。TikTokはAIコンテンツにラベル付け、LimeWireはAI関連の買収を行いました。その他にも、多くの企業がAI技術の進化と応用に注力しています。
公開日:2023年9月24日
※動画を再生してから読むのがオススメです。
この週、GoogleとMicrosoftのAIの支配を巡る戦いが本当に、本当に激しくなりました。
実は、ニューヨークから帰ってきたばかりで、Microsoftのイベントに参加していました。なので、このニュースのビデオを作成するのが1日遅れています。
でも、本当にこの1週間はGoogle、YouTube、Microsoft、OpenAI、Amazon、Intelからの発表が溢れていました。
要するに、この週はみんながAIについて話していた週でした。
では、この週に発表されたおそらく最も大きなニュースから始めましょう。
OpenAIはDALL·E3を発表し、例の画像からもわかるように、DALL·E3は実際のテキストなど、DALL·E2よりもかなり、かなり進化しています。
中が空っぽに感じるし、以前のDALL·Eと比べて画像のコントラストがはるかに高いです。
これは、同じプロンプトを使用して、DALL·E2とDALL·E3を横に並べて比較したものです:バスケットボールのプレイヤーがネビュラの爆発として描かれている表現豊かな油絵。
左側がDALL·E2の結果です。
右側がDALL·E3の結果です。
かなりの向上ですね。
デモビデオでは、もっと会話的な言語でそれを使用する人を実際に紹介しています。
私の5歳の子供は、超絶すごいひまわりのハリネズミのことをずっと話しています。
それはどんな見た目をしていますか?
それから、ハリネズミの画像をいくつか生成します。
私の娘は、その名前がLarryだと言います。
もっと見せてもらえますか?
同じハリネズミの画像をもっと生成します。
Larryの家を見せてもらえますか?
それはLarryがいる家の画像を生成します。
Larryはとても可愛い。
彼はなぜそんなに特別なのですか?
理由はこちらです。
実際にはLarryに関する物語を少し話しています。
なので、画像を生成するだけでなく、物語や環境、ステッカーデザインも作成しています。
DALL·E3を見ると、目的は望む画像のプロンプトをタイプするだけでなく、ChatGPTと実際に会話をして探している画像を得ることのようです。
そして、ChatGPTについて話すと、実際にそれを直接ChatGPTに組み込んでいます。
別々のDALL·E3のサイトを使用することはありません。
ChatGPTにアクセスして画像を生成させるだけです。
他にもいくつかの画像の例を示してくれました。
こちらの画像のいずれかをクリックすると、その画像を得るためにDALL·E3で使用されたプロンプトを確認できます。
テキストも見ることができます:あなたの中に宇宙を見つけて。
テキストに関してはかなりうまくやっているようです。
そして、TwitterのNick St Pierreからのこのツイートを見つけました。彼はここで示されたこれらの画像のいくつかを取ってきて、Midjourneyで正確に同じプロンプトを実行して、どのように比較されるかを見ました。
そして、彼が得た結果がこれです。
同じハートの画像です。
上部がDALL·E3のバージョン、下部がMidjourneyのバージョンです。
明らかに、MidjourneyはDALL·E3のようにテキストを生成することはできません。
これは、DALL·E3が生成した崖の上の家の画像です。
これがMidjourneyのバージョンです。
この一つの上部はDALL·E、下部はMidjourneyです。
これらの多くを見ていると、場面によってはDALL·Eの方が良い画像に見えることがありますし、他の場面ではMidjourneyの方が良い画像に見えることがあります。
しかし、彼らの間の差は確実に縮まってきており、ChatGPT内部で直接行えるようになったことは、以前のようにDiscordを使用するのと比べて、非常に必要なユーザー体験の向上だと思います。
こちらも上部がDOI、下部がMidjourneyのものです。
どう思いますか?
DALL·EがChatGPT内部で使用できるようになると、すでにChatGPTを使用している人々にとって追加のコストがかからないという点で、Midjourneyに競争を挑むと思いますか?
また、Bingの中にも入っているようですが、それについては後ほどお話しします。
OpenAIのプレスリリースによれば、DALL·E3は10月初旬にChatGPT plusとEnterpriseのお客様に利用可能になる予定です。
また、商業利用も可能になります。
DALL·E2と同様に、DALL·E3で作成した画像は自分のものとして使用でき、再印刷や販売、商品化するための当社の許可は必要ありません。
次に、今日のスポンサー、BetterHelpについてお話ししたいと思います。
BetterHelpはAIとどのような関係があるのでしょうか?
正直なところ、それほど多くはありませんが、AIの進歩の速さによって、しばしば圧倒されたり忙しく感じたりすることがあります。多くの人々がAIの進化が自分たちの生活や仕事にどのような影響を与えるのか、本当の恐怖心を抱いています。
そのような状況をうまく乗り越えるためには、誰かと話すことが有効ですので、このエピソードにBetterHelpとの提携を決意しました。
BetterHelpは、セラピーをより手頃な価格で誰にでも利用しやすくすることに焦点を当てています。セラピストを見つけるための出発点を見つけること自体が難しいことを知っています。
BetterHelpは、専門のセラピストとあなたを繋ぐオンラインプラットフォームを提供しています。
数問の質問に答えるだけで、数日以内に適切なセラピストに紹介されます。
私は起業家としてキャリアの中で上下や多くの困難を経験してきたので、ビジネスを運営する際に生じる恐怖やストレスを和らげるために、しばしばセラピーに頼りました。
サインアップは非常に簡単で、私のリンクの説明欄にあるbetterhelp.com/slmwolfを使用すると、初回1ヶ月間が10%オフになります。
私自身がセラピストの相性が重要な要素であることを知っています。もしマッチングした相手と合わない場合は、簡単に別のセラピストに切り替えることができ、完全に無料です。
ガイダンスが必要な場合は、BetterHelp.comのオンラインセラピーを検討してみてください。
説明欄のリンクをクリックするか、betterhelp.com/slmwolfを訪問してください。
このビデオのスポンサーとしてBetterHelpに再度感謝します。
今週のOpenAIのニュースとして、theinformation.comがOpenAIがGoogleより先にマルチモーダルLLMをローンチするための取り組みについての記事を公開しました。
個人的にはThe Informationの購読者ではありません。
ですので、他のウェブサイトが報じている内容を報じるウェブサイトからニュースを取得しています。
そして、実際にはOpenAIが現在GPT-5に取り組んでいるわけではないと言われています。
彼らはGPT-4のさらなる改善に取り組んでおり、現在GPT Visionと呼ばれるChatGPTのマルチモーダル機能を追加しています。
GPT-4がリリースされた際のデモのように、ChatGPTが画像を解釈し、文脈を理解し、テキストと視覚入力の両方を取り入れたテキストやレスポンスを生成できるようにすることを目指しています。
これは、Googleが近々Geminiをリリースし、それがGPT-4を圧倒すると発表した1週間後のことです。
今、OpenAI、Microsoft、Googleの間の戦いが実際に始まっています。
AIのオタクの視点から見ると、本当に楽しくてワクワクするものでした。最終的には、私たちが使うためによりクールで改良されたツールが増えるということを意味します。
今週、OpenAIはOpenAI Red Teaming Networkを開始すると発表しました。
彼らは基本的に、認知科学、化学、生物学、物理学、アライメント、教育、医療、金融、バイオメトリクス、プライバシー、サイバーセキュリティ、誤情報など、さまざまな分野の外部の専門家を見つけようとしています。
これらのさまざまな分野の専門家たちが一緒になって、これらの問題の解決方法を模索するためのチームを形成することを望んでいます。
そして、これは外部の資源となるでしょう。
OpenAIの内部で働くチームメンバーではありません。
これは彼らが作成しようとしている第三者の組織です。
専門家であり、このRed Teamに参加を希望する場合は、redteam@openai.comまで連絡してください。
2023年12月1日まで応募が可能のようです。
そして、OpenAIの話題になっているので、さらに多くの著者がOpenAIを訴えています。
ほぼ毎週の週末のAIニュース動画でこれについて話しているので、繰り返しのような気がしますが、さらに多くの人々、多くの企業がOpenAIを訴えています。
今週は、「ゲーム・オブ・スローンズ」の生みの親であるGeorge R.R. Martin、John Grisham、Jonathan Franzen、Jod Piltがいます。
また、OpenAIが彼らの作品の全内容をスクレイピングし、人々がOpenAIを使用して彼らの本を購入・読む代わりに使用できるという別の訴訟です。
私は専門家ではないので、私の言うことをあまり真剣に受け取らないでくださいが、実際には、著者たちがこれらを勝訴する可能性は低いと思います。なぜなら、AIの動作方法やこれらのAIが訓練される方法は、人が訓練される方法と基本的に同じだからです。
例えば、ある人が作家になるために育ち、人生の中でGeorge R.R. MartinやJohn Grishamの本を読み、Michael CrichtonやStephen Kingなどの著者の本を読んで、自分の本を書くようになり、その本がこれまで読んできた作品に大きく影響されている場合、それはAIが動作する方法と基本的に同じです。
そして、AIがこれらの本をすべて消費するというこれらの苦情について...
そして私たちがそれらの本に関する質問をすると、それは私たちに答えを与えることができます。
それで、私たちはそれらの本を読む必要はありません。
それはもうYouTubeで起こっているのではないですか?
誰かが本を読んで、それを読まなくてもいいように一般的な簡単な要約を提供する本のレビューは既にあるのではないですか?
その要約を作成した人は、AIがしたのと同じことをしました。
彼らは本を摂取し、あなたが理解しやすい方法でそれを要約する方法を見つけ出しました。
あなたと私が会話をしている場合も同じことです。
もし私が本を全部読んで、ああ、多分それを読むことはないでしょう、それは何についてですか?と言ったら?
私はそれを摂取し、理解したことに基づいてそれを再生することができます。
AIはまさにそのようなことをしています。
もしAIが本を消化し、それに関する質問に基づいて本の理解を教えてくれることができるとすると、AIは著者に何らかの報酬を支払わなければならないでしょう。なぜなら、AIが本についての情報を提供できたからです。
それは、私が本を読んで、私が本を摂取してそれを、それは非常にグレーなエリアの主題に変えるならば、著者に何らかの形のロイヤルティを支払わなければならないことを意味するのでしょうか。
しかし、私がそれについて考えるロジックに基づいて、これらの著者の多くがこれらの訴訟を勝訴するのは難しいと思います。
しかし、再び、弁護士ではありません、私の言うことを少し軽く受け取ってください、私はここでただのランダムに愚痴っているだけです。
さて、Microsoftについて話しましょう。
この動画の最初に述べたように、私はニューヨークから飛んできました。実際には、彼らがこれらの発表をしていたこのイベントにいました。
実際には、非常に前の列に座っていました、そして、この頭は私です。
これは私だと分かっているのは、これが私のカメラに取り付けられていたマイクだからです、そして、私は前列に座っていました。
これはneuron newsletterのPete Hang、そしてこれはThe Rundown newsletterのRowan Chunです。
そして、下にはI Justineもいました、別のテクノロジーYouTuberです。
だから、前列全体は、AI分野のさまざまなクリエイターたちでした。
Microsoftが私たちのようなクリエイターを、YouTube動画やAIニュースレターを作成している、このようなイベントの前列に座らせるために飛ばしてくれたのは本当にクールでした。
このイベントに飛んで行って、たくさんの映像を撮影したので、実際にはこのイベントに関するビデオを作成する予定です。
それは、ニューヨークに行って、これらの他のクリエイターとの会合や、このイベントの前列に座る経験を通して、私があなたに私の経験を紹介するような楽しいブログスタイルになります。
そして、実際に、舞台に上がっていたこれらの人々と1対1のセッションで話をし、彼らがやっていることについての質問をし、もっと学びます。
それはこの特定の動画には多すぎるので、このイベントで発表されたニュースの概要を簡単にお伝えします。
彼らは本当に、Windows 11がAIをすべてに組み込むことを発表することから始めました。
あなたは、あなたの写真アプリを使って背景を削除するだけでよいです。
Microsoft Word、Microsoft Excel、PowerPointなどのMicrosoftのツールスイートのすべての文書をクエリする小さなチャットウィンドウと会話することができます。
AIを使用して、それらに直接クエリを投げることができます。
また、Outlookをすべての人に無料で提供する予定です。
Windowsアカウントを持っている場合、Outlookの無料アカウントを取得することができます。そして、Outlookには、過去のメールのように聞こえるメールを書く能力を含む、たくさんのAI機能が組み込まれています。
つまり、あなたのメール、あなたの声のトーン、通常どのように書くかを学び、あなたのスタイルでメールを書くことができます。
それで、手短に概要をお伝えしますが、WindowsにCopilotを導入する予定で、それは現在Edgeで見ることができるサイドバーチャットのようなものです。
Paintに新しいAIの機能を追加する予定で、また、写真にも新しいAIの機能を追加します。
画像からテキストを抽出し、そのテキストを他のアプリケーションに直接コピー&ペーストすることができるようになります。
Clipchampはアップデートされる予定で、シーンの提案、編集、ナラティブなどの他に、ビデオ編集をサポートするための多くのAIの機能が追加されます。
ノートパッドやOutlookのアップデート、さっき話したような近代化されたファイルエクスプローラーなど、9月26日からWindows 11に追加される機能がたくさんあります。
BingやEdgeも多くの新機能が追加される予定です。
BingとEdgeのアップデートに関するほとんどの発表を行ったDivaさんに、一対一で質問をする機会を得ました。今後の展開やSEOの行方などについて、彼女にさらに質問しました。
とても興味深いディスカッションができました。
その内容は、近日公開予定のビデオで多く共有します。
BingとEdgeのチャット内では、より個別に対応した回答が得られます。実際には、以前の会話やコンピュータ上で行っている以前の作業の履歴を多く覚えて、会話の追加の文脈として使用します。
MicrosoftショッピングにもCopilotが導入される予定です。
このビデオの初めで既に触れたDALL·E3が、Bingチャット内で直接利用でき、またBingチャット内では無料で利用できることが発表されました。
追加の費用はかかりません。
あなたはDALL·E3を使用してBingの代わりに画像を作成することができます。
彼らは、365 Copilotをほぼすべてに導入しています。
これは、Googleがデュエットで行っているのと似ています。Microsoft Word、Microsoft Excel、Microsoft PowerPointなどのツール内で直接大規模な言語モデルのチャットボットを使用することができます。
また、このイベントで新しいSurfaceデバイスも発表されました。これは、以前のモデルよりもはるかにパワフルで、NVIDIA 4050とNVIDIA 4060のグラフィックカードを使用しています。
イベントのある時点で、M2 Macとこれらの新しいSurface Proの両方でblenderからの3Dファイルをレンダリングしていましたが、SurfaceはM2 Macの半分の時間でレンダリングを完了しました。
これらのSurfaceの一つにLLaMA 2を入れ、新しいNVIDIAのグラフィックカードを使用して大規模な言語モデルをローカルで実行できました。
彼らはAdobeのツールを使って、クールな生成フィル技術を披露しました。画面上でスタイリストペンを使って、編集したい部分をサークルで囲み、生成フィルを使ってその部分を変更することができました。
このようなタッチスクリーンタブレットでペンツールを使ってジェネラティブフィルの編集をする能力は、非常に価値のあるものとなりそうです。
しかし、私がこのイベントで撮影したビデオブログの要素を含む、このMicrosoftイベントのより詳しい解説を再度お待ちください。
それは、もうすぐ公開される予定です。
最後に、Microsoft関連のニュースをまとめると、Microsoftが所有するGitHubは、Copilotチャットのベータ版がすべての個人向けに利用可能であると発表しました。
GitHub Copilotは、コードの作成やデバッグ、問題の修正をサポートする大規模な言語モデルのチャットボットです。
なぜこのコードが動かないのか、という質問をコードと共にチャットすることができます。
それはコードを分析するのを助けてくれます。
何か特定のことについてスクリプトを書いてくれるように頼むことができ、それはそのスクリプトを書く試みをすることができます。
GitHub Copilotとの間でコードを調整するための対話を持つことができます。
このアニメーションで見ることができますが、彼らは「Chromeの拡張機能はどのように作成しますか?」と尋ねています。
ファイルの構造はどのようにすべきですか?
そして、それはChromeの拡張機能のためのファイル構造を作成します。
フォーラムでは、自然言語で質問するだけで良かったのです。
もしGitHub Copilotを試したいのであれば、月10ドルまたは年100ドルです。
ただし、無料トライアルがあり、実際に10ドル/月を支払う前に約30日間使用することができます。
もちろん、MicrosoftとOpenAIがスポットライトになる週を過ごすことなく、Googleが飛び込んできて本当にクールなものをいくつか見せてくれます。
この週、GoogleはBardに新しい機能をたくさん追加しました。それは、YouTube、Googleマップ、Googleホテル、Googleの便、Googleドライブ、Gmail、Googleドキュメントなどとチャットで会話できる拡張機能です。
また、Bardが応答を与えた後、Bardが使用した情報の情報源を見つけるためにGoogleをダブルチェックできる機能も追加しました。
これは私がすでにビデオを作成したものの1つなので、Google Bardについてもう少し詳しく調査しました。
ビデオはこのように見えますが、右上に小さな拡張ボタンがあるのがすぐにわかります。
これをクリックすると、Google Flights、ホテル、マップ、ワークスペース、YouTubeに接続されます。なぜなら、私のGoogleワークスペースに接続されているからです。
Gmail、Drive、ドキュメントなどにアクセスできます。
したがって、「私の子供の学校からの最新の更新は何ですか?」のようなプロンプトを入力できます。
そして、私のメール。
実際に、私の子供の学校で何が起こっているかに関連するアナウンスメントを検索するために私のメールを検索します。
そしてもちろん、これらのいずれかをクリックすると、そのメールに直接アクセスします。
Bardのマルチモーダル機能は、ここ数週間でかなり改善されました。
私はこのチーズバーガーの写真をアップロードして、同じように見えるチーズバーガーを作るための材料とレシピを実際に入手することができました。
もう一度、Bardの最新の更新に関していくつかの概要がありますが、私は強くお勧めします。
しかし、今週Googleから得たものはそれだけではありません。
Microsoftのイベントに参加していた同じ日に、YouTubeは彼らが展開している新しいAI機能のたくさんの発表のためにイベントを開催しました。
彼らは、ショート用のAI生成画像またはビデオ背景の夢の画面のようなものを発表しました。
実際には、ここでパンダがコーヒーを飲む例を見ることができます。
そして、それはパンダがコーヒーを飲むGen 2 Pikaラボスタイルの背景を作成します。
私はYouTubeショートでこのようなものを使用することを非常に楽しみにしています。
これは、YouTubeがcap cutに対抗するようなものですね。
彼らはまた、クリエイターが次のビデオを何にするかを決めるのを助けるためのAIのインサイトツールを発表しましたが、私にとってはvid IQのようなツールと真っ向から競合しているように思えます。
このスクリーンショットから見ることができますが、彼らは「アウトラインの提案を生成」というボタンを持っていて、実際にビデオのアウトラインを助けています。
だから、YouTubeスタジオがクリエイターのアイディアを助けるために発生的AIを使用することが来年になると言っています。
インサイトは、各チャンネルに合わせてパーソナライズされ、YouTubeで既に視聴されている内容に基づいています。
私たちは、YouTubeスタジオのAI駆動ツールのバージョンをクリエイターとテストしており、調査に回答した70%以上が、それが彼らにビデオのアイディアを発展させ、テストするのを助けたと言っています。
あなたのビデオのための音楽を探すための補助的な検索がある予定であり、また、allowという会社との自動吹き替えを追加しています。これは、私がYouTubeのビデオを英語で一通り話すことができる機能になります。
それは、声の専門家やそういったものを雇うことなく、私がそれを吹き替えたい言語でそのビデオ全体を再生し、吹き替えるでしょう。
YouTubeはその吹き替えを組み込む予定で、私たちYouTubeのクリエイターがはるかに広い視聴者の前に飼われる可能性があります。
だから、私はAIの領域にもいるYouTubeのクリエイターとしてとても興奮しています。
YouTubeの今週の発表は、私にとっては大きかったです。
そしてもちろん、Amazonは、彼らのAlexa製品で私たちの多くにAIを紹介した会社の一つで、彼らはより良いAIでAlexaを向上させています。
だから、Microsoftは今週プレスイベントを持っていました、YouTubeは今週プレスイベントを持っていました、Amazonは今週プレスイベントを持っていました、そしてIntelも今週プレスイベントを持っていました、次にそれについて話すでしょう。
しかし、Amazonのプレスイベントで、Amazonは新しいAlexa体験がもっと会話的な体験になることを発表しました。
何らかの方法で、体の言語だけでなく、人のアイコンタクトやジェスチャーを考慮に入れた経験。
また、Alexaにもっと大きく、もっと意見が強い性格を与える予定です。
だから、多分Alexaに性格を持たせたくない多くの人々がいるでしょうが、私たちは見るでしょう。
彼らは実際にAlexaデバイスをデモし、あなたのお気に入りのスポーツチームは何ですかと尋ねました。
そして、AlexaはSeahawksの統計や試合の時間についてのフォローアップの質問で応答しました。
新しい発生的AIモデルはまた、肯定、興奮、笑い、驚きのようなものを表現するためのトーンと応答を調整することができるでしょう。
Amazonはまた、彼らがFire TVに発生的AIを持ってくると発表しました。
彼らは、Fire TVのユーザーが新しい発生的AIの経験のおかげで、テレビ番組や映画に関してもっと繊細で開かれた質問をAlexaに尋ねることができるようになると言っています。これにより、彼らはもっと自然で会話的な方法で話すことができます。
ユーザーは、特定の俳優、監督、シーン、ジャンル、または権利に基づいてコンテンツを探すようAlexaに依頼することもできます。例えば、カーチェイスのあるアクション映画、雨の日の家でのコメディ、無料のアニメーション映画などです。
私の意見ですが、前にも述べたように、この週にはIntelもイベントを開催しました。
このカンファレンスで、Intelはインターネットから切断された状態で、Taylor Swift風の曲を生成したり、会話風に質問に答えたりすることができるノートPCを披露しました。
彼らはまた、来年発売予定の新しいチップ「The Arrow Lake」も開発中です。
それはCPUチップであり、NVIDIAが作っているGPUチップではありませんが、彼らは基本的にNVIDIAに対抗してそれを構築しています。
Intelは、stability AIが使用する新しいスーパーコンピュータを構築しているとも発表しました。
彼らはまた、ChatGPTと同様の大規模な言語モデルを実行するソフトウェア「open Veno」も開発中です。
基本的に彼らが取り組んでいるさまざまなチップについて話しましたが、これらのチップはAIタスクの実行においてどんどん優れていくことが期待されます。
今週、TikTokは、クリエーターがAIで生成されたコンテンツにラベルを付けることができるようになったと発表しました。
そして、それは完全に任意ではないと彼らは言っています。
リアルな画像、オーディオ、またはビデオを含むAIで生成されたコンテンツは、視聴者が状況を文脈化し、誤解を招くコンテンツの拡散を防ぐために、そのようにラベル付けする必要があります。
だから、それがAIかどうかを基本的に指示するように聞こえますが、それは任意ではありません。
それを行う必要が実際にあります。
しかし、TikTokもまた、人工知能を自動的に検出する独自のソフトウェアを開発中です。
今週、SpeechlyがRobloxに参加することも発表されました。
先週、私たちはRobloxが取り組んでいる生成的なゲーム開発ツールについて話し合いました。
Speechlyは音声生成ツールで、生成的AIを使用してゲームに直接リアルな人間のような、またはロボットやエイリアンのような音声を追加するのに役立ちます。
また、今週、注目すべき発表がありました。LimeWireという、以前はインターネットから音楽を盗むためにみんなが使用していたツールが、クリエーター向けのスタジオとしてリローンチした後、現在はAI企業になっています。
そして、彼らは最近、Midjourneyと非常に似た方法で動作するBlue Willowを買収しました。この中心には安定した拡散が使用されています。
過去にBlue Willowについてのいくつかのビデオを作成しましたので、Blue Willowに詳しくない場合はそれらを確認してください。
LimeWireがまだ会社であり、AIの分野に進出し、Blue Willowのような会社を買収する手段を持っているということが私には驚きでした。
それは私にとって非常に興味深いことでした。
また、今週、Leia Inc.がLeiaコンバーターの新しいアップデートを発表しました。
AIを使って映画や3Dのものを生成する方法についての私の過去のビデオを見たことがあれば、過去にLeiaコンバーターについて話すのを確実に見ていただけるでしょう。
新しいLeia pixコンバーターは、更新されたユーザーインターフェースを持ち、静止画像をアップロードして深みを追加し、それをもっと3Dでアニメーションのように見せるツールです。
例えば、The WitcherのGeraltを描写するためのこの画像を取り上げてここに投げ入れれば、背後にあるような深みを持つ3Dアニメーションに変わるのを見ることができます。
しかし、ここには様々なスタイルがあります。
横に揺れるようなものや、大きな円、普通の円、長い円、縦、そして視点の変化など、様々なものができます。
アニメーションの長さを非常に短くすることで、それを非常に速く見せることも、非常に長くすることで、それをもっと繊細でゆっくりとしたものに見せることもできます。
アニメーションの量を変更することができます、少なく、またはもっと。
これらのエッジの周りに少し歪みが生じることがありますが、それでもかなりクールな効果です。
焦点を近くにしたり、遠くにしたりして、中心点がどこで変わるかを変更することができます。
もっと多くまたは少なくエッジの歪みを追加することができ、その効果の見た目にかなり大きな影響を与えます。
しかし、あなたが求めているスタイルに応じて、そのようなものはあなたが撮影しているものに非常にクールに見えるかもしれません。
そして、ここにはアドバンスエディターがあり、あなたが望むように3Dアニメーション画像を見せるために様々な軸や振幅や位相などの様々なものを調整することができます。
lupixからのいくつかの新しい機能アップデート。
彼らももっとプレミアムなプランを追加し始めましたが、実際に支払いをしてそれを使用する前に、それを試すためのクレジットを人々に提供しているように見えます。
そして、最近ではAIと医療の世界で何が起こっているかを取り上げることが多くなっています。過去にも述べたように、ここで最も世界を変える進歩がAIから生まれると思っています。
今週、Mark Zuckerbergと彼の妻Priscilla Chanが医学研究専用の高価な新しいAI GPUクラスタを構築していることが発表されました。
それで、新しい計算システムは、研究者が時間をかけて健康な細胞と病気の細胞をモデル化するための生成的AIへのアクセスを提供することを意図しています。これにより、病気を治療する新しい方法を開発するのに役立ちます。
これは1,000台以上のGPUで構成される予定で、NVIDIA H100 GPUのトップラインとなるものです。
これが完成すれば、新しい計算システムは非営利の研究のために使用される最大のAIクラスタの1つとなると予想されます。
そして、GoogleのDeepMindに移ると、DeepMindはAIを使用して遺伝的疾患の原因を特定しています。
今、DeepMindが取り組んでいる新しいAIシステムはAlpha missenseと呼ばれ、多くのDNAの変異を調査して、どのDNAの変異が人間に疾患を引き起こす可能性が最も高いかを判断しようとしています。
まだ完全ではありませんが、希少な遺伝性疾患の診断を速めるのに役立ちます。
これは、タンパク質の折り畳みAIであったDeepMindの前のAIモデル、AlphaFoldから適応されました。
しかし、このツールは7100万のDNA変異に基づいて予測を行う能力があり、適切な診断を迅速かつ容易に取得するのを容易にします。
そして、これはまだこの種の技術の非常に初期の状態です。
これからさらに良くなるだけです。
だから、AIの世界でかなりエキサイティングで、非常に大きな週です。
私は今週、ニューヨークのMicrosoftイベントで、私と同じくらい興奮して、このAIの話題に同じくらい情熱を持つ他のAIクリエイターたちと話をするのにとても興奮していました。
私がしてきたこれらの旅行から作成したコンテンツの一部を使って新しい動画を作成するのを楽しみにしています。
そのスタッフをチェックしてください。
AIのペースは、再びエキサイティングになっているように感じます。
興奮が再び高まり始めているようです。
人々は、これらのツールが何をすることができるか、どのように彼らの生活を楽にするか、どのように健康問題を解決するか、どのように教育問題を解決するか、どのようにあなたの日常のワークフローからステップを取り除くかにますます興味を持っています。
今、私が非常に興奮していることがたくさん起こっていますし、一般の人々の間でのハイプが再び加速することを望んでいます。なぜなら、私たちが見ているものの一部は、多くの人々の生活を大いに改善するだろうからです。
だから、もっと多くの人々が注意を払うべきだと思います。
私はそれのためにここにいます。
私はニュースを伝え続け、チュートリアルを作成し、楽しいビデオを作成し、チャレンジを行い、AIやテクノロジーを楽しみながらそれを共有し続けるつもりです。
このような動画をもっと見たい、そして最新のニュースでループに入っていたい場合は、この動画を「いいね!」して、このチャンネルを購読してください。
それにより、このタイプの動画がフィードにもっと表示されるようになります。
まだチェックしていない場合は、私が毎日キュレーションする最新のAIニュースや、私が毎日出会う最もクールなAIツールをキュレーションし、私が作成しているこれらのさまざまなビデオをすべて追いかけることができる1つの場所を提供するFuture Toolsをチェックしてください。
Future Toolsで全て見ることができます。
無料のニュースレターにも参加してください。
そして、視聴していただきありがとうございます。そして、このビデオのスポンサーであるBetterHelpにも再度感謝します。
私は非常に感謝しています。なぜなら、あなたが私にこのようなビデオをもっと作成することを可能にしてくれるからです。そして、AIができるすべてのクールなものについての人々の意識を高めるのを助けるために。
だから、改めてありがとう、そしてこれらのビデオを見てくれてありがとうと言いたい。
本当に、本当にあなたに感謝しています。
次回を楽しみにしています。さようなら。