最近、AIに関するニュースが急増しており、特に注目すべきはAnthropic社のClaudeが新機能を追加したことです。Claudeでは、Projectsと呼ばれる新機能が導入され、ユーザーはファイルをアップロードして常に同じ情報を基に対話できます。Projectsは他のチームメンバーと共有可能で、UIも改善されました。また、設定変更やお気に入りチャットの星付けも簡単にできるようになっています。さらに、GoogleもGemini 1.5 Proという新モデルを発表し、これには200万のコンテキストウィンドウが特徴で、非常に大きなデータセットと対話が可能です。OpenAIからは、CriticGPTと呼ばれる新モデルがトレーニングされ、ChatGPTのコード出力のエラーを検出する機能が備わっています。AI技術はメディアとの関係も変えており、Time誌はOpenAIとの戦略的パートナーシップを結び、過去101年間のアーカイブへのアクセスをOpenAIに提供しました。また、ElevenLabsはテキストをリアルな音声に変換する新しいリーダーアプリを発表し、Character.aiはAIアバターとの電話会話機能を追加しました。その他、AI音楽ツールやビデオ編集ツールの進化も目覚ましく、SynthesiaやCaptionsといった企業から新機能が発表されました。最後に、Googleは新しい言語をGoogle Translateに追加する計画を発表し、これにはAI技術が用いられています。
公開日:2024年6月29日
※動画を再生してから読むのがオススメです。
今週はたくさんのAIニュースがありましたが、あなたの時間を無駄にしたくないので、すぐに始めましょう。
AnthropicのClaudeがさらにクールな機能を展開したという事実から始めます。
今、彼らがプロジェクトと呼ぶものを作成できます。プロジェクトは、ChatGPT上のカスタムGPTに似ています。
コンテキストのためにたくさんのファイルをアップロードでき、そしてそのプロジェクトにログインしてチャットするたびに、毎回同じアップロードされた情報を使用します。
さらに、カスタムな指示を与えることもできます。そのため、この特定のプロジェクトに入力したプロンプトをどのように処理するかを知っています。
彼らは他のチームメンバーとプロジェクトを共有する機能を追加し、またわずかなユーザーインターフェースの更新も行われました。
ここには標準のチャットボックスが表示され、ここでモデルを選択し、ここで小さなプロジェクトのドロップダウンをクリックすることで作成したプロジェクトを使用できます。また、ここで最近のチャットをすべて見ることができます。
画面右上にプロフィールボタンがなくなったことに気づくでしょう。
代わりに、画面の左側にマウスを移動すると、サイドバーが自動的に表示されます。
ここで最近のチャットをすべて見ることができます。
あなたはよく戻ってくるチャットに星を付ける能力を持っています。
ここからプロジェクトにアクセスすることもでき、アカウントの設定を変更する必要がある場合は、プロフィールリンクが今は左下にあります。
ここをクリックして設定にアクセスし、外観を変更したり、機能プレビューに移動したり、新しいアーティファクト機能をオンまたはオフにしたりすることができます。
私たちは先週それについて話しました。
それは、画面の右側に表示されるコードの出力などを示す新しい種類のウィンドウで、あなたがClaudeと一緒に行うようなことを示します。
Claudeをチームメンバーと協力して使用したい場合は、こちらでチームプランにアップグレードすることもできますが、まずはプロジェクトを作成して、その機能を確認してみましょう。
右上にプロジェクトを作成できます。プロジェクトに名前を付けましょう。
私はそれを研究論文と名付け、アップロードされた研究論文に関する質問に分析し、回答し、プロジェクトを作成します。
ここにプロジェクトウィンドウがあり、カスタム指示を設定できます。
プロジェクト内の知識にある研究論文についてできるだけ簡潔に質問に答えるように指示します。すべての回答を「問題ありません、マット」と始めるようにします。
ここに指示を保存しておきます。
私はダウンロードして保存した研究論文がいくつかあります。
これらのうちいくつかを取得して、このように知識ベースに投入しましょう。
さまざまな研究論文のPDFを6つアップロードしており、知識サイズの80%を使用しています。
最大30メガバイトまで利用できます。
ファイルの数ではなく、アップロードする全体の知識ベースのサイズに基づいています。
さあ、私のプロジェクト知識の中にどんな論文があるか尋ねましょう。
問題なく始めましょう、マット。
あなたのプロジェクト知識の中にある論文は、生成エージェント、人間の行動のインタラクティブなシミュラクラ、ゲームベースのプラットフォームなどです。
これらの論文の間にどんな相関関係が見つかるかを言えますか?
問題ありません、マット。
これらの論文の主な相関関係はAIと機械学習です。
すべての論文は高度なAIと機械学習技術、生成モデルに焦点を当てており、論文1、4、5は生成AIモデル、特に拡散モデルに取り組んでおり、論文1と2は対話型AIモデルを強調しています。
私がアップロードしたこれらの5つの文書の関係を見つけました。
面白いのは、Claudeのホームページに戻って、すでに更新した同じ知識を使用したい場合、研究論文をクリックしてプロジェクトを使用するだけで済むことです。
ここで設定されているのは、研究論文プロジェクトであり、私がここで与えるプロンプトは、すでにアップロードした知識と私が与えたカスタム指示を参照します。
私にとって、これは本当に便利に思えます。特に、先週金曜日のビデオで披露したアーティファクト機能と組み合わせた場合です。
この新しいアーティファクト機能の簡単なリマインダーとして、例えばサーフボードについてのセールスページのHTMLを作成するといったことを入力できます。
画面の右側が新しく開いて、実際にすべてのコードを書いていますので、お気づきになるでしょう。
コードが右側で生成される間、左側で会話を続けることができます。
実際にウェブサイトのプレビューができます。
コードとウェブサイトのプレビューを右側で切り替えることができ、実際にClaudeを離れることなく生成されます。
あなたはどうかわかりませんが、私はClaudeのこれらの新機能が本当に、本当に役立つと感じています。
Googleも今週、Gemini 1.5 Proが200万のコンテキストウィンドウを持つことなど、多くの更新と発表を行いました。
入力されたテキストの量とあなたに返されるテキストの合計で150万語が組み合わされています。
ハリーポッターシリーズ全体の単語数は約110万語です。
ゲームオブスローンズシリーズ全体、炎と氷の歌はおおよそ170万語です。
その全シリーズの本をほぼすべてアップロードして、それと会話をすることができます。
このモデルの規模がどれほど大きいかというと、そういうことです。
基本的に、文脈ウィンドウがもはや本当に問題ではないレベルに達しています。
もし今すぐGemini 1.5 Proを使用することにご興味があるのであれば、
Geminiはすでに100万トークンのコンテキストウィンドウを提供してくれています。
おそらく99.9%の人々はそのように大きなコンテキストウィンドウを必要としないでしょう。200万のコンテキストウィンドウは、大きな進歩であり、それが可能であることは狂気だと言えますが、おそらくほとんどの人々には適用されないでしょう。それでも、本当に素晴らしい偉業です。
Gemini 1.5 Proは今、コードの実行も可能です。
GoogleからのGemma 2オープンソースモデルも今週公開されました。
こちらのベンチマークテストに基づくと、新しいGemma 2モデル、9兆パラメータモデルと27兆パラメータモデルの両方が、LLaMA 3やGrokを多くのベンチマークで上回っていることがわかります。
今週、GoogleはGoogle翻訳に110の新しい言語が追加されることも発表しました。
彼らはAIを使用して広東語やCoなどの新しい言語を追加しています。
それの発音の仕方はわかりません。
また、今週、GoogleがGmail内にサイドバーを展開していることを発表したタマジクトもいます。
彼らの例をここで見ることができます。
Gmailウィンドウは左側にあり、Geminiは右側に表示されます。
Geminiがポップアップして、会話を要約したり、未読のメールを表示したり、メールの下書きを作成したり、さらなる提案を受け取ることができます。
基本的には、Gmailのメールと直接やり取りできるチャットウィンドウが開きます。
それを使用するには、Geminiビジネスまたは企業、Gemini教育、またはGoogle 1 AIプレミアムを持っている必要があるようです。
展開は既に始まっていることがわかります。
自分のGmailをチェックしました。
まだ持っていません。
私はGoogle 1の加入者です。
手に入り次第、それを披露します。
OpenAIのニュースに移りますが、今週、先週数週間前にデモを行い、スカーレット・ヨハンソンに似すぎて問題になった進化した音声アシスタントが発表されましたが、みんなその機能が本当にクールだと思っていました。
彼らはさらに進展させることを決定しました。
彼らは、6月下旬にChatGPT Plusの一部のユーザーにアルファ版を提供する予定だったが、立ち上げの基準に達するために1か月追加が必要だと述べています。
モデルの特定のコンテンツを検出して拒否する能力を向上させています。
彼らはユーザーエクスペリエンスの向上と、数百万人規模にスケールするためのインフラ準備に取り組んでいますが、依然としてリアルタイムの応答を維持することができます。
ただし、いくつかの人々がそれにアクセスし始めているようです。
ここで見つけたXの投稿では、語りながら背景音効を生成することさえ示しています。
誰かがそれに物語を語るように頼んだようです。
物語には実際に効果音が含まれていました。
ある夜、嵐が雷と稲妻を伴ってやってきました。勇敢を装ったり、単に愚かなティーンエイジャーのカップルが、嵐の中で家を調査することに決めました。
彼らは壊れた窓から忍び込み、懐中電灯と携帯電話の光だけを頼りに探検を始めました。
背景で雷のような音が聞こえる中、かなりクレイジーな状況です。
OpenAIはまた、GPT-4に基づいた新しいモデルであるCriticGPTを訓練したことを発表しました。
基本的には、ChatGPTのコード出力のエラーをキャッチするために設計されています。
彼らの例をここで見ると、Pythonの関数を書くように要求しています。
Pythonの関数を書いた後、CriticGPTがそのPythonの関数をレビューし、問題点を指摘します。
この特定の関数では、ファイルの絶対パスがディレクトリ内にあるかどうかをstarts withを使用してチェックすることは安全ではないことが指摘されています。
ユーザーはSIMリンクを利用したり、ディレクトリを同様に命名することでこれを利用することができます。
CriticGPTの提案が常に正しいとは限らないと述べていますが、私たちは、AIの支援なしで行うよりも、CriticGPTの提案がモデルの回答に含まれる多くの問題をトレーナーが見つけるのに役立つことがわかります。
具体的にいつこれがここでのブログ投稿で利用可能になるかはまだわかりません。
この作業をさらに拡大し、実践に移す計画だと言っています。
Macデスクトップアプリはすべてのユーザーに利用可能です。
実際にこのデスクトップアプリの使い方についてチュートリアルを作成しました。
自分で使い方を学びたい場合、プラスユーザーであれば、おそらくすでにアクセス権を持っており、使用することができていたかもしれません。
しかし、今では無料のChatGPTユーザーでも、Macアプリをダウンロードして使用することができます。
Optionキーとスペースバーを押すと、スポットライトウィンドウのような小さなチャットボックスが開きますが、Macにすでにあるものとは異なり、入力した内容はChatGPTに質問をしたりプロンプトを与えたりします。
ChatGPTとそのデスクトップアプリについて話すと、OpenAIは実際に今週別の会社を買収しました。
彼らは、multiというリモートコラボレーションプラットフォームを購入しました。
もしmultiに慣れていないなら、それは実際に誰かが自分の画面を共有し、同じデスクトップで共同作業を行うコラボレーションソフトウェアです。
共有されたカーソルや同時に描画される画面共有ができます。
他の人のアプリにクリックして入力することができます。
これはOpenAIが所有しています。
OpenAIがこれをどのように活用する可能性があるかは、それほど難しくはありません。
将来、コンピュータで問題に遭遇したときに、制御をChatGPTに委ねることができるかもしれません。
ChatGPTはあなたの画面を表示し、共同で問題を解決します。
もしもあなたがコーダーであり、ChatGPTにコードを書かせている場合を想像してみてください。
コードの出力を開いてみると、正しく動作していないことがあります。
ChatGPTは将来、おそらく画面を見ることができ、提案を提供し、解決策を指摘し、おそらくは画面で見ている内容に基づいてコードを反復的に更新することができるでしょう。
ここでは推測の域を出ませんが、私にとっては、OpenAIがおそらくこれに向かっているという論理的な結論のように思えます。
今週、私がまだ存在しているとは知らなかったトイザらスは、OpenAIのSoraを活用して全く新しいトイザらスのCMを制作しました。
しかし、実際の広告がどのように見えるかをご覧いただけます。
トイザらスとジェフリー・ザ・ジラフが自転車店の息子になった経緯について、あなたは考えたことがありますか?
チャールズ・ラザルスは、おもちゃ店を永遠に変えるビジョンを持っていました。
それは広告の一部分に過ぎません。
全体ではありませんが、それに対する意見は非常に分かれています。
多くの人々が企業がAIを使用して広告を作成していることを嫌っており、多くの人々がこれが広告の未来かもしれないと話しています。
また、この広告の100%がAIで作成されたと主張されているわけではありませんが、その大部分がSoraを使用して作成されたことはわかっています。
きっと誰かが戻ってきて編集やクリーンアップをしたと思います。
今日のビデオはLTX Studioの協賛であり、最近たくさんの新しいアップデートがリリースされたので、完璧です。
この新しいアップデートパックは「visions」と呼ばれています。
このアップデートにより、ビデオの作成についてより柔軟性が増し、新しいビデオを完全にゼロから始めることや、スクリプトを貼り付けてLTX Studioにスクリプトに基づいてビデオを作成させることができます。
私のスクリプトがシーンに分割されているので、単にスタートをクリックするだけで済みます。
わずか1分以内に、私はちょうどアップロードした台本から作成された完全なストーリーボードを持っています。
でも、これを見てください。
もしかしたら私は自分のビデオ全体をまったく異なるスタイルに変えたいかもしれません。
新しいビジョンズアップデートの一環として、私はLTX Studioのスタイルリファレンスにこのような画像をドラッグアンドドロップする能力を持っています。
新しくアップロードした新しいスタイルに合わせて、私の全体のストーリーボードを再構築する様子を見てください。
ビデオの各シーンの各ショットに満足したら、各ビデオクリップを個別に生成することもできますし、ここでエクスポートして「欠落しているショットを生成」をクリックして一度に全体のビデオを生成することもできます。
また、この最新のアップデートでピッチデッキ機能も導入され、全体のストーリーボードをエクスポートすると、それを美しいピッチデッキに変換して、ここで作成しているストーリーを売るために使用できます。
これはLTX Studioでできることの一部に過ぎません。
また、ナレーションを作成したり、音楽のサウンドトラックを作成したり、ビデオ全体で一貫したキャラクターを使用したり、各シーンの場所、照明、天候を編集したり、さらに多くのことができます。
実際、これはかなり印象的なAIビデオ編集ツールのスイートです。
以下の説明文のリンクをクリックして、今日LTX Studioの待機リストに参加できます。
彼らは現在ユーザーを受け入れています。
このビデオのスポンサーであるLTX Studioに、そしてさらにOpenAIのニュースに感謝します。
彼らはTime誌と戦略的なコンテンツパートナーシップを組んだ。
TimeとOpenAIは、Timeの信頼できるジャーナリズムをChatGPTを含むOpenAIの製品にもたらすための複数年のコンテンツ契約と戦略的パートナーシップを発表した。
OpenAIは、過去101年間のTimeの広範なアーカイブから現在のコンテンツや歴史的なコンテンツにアクセスすることができる。
このパートナーシップにより、TimeはOpenAIの技術にアクセスして、自身の観客向けに新しい製品を開発することができるようになる。
最近、メディアの物語が本当に変化しているのは非常に興味深いです。
明らかに、ニューヨーク・タイムズはまだOpenAIとの訴訟の最中ですが、ほとんどの他のメディア企業はOpenAIと提携していると発表しています。
しかし、初期の段階では、これらのほとんどのメディア企業はこのAI技術に非常に抵抗しており、「ChatGPTと話すことができるなら、なぜ人々が私たちのウェブサイトを読みに来るのか」と言っていました。
ChatGPTはおそらくこれらすべてのサイトからのデータでトレーニングされていることを知っています。
ChatGPTは、このコンテンツを作成する多くの企業と提携することで、さらなる潜在的な訴訟に先んじています。これにより、これらの企業が引き続きコンテンツを作成し、ニュースを報道し、深い調査を行うための何らかのインセンティブが残されるようにしています。
人々がOpenAIを通じてその情報を見つけても、OpenAIがどうやらこのコンテンツをある程度ライセンス供与しているため、メディアハウスには何らかの利益があると言えるでしょう。
今週、Timeが結んだ提携はそれだけではありませんでした。
Timeはまた、非常にリアルなテキスト読み上げを行う企業であるElevenLabsと提携しました。
どうやら、Timeはオーディオに特化しようとしているようです。
基本的に、Timeのウェブサイトにアクセスすると、リアルなナレーションが付いた埋め込みオーディオプレーヤーがあり、再生ボタンをクリックするだけで再生できるようです。
そのTimeの記事を読み返しているかのように、本当の人間が読んでいるように聞こえるでしょう。
現在Timeのウェブサイトでライブで見られる実際の例をご紹介します。
下にスクロールすると、このプレーヤーが表示されます。
再生ボタンを押すと、見出しは「私たちは世界の覇権です」。
ジョー・バイデンがマッシモ・カラブレーシ、サリッシュ・ワシントンによってリードしている方法。
こちらでインタビューの記録を読むことができますし、事実を確認することもできます。
画面の隅には、ElevenLabsのリンクが表示されています。
将来、私はほとんどのウェブサイトがこの方向に進むと思います。Timeだけでなく。
WordPressのブログなどでも、ElevenLabsのような企業のテクノロジーがますます多く統合されるのを見るでしょう。
記事やブログ投稿を読むか、リアルな声で聞くかの選択肢があります。
ElevenLabsでは、自分の声をシステムにトレーニングするなどのこともできます。
私がブログ投稿を作成するとき、そのブログ投稿に行って再生ボタンを押すと、私が読んだかのようにブログ投稿を聞くことができるかもしれません。それはかなりクールです。
それが今週のElevenLabsから得た唯一のニュースではありません。
彼らはまた、最高品質の声でいつでもテキストを聞くことができる新しいリーダーアプリを紹介しました。
ElevenLabsのリーダーアプリでは、移動中にどんなテキストコンテンツでも聞くことができます。
記事、PDF、EPUB、ニュースレター、または携帯電話のどんなテキストでも、リアルな声で聞くことができるオーディオに変換できます。
このアプリは現在iOSで利用可能であり、Androidにもすぐに登場します。
まだそれをあまり使っていませんが、これを使ってたくさんのニュース記事や研究論文を聞くことができるので、とても楽しみです。
今週も、Character.aiは新機能を導入しました。この機能により、AIアバターと会話することができます。
Character.aiは非常に興味深い会社です。
特に若い世代の間で非常に人気があります。
Character.aiはおそらく若い世代向けの最も人気のあるAIツールですが、最近、架空のAIキャラクターと実質的に電話で会話できる機能を導入しました。
例えば、スパイダーマンと会話したい場合、声で試して、「好きな食べ物は何ですか?」などと尋ねることができます。
ああ、それは大変ですね。
私は美味しいピザが大好きです。
それがほとんどの基準ですが、私は餃子や一般的に辛いものにも断ることはありません。
あなたはどうですか?
この音声機能は新機能ではありません。
新機能は、実際に電話で通話してこの会話をすることができるということです。
この小さな電話アイコンの上にカーソルを合わせると、アプリで通話が可能であると表示されます。
私は再度使用することはないかもしれませんが、それを実証するためにアプリをダウンロードするつもりはありませんが、アイデアはわかります。
テキストチャットではなく、電話で通話しているような同じコンセプトです。
AIとオーディオの話題についてですが、最近遊んでいる楽しいAI音楽ツール、ソニーやUdioなど、レコードレーベルは、それらの企業を訴え始めています。彼らは、著作権のある音楽で訓練されたと主張し、使用する権利がなかったとしています。
これは、彼らがそれが合理的な使用だったと主張するだろうという点で、まるで泥のような領域のようです。
レコード会社は、これが著作権の大規模な侵害だったと主張するでしょうが、実際にはこれに先例はまだありません。
どのように展開されるかを見るのは興味深いでしょう。
私の意見を言えば、今日では誰でも自分の音楽を制作できる世界で、レコードレーベルが実際にはミュージシャンのためのマーケティングをますます少なく行う中で、レコードレーベルが存続を求めて本当に、本当に戦うことになると感じています。
私は、レコードレーベルが非常に速く、本当に速く、関連性を失っていると感じています。
これらの訴訟のいくつかは、彼らが関連性を保ち、現在持っている権力とコントロールを掴もうとしているものですが、どのように展開するかを見守るのは非常に興味深いものになるでしょう。私は両方の側を見て、双方の主張を理解できる部分もあるので、興味深いと思います。
一方、YouTubeはこの具体的なシナリオを避けようとしています。
今週、YouTubeが主要なレコードレーベルとAI音楽取引をしようとしていることが発表されました。
Financial Timesによると、YouTubeは、Universal Music Group、Sony Music Entertainment、Warner Recordsに現金一括払いを提供し、彼らの楽曲のライセンスを取得してAI音楽ツールを合法的に訓練することを提案しています。
これは既存のDream Track機能ではなく、YouTubeが今年後半に発売予定の新しいAIツールを訓練するために使用される予定です。
前回の記事とは逆の側面ですが、これがどのように進展するかを見守るのは興味深いでしょう。なぜなら、これらのレコードレーベルがいくつかのライセンス契約に署名することを意欲的であれば、それはSunoやUdioのような企業にとって解決策となるかもしれません。
条件に同意し、ライセンスを取得して、これらすべてを解決してください。
どのように進展するかを見守ります。
それでも見るのは興味深いでしょうし、この展開が進むにつれて、最新情報をお伝えするために最善を尽くします。
今週、FigmaはConfig Conferenceという大きなイベントを開催し、Figma内で今できることに関する多くのAI発表を行いました。
それは完全なリデザインとオーバーホールも行われました。
Figmaは今、テキストプロンプトを受け取り、そのテキストプロンプトからデザインを作成することができるようになります。
彼らは、Figmaが新しいレストランのためのアプリデザインを作成する方法の例を示しました。
プロンプトを入力してから数秒後、Figmaはメニューリスト、タブバー、さらにはUber EatsやDoorDashのような配達パートナーのためのボタンが付いたアプリをモックアップしました。
彼らはそれがかなり一般的なモバイルモックアップだと主張していますが、それは真っ白なキャンバスから始めるよりも良かったです。
今、あなたはテンプレートに基づいてデザインを編集し再構成することができます。
ウェブサイトで一般的に使用されるロレムイプサムの代わりに、自動生成されたテキストを追加することもでき、新しいAI強化アセット検索機能もあり、サイトのデザインに必要なさまざまなアセットをより効果的に見つけるのに役立ちます。
現在、これをベータ機能として展開しており、ベータモードのFigmaユーザーには無料ですが、最終的には有料機能になります。
Synthesia社は今週、いくつかの新しいアップデートを発表しました。
彼らは、AIセールスボットなどに適したAIアバターを作成する会社です。
おそらく、アバターはより表現豊かで、興奮や疑念、恐怖、怒りなどを示すことができます。
彼らはまた、個人用アバターと呼ばれるものを持っており、実際にあなたに似て見え、あなたの声を使い、あなたのように聞こえますが、他の言語でも話すことができます。
首から上だけでなく、全身のアバターを作成する機能や、その他のいくつかの機能も追加されています。
Synthesiaの最新情報を知りたい場合は、YouTubeの動画全体をリンクします。
会社Captionsから今週新しく導入された新しいAIビデオ編集ツール。
このツールを使用して、標準のビデオを入力すると、異なる背景でビデオを編集し、まるでグリーンスクリーンを使っているかのように見せることができます。また、画面に表示されているようなテキストを追加したり、After Effectsのアニメーションのようなものを追加したりすることができます。
かなりクールなツールのようですね。
私自身はまだこのツールを使ったことがありませんが、将来的にこのツールについて別のビデオを作る価値があるかもしれません。
もしもかなりクールなツールだとわかれば、後でそのビデオをお楽しみにしていただき、その効果を確認しましょう。
数か月前に、Magnificというツールについて話しました。これは非常に優れたアップスケーリングツールですが、画像に余分なものを幻覚的に追加し、画像にクリエイティブな味付けを加える傾向があります。
彼らはちょうどこの新しい再点灯機能を導入しました。これにより、あなたは自分の画像を取り、それを再考することができます。
例えば、私がここで眼鏡を持ち上げているサムネイルを、私が宇宙空間にいるように再考しました。
ここに画像をアップロードするだけです。
プロンプト、他の参照画像、またはライトマップから転送するオプションがありますが、ここではプロンプトから行いましょう。
私は踊っている人々の画像をアップロードしました。そして、水中で踊っている人々を追加しましょう。
すべてそのままにしておきますが、他にもスタイルのオプションや機能があります。
再点灯をクリックすると、再点灯された状態が表示されます。
これが元の画像です。
これが生成された新しい画像です。
画像を完全に再スタイリングするのに本当に素晴らしい仕事をします。
今週、Stability AIはWeta Digitalの元CEOである新しいCEOを迎えました。
もしWeta Digitalについてよくご存知でない場合、Wetaはあなたが聞いたことがあるかもしれない映画に取り組んできたビジュアルエフェクツ会社です。例えば、アバターや猿の惑星、マーベル映画、トランスフォーマー、ゲーム・オブ・スローンズなどです。そして、おそらく最もよく知られているのは「ロード・オブ・ザ・リング」という一連の映画です。
RABBIT R1にとって状況はますます悪化しています。
この会社はRabbitudeと呼ばれており、基本的にはRABBIT R1の欠陥を見つけようとしている会社ですが、彼らは巨大なデータ漏洩を発見しました。
チームはRabbitのコードベースにアクセスし、コード内にハードコードされたAPIキーを見つけました。これにより、誰でもR1がこれまでに与えたすべての応答を読むことができ、個人情報を含むものも含まれます。また、すべてのR1を無効にし、すべてのR1の応答を変更し、すべてのR1の声を置き換えることができます。
彼らは、ElevenLabs、Azure、Yelp、Google MapsのAPIキーをそこで見つけました。
Rabbitが受けたすべての悪い報道や悪いレビューに加えて、コードの品質がかなり低く、多くのAPIキーが露出していることが判明しました。つまり、RABBIT R1を持っている人は、データが漏洩するリスクにさらされています。
Etchedという会社が、明らかに世界初のTransformers向けの専門チップを発表しました。
Transformerは、あなたが使用しているすべての大規模言語モデルの基盤となっています。
Sora、Gemini、Stable Diffusion、およびこれらすべてのツールも、Transformerを使用しています。
これらのチップは、現在のほとんどのAI企業がAIモデルを訓練するために使用しているNVIDIA H100よりも20倍以上高速です。
これらが利用可能になったとき、かなり印象的に見えます。
また、私がたまたまペンを持っているGrok、GROQ Grokの競合他社であるようです。
この発表の日、GrokはLLaMA 370Bモデルで秒間400トークンを達成したと発表しました。
このメッセージは、Akshayによって指摘されたように、Etchedコメントへの直接的な応答のようです。
MetaはInstagramでユーザーが作成したAIチャットボットのテストを開始しました。
これらのAIチャットボットのいくつかは、Snoop DoggやMrBeast、そしてTom Bradyなどの別の名前で見られました。
個人が自分自身のカスタムチャットボットを作成できるように始めています。
AIスタジオの初期テストが米国で展開されているようで、Instagramで今後数週間でお気に入りのクリエイターや興味に基づいたAIを見ることができるかもしれません。
今のところ、主にメッセージングで表示され、AIであることが明確にラベルされます。
ついに、オリンピックが近づいているため、今年はAIに全力を注いでおり、アル・マイケルズのAIバージョンも含まれています。
人々はオリンピックから興味を持っているもののカスタマイズされた情報を得ることができ、アル・マイケルズによって解説されますが、それはAIのアル・マイケルズです。
これがそのように見えるかの簡単な例です。
タイ・ケリーさん、デイリーオリンピックの要約へようこそ、昨日の最もスリリングなオリンピックの瞬間を個人的にお伝えします。
あなたは水泳ファンなので、すぐにプールに向かいましょう。
チームUSAは男子4×100メートルメドレーリレーで驚異的な勝利を収め、世界記録を更新しました。
ダイビング会場では、クリスタ・パーマーが過去の膝の手術を乗り越えて、女子スプリングボード決勝に進出するための強靭さと技術を披露しました。
ここで話をやめておきます。
イメージがつかめましたね。
あなたは興味のあるスポーツを教えることができ、それに基づいてアル・マイケルズが解説するカスタムの短いビデオを作成します。あなたの名前で話しかけることもできます。
それがあなたにお伝えすることです。
今週はたくさんのAIニュースが出ました。
私にとっては少しゆっくりした週のように感じられたので、不思議な感じがしました。
しかし、すべてのAIニュースをまとめていると、本当にたくさんのことが起こっていることに気づきました。
1週間で30件の新しいAI発表があると、ゆっくりした週に感じるようになってきて、それはただ驚くべきことです。
とにかく、このような動画を楽しんでいただける場合は、この動画に高評価をして、このチャンネルに登録していただければ幸いです。
このような動画があなたのYouTubeフィードに続々と表示されるようにします。
毎日遊ぶためのさらなるAIツールを見つけ、AIニュースについて常に最新情報を得たい場合は、futuretools.ioをチェックしてください。そこでは私が毎日ニュースを更新しています。
私は見つけたAIツールを追加しており、無料のニュースレターもあります。
無料のニュースレターに参加していただければ、AI収入データベースにアクセスできます。これは、さまざまなAIツールを使用してお金を稼ぐクールな方法のデータベースです。
YouTubeチャンネルとニュースレターの両方に登録している人だけが参加できる、毎月開催されるコンペティションで素敵な賞品を獲得するチャンスがあります。
futuretools.ioにアクセスして、そのすべてを見つけてください。
この動画のスポンサーとしてLTX Studioに再度感謝申し上げます。そして、私と一緒に熱中し、最新のAI世界の最新情報を追いかけてくれて、本当にありがとうございます。
もう一度本当にありがとうございます。
本当に感謝しています。
次の動画でお会いしましょう。
さようなら。