動画ではAIの最新動向が紹介されています。Midjourneyが「in-painting」機能を導入し、Ideogram AIはテキスト追加機能、Leonardo AIは「anime pastel dream」モデル、MicrosoftはMicrosoft PaintのAI組み込み、Metaは「seamless m4t」音声変換モデル、OpenAIは「seamless.meta demolab.com demo」及びGPT 3.5 turboのファインチューニング、11 Labsは11 multilingualのバージョン2をそれぞれリリースしました。ニューヨーク・タイムズはChatGPTに訴訟を起こしており、一方でNVIDIAのAIチップの需要は増加しています。ヨーロッパでは、メタ関連アプリにAIオフスイッチが導入予定です。MetaとHugging Faceはコーディングアシスタントを、AmazonはThursday Night FootballにAI機能を導入します。AIの医療への応用が進展し、MicrosoftとEpicは協力して進めています。障害の克服や医療の向上にAIの進歩が貢献しており、AIの技術進化とその可能性は広がっています。
公開日:2023年8月26日
※動画を再生してから読むのがオススメです。
今週、AIの世界では実際にたくさんのニュースがありましたが、注目していなかったら、それらの多くを見逃してしまったかもしれません。
特にAIアートの世界では大きな週だったので、掘り下げてみよう。 今週、Midjourneyはインペインティング機能をリリースした。
実は、私はこの新しいインペインティング機能に関する専用のビデオを作りました。
ビデオはこんな感じですが、簡単に説明するとこんな感じです: Midjourneyの中で新しい画像を生成してアップスケールすると、リージョンを変えるという新しいボタンが表示されます。
Midjourneyの設定で、リミックスモードがオンになっていることを確認すれば、画像内部で変更される部分を実際に操作することができます。
そこで、various regionをクリックすると、この男の頭をこのように選択して、長いブロンドの髪にすることができる。
「送信」をクリックすると、画像についてのすべてが同じままで、ただ今は長い金髪の画像が生成されました。
そしてどうやら、ブロンドロングヘアといえば女性を連想するようだ。
この人物の服装だけを選択し、プロンプトのスーパーマン、プロンプトのジョーカー、プロンプトの花柄のドレス、レザーを着たロックスター、そしてサングラスをかけていると入力してサングラスを追加するために目を塗りつぶした。
そして出来上がったのがこれだ。
Runway MLのフレーム補間機能を使って、私もこのアニメーションを作成しました。それにより、さまざまな衣服の間を切り替えました。
そして、このビデオの最後に、実際にキャラクターの表情を変えました。
ツイッターでフォローしているハビ・ロペスが発見したのですが、"変化する "をクリックしてから画像全体を選択し、まったく同じプロンプトを残すと、より高画質で詳細な画像が得られるそうです。
そして、最近人工会議で会った友人のアリ・ジュールズが、これを実際に確認した。
彼女が言うには、今日のMidjourneyのオフィスアワーで、Midjourneyの創設者であるDavidが、インペインティングは異なるシステムを使用しているので、鋭い目を持つ人なら、その方がわずかに優れていることに気づくかもしれないと言っていた。
アリ・ジュールズといえば、毎週恒例のMidjourneyオフィスアワーのレポを披露してくれたが、ここではMidjourneyに期待できることをいくつか紹介しよう。
さらにインペインティングの機能が追加される可能性があるようで、バージョン6では、よりコントロールしやすく、より多くの知識、より良いテキスト理解、より多くのスタイル、より多様なテキスト生成機能、より良い解像度を優先しているようだ。
つまり、彼らはこれに力を入れているわけだが、リリース予定日はまだ決まっていない。
また、ウェブサイトを優先しているようだ。
超高品質なユーザーインターフェイスとユーザーエクスペリエンスを求めている。
彼らは多くの機能を追加しているが、それについてもまだリリース予定日はない。
私が本当に興味深いと思ったことの一つは、彼らが3Dとビデオに取り組んでいることです。それは絶対に素晴らしいことだと思います。
それらがどうなるか楽しみだ。
しかし、今週のAIアートのニュースはMidjourneyのインペインティングだけではない。
今週はIdeogram AIがリリースされた。
Ideogram AIは、Google Brain、カリフォルニア大学バークレー校、CMU、トロント大学から、Googleのテキストから画像への変換モデルであるImagenを開発した人々を含むロックスターチームによって開発された。
Ideogram AIの最も目立つ特徴は、AIが生成した画像にテキストを追加できる能力です。これまで見た他のプラットフォームよりも優れています。
Ideogramは、実は少し前からアクセスできるようになっていたプラットフォームだが、実際に発表されるまでは秘密にしていた。
だから、ようやくこのプラットフォームでできることを披露できることに興奮している。
それで、Matt Wolfと書かれた狼のロゴデザインのようなものを入れてgenerateをクリックすると、かなりまともな画像が2、3枚出てくる。
これには釘付けになったし、これには少なくとも僕の名字がちゃんと入っている。
ざっと目を通しただけでも、ビッグフットの画像にhikeの文字、ジャック・オ・ランタンの画像にspooky seasonの文字、ロゴステッカーのような画像にArcher Airの文字、nature loves courageの文字などがある。
ideogram.aiで詳細を学び、それを使って遊んでみてください。何が生成できるか見てみてください。
また、今週のAIアート・ニュースでは、Leonardo AIが彼らのプラットフォームにアニメ・パステル・ドリームという新しいモデルを追加した。
このモデルにアクセスするには、Leonardoアプリにログインし、一番上のfeatured modelsの下にあるanime pastel dreamをクリックします。
モデルをクリックすると、そのモデルで生成されたクールな画像を見ることができます。
また今週、マイクロソフトはマイクロソフト・ペイントのようなツールにAIを追加したいと発表しました。
この画像は、マイクロソフト社内で作成されたモックアップです。
また、AIアートのニュースでは、AI生成ゲームアセットの作成を支援することで知られるScenario社が、Unityプラグインを発表しました。
これにより、ゲームデザイナーや開発者であれば、Unityプラットフォーム内で直接テキストプロンプトを使ったゲームアセットを生成できるようになります。
さて、最後にAIアートのニュースだが、良いニュースばかりではない。
先週末、米国の連邦判事によると、AIが生成したアートは著作権で保護されないという判断が下されました。
しかし、判決の詳細を読むと、このケースで著作権を認められようとしていた作品は、クリエイティビティ・マシンのアルゴリズムで生成されたものだった。
これは、プロンプトが入力され、画像に人間のタッチが加えられたMidjourneyタイプの画像ではなかった。
これは、アルゴリズムの作成以外に人間の手を加えることなく、ただ機械が画像を生成したケースを指している。
AIによる画像の著作権侵害は現在も続いていますが、そのようなケースでは、作成者が実際に画像にプロンプトを入力し、探している画像に正確にたどり着くまで、何度も何度も新しいプロンプトを作成し続けました。
このようなケースでは、人間の手が多く加わっています。
しかし、プロンプトや人間の手を介さずに機械がただ画像を生成した場合、それらは著作権で保護されることはありません。
著作権法には微妙なニュアンスがありますが、MidjourneyやLeonardo、Stable Diffusionなどで生成された画像は必ずしも著作権対象にはなりません。
さて、次はマーケティングにおけるAIについてです。
あなたが私のようなコンテンツクリエイターであれ、ビジネスオーナーであれ、あるいは単にオンラインでより多くのリーチを得たい人であれ、マーケティングの最新トレンドについていくことは重要だ。
そして今、すべてのトレンドはAIの方向に向かっている。
AIを活用することは、リーチを獲得する最良の方法のひとつであるだけでなく、企業が今最も求めているマーケティング・スキルのひとつでもあります。
そこで今回のビデオでは、HubSpotと提携し、彼らの無料リソースの1つを皆さんにお届けします。
その名も「AI Trends for Marketers in 2023」: AIはどのようにマーケティングを変え、ビジネスの急成長を促すのか。
この無料レポートでは、一流のマーケターがどのようにAIツールを使ってコンテンツを10倍速く作成し、データを即座に分析し、ROIを高めているかを学ぶことができます。
また、最新のAIマーケティング技術を学ぶことで、競争力を高めることができます。
個人的には、コンテンツクリエイターとして既存のコンテンツを再利用するためにAIを活用する方法について書かれたこのセクションが特に興味深かった。
私は、時間をかけて新しいコンテンツを作るときはいつでも、最大限の眼球に届くようにしたい。
だから、この無料のリソースもとても役立つと思います。
このレポートへのリンクは、説明文の下の方に貼っておきます。
このビデオのスポンサーであり、この無料リソースを提供してくれたHubSpotに心から感謝する。
また今週、YouTubeはユニバーサルミュージックグループと提携し、AIと音楽業界のオーバーラップについて取り組むと発表した。
YouTubeは責任を持ってAIを取り入れたいと考えており、彼らはアーティストと協力して、クリエイターが音楽を使用できるようにしつつ、アーティストとレコード会社に適切な報酬が支払われるようにする倫理的で責任ある方法を考えたいと考えている。
YouTubeについて話すと、今週、彼らは新しい検索機能のテストを発表しました。それにより、あなたが歌をハミングすると、それに基づいてその曲を見つけることができます。
今のところ、この新しい実験はアンドロイド端末だけで行われるようだ。実験にアクセスできるユーザーは、YouTubeの音声検索から新しい曲検索機能に切り替え、3秒以上鼻歌を歌ったり、歌ったり、録音したりすることができるという。
その後、プラットフォームが曲を特定し、公式ミュージックビデオ、ユーザー作成コンテンツ、ショートムービーなど、検索された曲をフィーチャーした関連YouTube動画にユーザーを誘導する。
この機能は、人の鼻歌を曲の指紋や特徴的なメロディにマッチさせることができる機械学習モデルに基づいて構築されている。
そして、声を使うという話題のついでに、イレブンラボは、約30の言語に対応する基礎的なAI音声モデルである11マルチリンガルの新しいバージョン2を発表した。
イレブンラボのアカウントを持っていてログインすると、設定の下にドロップダウンメニューが表示され、使用したいモデルを選択することができます。
現時点では、テキストから音声に変換するだけです。
つまり、インドネシア語で話したい場合は、インドネシア語で何かを入力する必要がある。
しかし、音声変換は近々可能になるとのことなので、おそらく母国語でテキストを入力し、そのテキストを翻訳し、選択した言語でテキストを話してくれるようになるのだろう。
ただし、今のところ、英語で入力して、Google翻訳にかけて、話したい言語に翻訳することもできます。
例えば、日本語。
この新しいテキストをElevenLabsに貼り付けて、それを生成させます。
さて、私は日本語を話せないので、正直なところ、出力結果がどの程度なのか見当がつきません。
だから、もし日本語がわかるなら、意味があったかどうか教えてほしい。
さて、まったく同じ日に、MetaもシームレスなM4Tモデルを導入しました。これにより、何かを話したりテキストを入力したりすることができます。
そして、音声翻訳、音声からテキストへの翻訳、テキストから音声への翻訳、テキストからテキストへの翻訳、自動音声認識の出力を得ることができる。
このシームレスなm4tモデルは、ここをスクロールダウンすると、Hugging FaceやGitHubで実際に利用することができます。
つまり、もし自分が何をやっているのかわかっていれば、これをローカルにインストールして自分のマシンで実行することもできるし、Hugging Faceのクラウド上で実行することもできる。
ただし、誰でも使えるデモをseamless.meta demolab.com/demoで公開している。
何でも英語で話すことができる。
例えば、こんにちは、私の名前はマット・ウルフです。
私のYouTubeチャンネルに登録して、「いいね!」ボタンをクリックして、ベルを押してください。
ここで、好きな言語を選択することができます。
例えば、スペイン語。
翻訳をクリックする。
実際に、ここでテキストの翻訳を行い、音声の翻訳も行いました。
こんにちは、私の名前は...
私のスペイン語はあまり上手ではありませんが、かなり近いと思います。
イレブンラボと違って、これは実際に私の声で読み上げているわけではありません。
OpenAIにも今週ちょっとしたニュースがあった。
ユーザーはGPT-3.5ターボを自分のユースケースに合わせて微調整できるようになった。
ファインチューニングをご存じない方のために説明しておくと、基本的には、自分のユースケースにぴったり合うようにモデルを調整することです。
例えば、操縦性を向上させる。
それにより、企業はモデルがより良く指示に従うことができます。
また、一貫性のある回答フォーマットへの対応能力を向上させることもできます。
また、モデルにどのような反応をさせたいかによって、独自のカスタムトーンを作成することもできます。
しかし、微調整について注意しなければならないのは、微調整なしでベースモデルを使用するよりもはるかにコストがかかるということだ。
レイチェル・ウッズはツイッターで、微調整でほとんどの人がやりたいと思うことが、実はプロンプトでできることだという素晴らしい指摘をしている。
LLMは、適切なプロンプトからタスクや行動をピックアップするのが驚くほどうまい。
このことを考えるひとつの方法として、あるタスクをマスターするのに数週間かかるような場合、トレーニング資料を読んでイメージをつかむのではなく、ファインチューニングのユースケースになるかもしれない、と彼女は言う。
ファインチューニングのために一体どこに投資すればいいのか悩んでいるのであれば、現時点での私の答えは、ほとんどのビジネスにおいて、プロンプトでできないことを確認することです。
正直なところ、微調整が必要なプロンプトでできないことはまだあまりありません。
OpenAIといえば、ニューヨーク・タイムズ紙がChatGPTのデータを使ってトレーニングしているとして、ChatGPTを訴えているという話を最近しました。
もし彼らがChatGPTを訴え、勝訴した場合、ChatGPTのデータセットの破壊や、侵害コンテンツ1つにつき最高15万ドルの罰金など、壊滅的な結果になる可能性がある。
さて、ChatGPTが元々どれだけのデータで訓練されていたかを考えると、もしこれが真実で、実際にこのような形で展開されたとしても、ChatGPTとOpenAIが実際に生き残るとは考えにくい。
さて、実際にこのような展開になると思いますか?
おそらくないでしょう。
何らかのより合理的な解決策が出てくると思います。
Potential New York Timesの訴訟により、OpenAIはChatGPTを消去し、やり直すことを余儀なくされる可能性がある、というような見出しは、クリックされるでしょう。
ここでちょっとだけAIのネガティブな世界に踏み込んでみると、この記事は今週発表されたもので、マイクロソフトとChatGPTの醜い数字が、AIの需要がすでに縮小していることを明らかにしている。
そして、公平を期すために、ChatGPTとすべてのAIの誇大宣伝がちょうど最大であった少し誇大宣伝のサイクルがありました。
GPT-4やMidjourneyの新バージョン、Stable Diffusionの新バージョンのような新しい大規模な進歩がなかっただけでなく、夏休みや学校が休みになったせいもある。
最近のニュースは、あまり画期的ではなく、少し地味です。だから、ハイプが少し落ち着いたと思います。
しかし、この記事を読むと、AIは詐欺、スパム、妨害にしか使えないと思い込んでしまうだろう。
というのも、AIがいかに人々の生活を大きく向上させたか、ヘルスケアの進歩を改善したか、労働者の生産性を向上させたか、その他AIの世界で出てきている様々な利点についての記事を抜粋することなく、AIにまつわる否定的な部分を示す記事ばかりを抜き出しているからだ。
しかし繰り返すが、悲観論は興奮論と同じように売れる。
そして、もしあなたが本当に、ここにある一握りの記事がそう言っているからという理由で、AIがただ滅びていくだけだと思っているのなら、エヌビディアの業績を見てみよう。
The Vergeの記事によると、エヌビディアはAIブームで60億ドルの利益を上げたという。
そしてそれは、135億ドルという驚異的な収益によるものだ。
この135億ドルというのは、2024年第2四半期の業績によるものだ。
そして、同社のジェネレーティブAIチップに対する前例のない需要のため、彼らはまたAIに起因する来四半期の収益160億ドルを予測している。
そう、訴訟がいくつかある。
そう、オープンAIにはいくつかの苦難が待ち受けているかもしれない。
しかし、AIはどこにも行かない。
AIを活用する新しい方法を見つけている企業は、まだAIに投資している。
まだチップを買い占めている。
そして、ますます重くなっている。
メインストリームにおける誇大宣伝は少し落ち着くかもしれない。
しかし、このAI技術のすべての技術的な進歩とユースケースにおいて、上向きの傾向しかありません。
もしあなたがヨーロッパにいるのなら、フェイスブックやインスタグラムのようなメタ関連のアプリでAIのオフスイッチが入るかもしれない。
欧州連合(EU)にはデジタルサービス法と呼ばれるものがある。
この法律の一環として、大規模なプラットフォームや検索エンジンは、AIによるパーソナライズをオフにする機能をこの地域のユーザーに提供することが義務付けられている。
皆さんも私もすでにご存知のように、ソーシャルメディア企業や検索エンジンのアルゴリズムは、AIを使ってより良い結果を表示しようとしています。
私の意見では、これはこれらのプラットフォームでのユーザーエクスペリエンスを劇的に低下させるだろう。
これらのアルゴリズムの多くは、私が見たいと思うコンテンツを私の前に置くという、本当に良い仕事をしていると思う。
もしそれを取り上げてしまったら、おそらくユーザー体験はより楽しいものではなくなってしまうだろう。
でもね、AIはあなたが戻ってきてプラットフォームを使い続けるように設計されているので、おそらくそれらのプラットフォームへの中毒も治るでしょう。
Metaといえば、もしあなたがコーダーなら、MetaはCodeLamaを発表したばかりだ。
Metaがオープンソースの大規模言語モデルLAMAをリリースしたのは、ごく最近のことだ。
そして今回、コーディングに特化したモデルが登場した。
CodeLamaは研究・商用利用ともに無料だ。
LAMA 2の上に構築されており、GitHubリポジトリで公開されているので、アクセスしてダウンロードし、ローカルでもクラウドでも好きなようにインストールすることができる。
今週、Hugging FaceはSafeCoderというコーディング・アシスタントも発表した。
SafeCoderはモデルではなく、完全なエンドツーエンドの商用ソリューションだという。
SafeCoderは、セキュリティーとプライバシーのために作られたもので、CodeLamaと同じように、顧客自身のインフラでセルフ・ホスティングできるように設計されている。
SafeCoderは、コーディング・モデルの特定のユースケースに合わせてトレーニングされるように設計されています。
つまり、LAMA 2のような画一的なコーディング・ソリューションではありません。
これは、実際にハギング・フェイスと協力して、あなたの正確なニーズに合わせて微調整します。
ハギング・フェイスといえば、今週ハギング・フェイスは、45億ドルの評価額でシリーズDの資金調達を行ったと発表した。
新たな投資家には、セールスフォース、グーグル、アマゾン、エヌビディア、AMD、インテル、クアルコム、IBM、サウンド・ベンチャーズが含まれる。
これがロックスターのような投資家たちでないとしたら、何がそうなのかわからない。
今週発表された楽しいニュースをいくつか紹介しよう。
アマゾンが木曜日のナイト・フットボールにAIを活用した新機能を導入するというのだ。
実際に、AIが生成した統計や観戦している試合に関する詳細を、試合観戦中に画面に表示するようになるそうだ。
さて、AIに関して言えば、AIの世界で私たちが目にすることになる次の大きな革命のひとつは、ヘルスケアにおけるAIの進歩だと思います。
私たちはすでに、AIがヘルスケアの分野でどのような進歩を遂げるかについて、多くの驚くべきニュースを見てきました。
メインストリームの意識に関する限り、AIにまつわる次の大きなブームと誇大広告のサイクルを目にすることになると思います。
そして今週、マイクロソフトとEpicは、ヘルスケアにおけるジェネレーティブAIのインパクトを加速させるために、AIの協力関係を拡大した。
彼らは、ノートの要約による臨床医の生産性の向上、埋め込み型アンビエント臨床文書による生産性の向上、手作業に集約されるプロセスの削減による管理効率の向上、より良い患者転帰のための医療の進歩などを行っている。
そういえば、今週はこんなニュースがあった。
新しい脳インプラントが、デジタルアバターを使って麻痺した女性の会話を助けた。
研究者たちは、脳の信号を変調された音声と表情に変換する、初めての埋め込み型AI搭載デバイスを開発しました。
その結果、脳卒中で話す能力を失った女性が、しゃべるデジタルアバターを使って話し、感情を伝えることができるようになった。
AIが進歩するにつれて、ヘルスケアの世界ではこのようなことがますます増えていくと思います。障害が克服され、病気が克服され、医師や臨床医がより生産的になり、実際に個人的に本当に重要なことに取り組む時間を確保できるようになるのです。
私はAIと医療の世界の進歩に本当に本当に興奮しています。ビジュアルエフェクトやアート、音声認識などの世界にも同じくらいです。
AIと医療は、私は次の大きな革命になると思います。みんなが興奮するでしょうし、私も完全にそれに参加します。
私はそのことにとても興奮している。
ということで、今日はこの辺で。
このビデオにご視聴いただき、本当にありがとうございました。
本当に、本当にありがとうございました。
最後に1つだけ、簡単に言っておきたいことがあります。
私はDiscordコミュニティを持っています。
ちょうど1万人を超えたところで、Discordコミュニティの中で、本当に本当に素晴らしいコンテストを開催しています。
futuretools.io/discordで見つけることができます。
コミュニティへリダイレクトされ、現在開催中のクールなAIアートコンテストに参加することができ、アートを投稿してコミュニティの投票に参加すると賞金や賞品を獲得できます。
Discordにアクセスして、チェックしてみてください。
まだの方は、Future Toolsのウェブサイトもチェックしてください。ここでは、私が出会った最新のクールなツールをキュレーションし、最新のAIニュースを毎日お届けしています。
futuretools.ioでご覧いただけます。
改めて、ご視聴ありがとうございました。
本当に、本当にありがとうございました。
そして、このビデオをスポンサーしてくれたHubSpotに改めて感謝します。
君たちは素晴らしい。
ありがとう。
また次のビデオでお会いしましょう。
さようなら。
ありがとう。