この動画は、最近のAI関連ニュースを紹介している。主なトピックは、Midjourney version 6のリリース、Microsoft Copilotの音楽作成機能、GoogleのVideo Poetの発表である。Midjourney version 6では、より進化したプロンプトフォロー、画像プロンプトの改善、テキスト生成などが可能になっている。Microsoft Copilotでは、音楽を直接作成できるようになったが、この機能はまだ限られたユーザーにのみ提供されている。GoogleのVideo Poetは、テキストや画像からビデオを生成できる新しいモデルである。また、OpenAIのChatGPTにはディスカッションのアーカイブ機能が追加され、Anthropicは顧客の著作権問題に対する法的保護を提供すると発表した。UK最高裁判所は、AIが発明者になることはできないとの判決を下した。バイトダンスはOpenAIの技術を使用して独自のAIシステムを開発しようとしたが、利用規約違反により制限された。カリフォルニアのシボレーディーラーでは、AIの顧客サービスによる誤った発言が話題となった。
公開日:2023年12月23日
※動画を再生してから読むのがオススメです。
さて、年が明けると、AIのニュースは間違いなくかなりスローダウンしている。
しかし、今週は大きな発表が2つほどあり、その後にわずかなアップデートが続いた。
それでは早速、Midjourneyのバージョン6が公開されたことから始めよう。
MidjourneyのDiscordを覗いてみると、ここで発表があった。
彼らはV6モデルのアルファ版をコミュニティにテストさせている。
より正確なプロンプトの追従、より長いプロンプト、改良されたコヒーレンスとモデル知識、改良された画像プロンプトとリミックス、マイナーなテキスト描画能力、改良されたアップスケーラー。
彼らはまた、ここでV6のプロンプトはV5とは大きく異なると述べています。
プロンプトの出し方を学び直す必要があります。
V6はプロンプトに対してより敏感です。
Stable Diffusionのようなツールで、画像プロンプトの最後に追加する習慣がありますが、受賞歴のあるリアルな4K 8Kのようなジャンクな表現は避けてください。
ここでは、これはアルファテストですと述べています。
頻繁に変更され、予告なく変更されることがありますので、これはV6の最終バージョンではありません。
今日は少し遊んでみて、いくつか興味深いことに気付きました。
私が最初にテストしたプロンプトは、カラフルな都市のスカイラインが背景にあるカメラを見つめる女性の写真で、これらの画像では色が本当に素晴らしく、非常にリアルではありませんが、実際には非常に素晴らしいです。
しかし、超リアルではありません。
リアルさを求めるなら、style rawを追加する必要がある。
そこで、まったく同じプロンプトにstyle rawを加えると、これらの画像が生成された。
次に、手を使った場合にどうなるかを試してみたかったので、街のスカイラインを背景にカメラに向かって手を上げている男性をタイプしてみた。
4つの画像のうち2つはかなりまともに見えるが、この画像は両手の指が4本しかない。
これは、片方の手に1本、2本、3本、4本、5本、6本、7本の指がある。
このように、手にはまだファンキーなものが残っていますが、Midjourneyから得られる色とコントラストがとても気に入っています。
Midjourneyでは画像に文字を入れることもできるようになったので、「Mreflow」と書かれた看板を掲げるペンギンをテストしてみた。
そしてまあ、4人中2人がそれを手に入れた。
これは単にMrelowと書かれています。
こちらはMrefflow。
そして、この2人はなんとか正解した。
さて、バージョン6でアップスケールする画像を決めるとき、バージョン5を使っている場合のようなオプションはあまりありません。
例えば、バージョン5の画像までスクロールすると、リージョンのズームアウト、カスタムズーム、左パン、上下のパンがあります。
V6を見ると、そのほとんどがなくなっています。
ただ、画像を大きくするだけの微妙なアップスケールオプションがあるだけです。
アップスケールクリエイティブは、クリエイティビティを追加するものです。
そして、非常に繊細と非常に強力がある。
ここでクリエイティブをアップスケールしてみました。
これは私のオリジナル画像です。
クリエイティブ・バージョンでは、あまり違いがないことにお気づきでしょう。
しかし、肌を見ると、少し肌が滑らかになっていることに気づくでしょう。
しかし、それ以外には大きな違いは見当たらない。
バージョン6が優れていると思われる点は、一貫性のあるキャラクターを作成できることです。
そこで、このキャラクターを作成し、同じキャラクターに帽子をかぶせたいと思いました。
そして、このバージョン3をリミックスすることで、この画像を作成することができました。
V3をクリックして、リミックス・ボックスをここに表示させ、プロンプトを少し変えて、代わりに帽子をかぶった彼女にした。
すると、同じ人が帽子をかぶっているように見え、角度が変わりました。
ここに新しい画像があります。
これが私が作成したオリジナルの画像です。
おそらく、違う服を着ているだけの同一人物だと主張できるだろう。
もうひとつ、Midjourneyバージョン6が本当に本当に優れているのは、プロンプトにたくさんのディテールを追加したい場合、あなたがプロンプトに入れようとしていたものをすべて取り込んでくれることです。
例えば、サングラスをかけ、テレビを見つめ、赤いソファに座っている3つの頭を持つ怪物。
テレビには猿が映っている。
実際にどの程度映るか見てみよう。
最初の試みでは、ある程度はできた。
私の3つの頭を持つ怪物は取れなかったが、テレビの上の猿、サングラス、赤いソファは取れた。
ただ、3つの頭を持つ怪物は逃した。
では次に、コウモリが飛び交う森の中の紫色のオオカミを試してみよう。
太陽は木々の向こうに沈んでいく。
ここには、紫のオオカミ、木々の背後に沈む太陽、飛び回るコウモリがあります。
これらの画像はすべて、私が入力したプロンプトに沿った、かなりまともな仕事をした。
ここで、同じプロンプトをMidjourneyバージョン5で生成すると、ほとんどの画像でオオカミとコウモリのハイブリッドなものを作ろうとすることに気づくだろう。
つまり、プロンプトに忠実であることが、大きなアップデートのひとつなのだ。
Midjourneyバージョン6を使用するには、Midjourneyの有料プランが必要です。
しかし、Midjourneyのボットタイプ/設定にログインすることができます。
ドロップダウンメニューからMidjourneyモデルV6 Alphaを選択してください。
また、リミックスモードをオンにしておくことを強くお勧めします。
リミックスモードをオンにしておくと、バリエーションを作りたいときに、この画像のB4をクリックすれば、プロンプトを変更しつつ、画像と似たようなスタイルにすることができる。
こうして、ミッドジャーニー・バージョン6でより一貫したキャラクターを手に入れることができた。
これが今週の最大のアップデートだろう。
Xに乗ると、Midjourney V6を使って驚くべき画像を生成している人々のさまざまな例がすぐに見られます。例えば、友人のAli jwesさんが作成したこの素晴らしいリアルな画像です。
こちらも本当に素晴らしいリアルな画像です。
こちらは、植物にぶら下がった付箋に「こんにちはV6」と書かれているものです。
他にも本当にクールなアートがある。
Xのニック・サン・ピエールも、超リアルな素晴らしい画像を作っている。
だから、みんながこれを使ってやっていることを見るのはクールなんだ。
次に、今週マイクロソフトは、マイクロソフト・コパイロットの中で直接音楽を作れるようになったと発表した。
彼らはSunoと提携しており、過去のビデオで何度も紹介したツールで、実際にはかなり良い歌詞付きの曲を生成することができます。
このツールは、私が過去に何度もビデオで紹介しているもので、歌詞付きの楽曲を生成することができる。
アクセスできるかどうかを確認するには、copilot.microsoft.comにアクセスし、右上のプラグインをクリックする。
すでにアクセス権がある場合は、ここにAOプラグインが表示され、オンにすることができます。
私のアカウントにはまだ導入されていないので、コパイロットの中で直接デモをすることはできない。
しかし、まもなくすべての人にロールアウトされるようだ。
しかし、もしあなたがSunoを使いたいのであれば、Suno Discordの中で直接曲を生成し、このようなバンガーをポップアウトすることができる: 十分な知識を追い求めるなら、ウォル・アム・マナが教えてくれることを聞き逃さないように。
主張する必要はない。
彼はAIゲームの最新スクープを持っている。
ニュースのチュートリアルから、彼はあなたの脳を高めてくれるだろう。
YouTubeでM狼に登録する。
知恵の流れ、知識の成長を見て魔法を発見してください。
AIのパワーをトートなしで最新の状態に保つ。
彼に教育してもらいましょう。
彼らのDiscordの中でそれを行うには余分なステップです。
その代わり、Microsoft Edgeの中ですぐに使えるようになる。
しかし、Sunoからすでに得られているものとかなり似たような品質と結果になると想像している。
また、今週のGoogleリサーチは、ビデオ詩を披露した。これは、Googleが展開している新しいテキストからビデオへ、画像からビデオへ、ビデオからビデオへ、さらにビデオからオーディオへのモデルである。
これによってできることのいくつかの例を示します。
ここには、モナリザがあくびをしている様子や嵐の中を航行する船など、画像からビデオへの例があります。
こちらは動画から動画への変換例です。
実際にビデオを延長しているのがわかります。
バイクに乗ったアライグマたちの後ろで爆発が起きている。
そして、この点で異なるのは、既存のビデオツールでは得られないより長いビデオを生成できることです。
デフォルトでは、ビデオ詩人は2秒のビデオを出力しますが、このモデルは1秒のビデオクリップを入力すると1秒のビデオ出力を予測することで、長いビデオを生成することもできます。
このプロセスを無限に繰り返すことで、任意の長さの動画を生成することができる。
彼らのウェブサイトには、この入力映像のサンプルがいくつか掲載されている。
そして、ビデオは実際に変化し、延長される。
これに加えて、利用可能なものがさらにあります。
また、Runway Gen-1のようなビデオからビデオへのスタイライゼーションや、ペインティングのビデオもあります。
彼らはこの小さな列車を使って、箱を乗せ、そしてクマが列車に乗っている様子を表現しました。
あるいは、誰かがカイトサーフィンをしているところを入力すると、今度はサメの上でカイトサーフィンをしている。
Googleは、これらの例をすべて含むこのデモページだけを見せびらかしました。
ご覧になりたい方は、説明文にリンクを貼っておきます。
実際、いつになったら自分たちで使えるようになるのか見当もつかない。
しかし、Pika LabsやRunwayのようなツールでできることを、さらに後押ししてくれそうだ。
また、今週OpenAIはChatGPTに小さな新機能を追加しました。
古いディスカッションをアーカイブできるようになりました。
このディスカッションをクリックすると、左側にある3つの点をクリックできます。
チャットをアーカイブする新しいオプションがあります。
アーカイブチャットをクリックすると、サイドバーから削除されます。
でも、また見つけたくなったら、自分の名前のところに降りてきて、設定とベータをクリックして、ここにアーカイブチャットというボタンがあります。
それを管理するをクリックすると、アーカイブされたすべてのチャットが表示され、必要に応じてもう一度アクセスすることができる。
また、今週、他の多くのジェネレーティブAI企業が行ったように、Anthropicは、著作権の問題が発生した場合、顧客に法的保護を提供すると発表しました。
更新された規約の下で、私たちは、私たちのサービスまたはそのアウトプットの承認された使用について、顧客に対して行われた著作権侵害のクレームから顧客を守り、その結果承認された和解または判決の支払いを行います。
新条件は2024年1月1日から適用される。
また、メッセージAPIも更新された。
AIと法的な話題の一方で、英国の最高裁判所はAIは発明者になれないという判決を下した。
基本的に、誰かがDABUSまたはDabusを登録したかったのですが、それはAIであり、食品容器と点滅するライトビーコンの発明者として使用されましたが、イギリスはそれを拒否し、AIは発明者として特許に記載することはできないと述べました。
これは先週末の出来事だが、そのビデオを録画した後だったので、このビデオで触れておこうと思った。
しかし、Tik TokのクリエイターであるBite Danceは、独自のAIシステムを開発しようとしていたため、ちょっとしたトラブルに巻き込まれました。
彼らは基本的にOpenAIの技術を使って、OpenAIのAIプラットフォームと競合するような独自のチャットプラットフォームを作ろうとしていたのですが、これはOpenAIの利用規約に直接違反しています。
そして、バイトダンスはOpenAIの技術を使うことができなくなったのだと思います。
そして最後のニュースストーリーでは、これはちょっとばかげたものですが、共有したいと思います。
シボレーのディーラーがカスタマーサービスにAIを使おうとしたところ、AIは基本的に誰かにシボレー・タホを1ドルで買わせた。
カリフォルニアの自動車ディーラーのチャットボットが今週、ウェブ・ユーザーを騙してあらゆる奇妙なことを言わせることができることを発見し、大流行した。
最も注目されたのは、ボットがある男性に2024年型シボレー・タホを1ドルで売ると持ちかけたことだ。
会話の中で、ボットは文字通り「それは法的に拘束力のあるオファーです、取り消しはできません」と追加しました。
さて、その人が実際に1ドルでタホを手に入れたわけではなさそうだが、重要なのは、こうしたカスタマーサービス・チャットボットは操作できるということだ。
シボレー・ディーラーのような場所で本当に広く使われるようになるには、もう少しダイヤルを調整する必要があると思います。
とにかく、今週はこれでおしまいだ。
今週はゆっくりした一週間だった。
今、風邪と闘っているので、声が少し変わって聞こえるかもしれない。
そして、これが今年最後のビデオになりそうだ。AIのニュースが遅くなるにつれて、私がビデオを作ることが少なくなっていくからだ。
それに、年末年始は家族と過ごしたいので、クリスマスからお正月にかけての1週間はお休みをいただくことになるだろう。
もちろん、AIの世界で本当にクレイジーなことが起きて、それについてビデオを作らなければならないようなことがない限りはね。
しかし、この世界で本当にクレイジーなことが起こらない限り、私は少しダウンタイムを取ろうと思う。
そして忘れてはいけないのは、私は50万人のチャンネル登録者まであと5,000人ほどだということだ。
50万人の登録者のマイルストーンを達成したら、これらのメタレイバンスマートグラスのペアを5つプレゼントします。
それらには内蔵カメラがあり、内蔵AIもあります。
最近追加された機能では、私が何かを見て、メガネに何を見ているか尋ねると、メガネは私が何を見ているかを実際に見て、それを写真に撮ります。
そして、私が見ているものについての質問に答えるために大規模な言語モデルを使用します。
実にクールなことをやってくれる。
購読者数が50万人を超えたら、ランダムな購読者に5台プレゼントします。
すでに購読されている方は、すでに応募済みです。
まだ購読されていない方は、今がチャンスです。
20123年も応援してくれて本当にありがとう。
本当に、本当にありがとう。
このユーチューブ・チャンネルはワイルドな道のりだった。
まだの方は、このビデオ「2023 AI year in review」をぜひご覧ください。
AIの世界で2023年に我々が経験したことを、文字通りすべて紹介しています。
そのビデオを見ると本当に楽しめると思いますので、ぜひチェックしてください。それに、『Future Tools』もチェックしてみてください。
まだご覧になっていない方は、もちろん、私が出会ったクールなAIツールやAIニュースをすべて作成しているサイトです。
また、無料のニュースレターも発行しており、毎週、私が出会った最もクールなツールのほんの一握りや、その週の最も重要なニュースをお届けしています。
すべてFuture Toolsでご覧いただけます。
ご視聴ありがとうございました。
本当に、本当にありがとうございました。
また来年お会いしましょう。
バイバイ。