この動画は、AI関連のニュースを紹介しています。OpenAIのChat GPTの運営コストや利用者数の変動、2024年末の破産の可能性、AmazonやGoogleのAI活用の取り組み、OpenAIのGPT 4 APIの発表、そして「Be Fake」アプリの立ち上げなどが報告されています。さらに、AI Botsによるキャプチャの解読能力の向上も取り上げられています。
公開日:2023年8月20日
※動画を再生してから読むのがオススメです。
ちょうどLAで開催された人工知能の会議から帰ってきたばかりで、素晴らしいイベントでした。
しかし、今はニュースに入る準備ができています。
今週、ChatGPTの1日のコストが70万ドルであるという報告が出ました。
おそらく、MicrosoftがOpenAIに100億ドルを投資していることが、現時点で会社を浮かせている要因です。
しかし、ChatGPTのピーク時から、ユーザー数は毎月着実に減少しています。
ただし、これらは学生が学校を休んでいる夏の月でした。
したがって、学校が再開する今、ChatGPTの利用が再び増加するかどうかは興味深いです。
ただし、businessstandard.comに掲載されているこの報告書によれば、OpenAIは利益を上げない限り、2024年末までに破産する可能性があるとされています。
そして、Microsoftが彼らへの資金供給を停止した場合。
最近、Amazonは生成AIを使って顧客レビューの体験を改善し続けると発表しました。
現在、これは米国の一部のモバイルショッパーに対して、幅広い製品カテゴリーで展開されています。
このスクリーンショットで見るように、特定の製品に関する顧客レビューの要約のように見えるAIによるレビューが表示されています。
また、パフォーマンス、使いやすさ、安定性など、さまざまな製品に関する一般的な検索事項に対するボタンも追加されています。
そして、それをクリックして、その製品の特定のポイントについてユーザーがどのように言っているかを把握することができます。
例えば、「使いやすさ」をクリックすると、AIが生成した「使いやすさ」に関するレビューの要約が表示されます。
それはかなり便利になるようです。
しかし、今のようにアマゾンのレビューをゲーム化する人が増え続ければ、ゲーム化された要約が出来上がるだけだ。
アマゾンがこの問題にどう対処するか見ものだ。
また今週、グーグルはジェネレーティブ検索をアップデートし、特定の単語にカーソルを合わせると、その単語の定義を表示するようにした。
また、読んでいる記事の要約を生成して、その記事に何が書かれているのかを素早く知ることもできる。
また、コーディング機能もアップデートされた。
すでにジェネレーティブ検索エクスペリエンスにアクセスしているのであれば、これらの新機能にもアクセスできるはずだ。
ただし、Chromeの最新バージョンにアップデートしていることを確認する必要がある。
ただし、この要約機能はChromeのiOSアプリとAndroidアプリでのみ利用できる。
Chromeブラウザではまだ利用できない。
その他のGoogleニュースとしては、GoogleフォトにAIアップデートが追加された。
Googleフォトを使っている人なら、過去のこの日の思い出が蘇るのを見たことがあるだろう。
今回、新しい思い出ビューが追加された。
これは、AIの助けを借りて自動的にキュレーションされ、整理された思い出の家だ。
これにより、最も思い出深い旅行、お祝い、日々の瞬間を簡単に追体験し、カスタマイズし、大切な人と共有することができる。
今週から米国で展開が開始され、今後数カ月で全世界で利用可能になる予定だ。
AIを使って思い出の名前を変更することができるので、写真を見て、砂漠の冒険のような思い出のタイトルを提案してくれる。
そして、過去に撮影した写真を再び見ることがほとんどないでしょうから、全体的に見ても写真の再発掘が容易になるはずですよね?
このようなものがあれば、それらの写真に再び目を向けることができるだろう。
今週、OpenAIは新しいGPT-4 APIの機能を発表しました。それにより、実際にGPT-4をモデレーションに使用することができます。
通常、コンテンツポリシーの変更は、多数の人間のモデレーターを訓練する必要があるため、展開に数ヶ月かかることがあります。
これに対してGPT-4は、そのサイクルを数時間に短縮し、柔軟性も大幅に向上します。
私たちのビジョンは、コンテンツがどんどんスケールしていく中で、人間がガイドするAIがより安全な環境を作り出せる世界です。
つまり、彼らのAPIを使ってコミュニティのモデレーション・ツールなどを構築することで、時間を解放し、人間のモデレーターが捕捉できないようなものを捕捉できるようになるということです。
また、今週のOpenAIのニュースとして、OpenAIはGlobal Illuminationを買収した。
チーム全体がOpenAIに加わり、ChatGPTを含むコアプロダクトに取り組むという短いプレスリリースが彼らのウェブサイトに掲載されています。
現在、Global IlluminationチームがOpenAIのために何をしようとしているのか、実際のところはわかりませんが、わかっているのは、彼らが過去にゲームを作ってきたということです。たとえば、このBiomesというゲームは、ちょっと覗いてみると、Minecraftやサンドボックスゲームにとても似ています。
OpenAIがゲームの世界に参入しようとしているのか、それともOpenAIが単に彼らの開発チームのファンで、代わりに彼らの開発チームにChatGPTに取り組んでほしかっただけなのか。
ゲームといえば、Take-TwoがAI GTA 5 modを閉鎖した。
GTA 5のプレイアブルMODでは、インワールドAIのキャラクター・スピーチ生成ツールを使って、Grand Theft Autoの中を歩き回って、実際に他のキャラクターと会話することができ、それらのキャラクターはAIを使ってあなたに反応します。
グランド・セフト・オート』の世界のキャラクターと会話ができるのだ。
テイクツーはグランド・セフト・オートの生みの親であるロックスター・ゲームスを所有する会社で、テイクツー・ゲームスはこのMODを何の理由もなく削除したようだ。
私が知る限り、このMODはグランド・セフト・オートやYouTubeのポリシーに違反していない」とMODの作成者は語っている。これは、このMODをプレイする人々がYouTube動画を作成し、そのうちのいくつかはYouTubeから削除されていることを指している。
しかし、現時点では、MODが削除された理由や、MODの作成者によって実際にどのようなルールが破られたのかについての公式発表はない。
また今週、Fireflyを組み込んだAdobe Expressが世界中で無料で利用できるようになった。
adobe.com/expressにアクセスし、Get Express for Freeをクリックすれば、テキスト画像ジェネレーターやテキストエフェクトジェネレーターなど、さまざまな作成ツールを使うことができる。
彼らはAIの背景除去機能なども持っています。
Adobe Fireflyのお気に入りの機能のひとつに、AIを使ってテクスチャを生成するテクスチャリング機能があります。
例えば、このようなテキストを画面上に配置し、黒光りする金属と入力して生成をクリックします。
すると、すべてのテキストが光沢のあるブラックメタルのエフェクトに変わります。
でも、Adobe Fireflyを完全に無料で使うこともできるし、テキストから画像へのジェネレーターを使って、思いつく限りの画像を生成することもできる。
世界中で今すぐ無料で利用できるようになったのは、とてもクールなことだ。
Gen1やGen2の開発元であるRunwayは、クールなビデオからビデオへのエフェクト作成ツールであり、テキストからビデオ、画像からビデオへのエフェクト作成ツールでもある。
ランウェイのアカウントに飛び込むと、左側にWatchという新しいボタンがあるのがわかる。
RunwayMLで作られたクールなビデオをチェックできる。
例えば、友人のアマルが作ったEchoes of the Valleyのビデオ。
本当に素晴らしく、本当によくできている。
でも、インスピレーションが必要だったり、みんながRunwayを使って作ったクールなものを見たい場合は、アカウントにログインしてください。
このWatch機能は無料で利用できると思います。
今週、AP通信もジャーナリスト向けのAIガイドラインを設定した。
AP通信の一員であるジャーナリストは、OpenAIの使用は許可されているが、出版可能なコンテンツを作成するために使用することはできないというガイドラインに従うべきである。
生成AIからの出力は、未検証のソースとして扱われるべきである。
つまり、AIが何を言おうと、それを吟味する必要があるということだ。
いずれにせよ、ジャーナリストはジェネレーティブAIを使って写真の要素を変更することは許されない。
また、現実の虚偽描写であることが疑われる、あるいは証明されたAI生成画像を送信することも許されていない。
ただし、AIが生成したイラストや芸術作品がニュース記事の主題である場合は、それを使用することができる。
彼らが懸念しているのは、ジェネレーティブAIによって、人々が意図的に誤った情報を広めることが容易になるということだ。
これらのガイドラインを読むと、真面目に受け止められたいコンテンツをオンラインで作成する人にとっては、かなり堅実なガイドラインだと言える。
偽の画像を本物の画像と見せかけないこと。
意図的に誤った情報を広めようとしないこと。
そして、もしAIを使ってコンテンツを作成するのであれば、それを下書きとして使い、すべての情報が実際に正確かどうかを必ずチェックすること。
誰にとっても良いアドバイスだろう。
今週、元社員が新しいAI企業を立ち上げるという一連の発表もありました。
例えば、グーグルのかつてのCEO、エリック・シュミットは新しいAI会社を立ち上げる。
彼の新会社は、OpenAIが元々目指していたものをモデル化することを目的としており、AIを科学的ブレークスルーのために利用することを目的とした非営利団体である。
彼は、OpenAIが営利企業になる前に掲げていた最初の理想を持つような、トップクラスのAI科学者たちをこの会社に引き入れたいと考えている。
元グーグルの研究者2人も、サカナAIという新しいスタートアップを設立した。
この会社は、2017年に「Attention is All You Need」という画期的な論文を共同執筆したLeon Jonesによって設立された。
また、以前はStability AIの主任研究員であり、以前はGoogle Brainで働いていたDavid Haも共同設立した。
彼らは東京で会社を設立し、生成AIに対して異なるアプローチを取りたいと考えている。
この新しいモデルは、単一の大きな言語モデルを使う代わりに、複雑な結果を出すために、群れのように協力する多数の小さなAIモデルを作りたいと主張している。
いずれは、テキスト、画像、コード、マルチメディアコンテンツを生成するモデルを作成するOpenAIのような企業に取って代わる存在になるかもしれない。
Machine Zoneの元CEOは、会社を辞めて新しいAI会社を立ち上げるというテーマに沿って、BeFakeという新しいAIベースのソーシャルメディアアプリを立ち上げている。
現在、Machine Zoneは、プレミアムで、ゲームにあらゆる種類の有料アップグレードがあるモバイルアプリゲームを作ることで有名な会社である。
この新しいアプリは、自分の写真を撮り、それを生成AIで実際に変換し、実生活の自撮り写真の代わりに偽の写真を投稿するように設計されている。
偽の人生を共有することを奨励するソーシャルメディアアプリなのだろう。
そして今週は、AIボットが人間の脳と視覚を模倣することに長けているため、キャプチャが役に立たないという興味深い研究結果が発表された。
キャプチャーとは、バスや自転車などの画像をクリックするよう要求される厄介なものだ。
で、全部クリックすると、また別のページが表示され、そこでまたクリックしなければならない。
そして、あなたは、それらが迷惑だとわかっています。
近い将来、AIがそれを解決してくれるから、それらはまったく無意味なものになるだろう。
ご存じないかもしれませんが、captchaとは、コンピューターと人間を区別するための、完全に自動化された公開階層テストの略です。
もしあなたが私のように、それが頭字語であることさえ知らなかったとしても、今ならわかるだろう。
このAIボットが実際にキャプチャを破ることができるという事実は、ある意味大きなリスクだ。
もしウェブサイトをブルートフォース(総当たり)でクラックし、キャプチャを解くことができる自律型ボットが作られたら、多くのウェブサイトが大混乱に陥る可能性がある。
私たちは、ある種の新しい人間性の証明を本当に素早く考え出さなければならないだろう。
そして、私はニュースではないと思っていたのだが、他のAIの人たちがそれについて話しているのを見たので、私もそれについて話そう。
SnapchatのAIチャットボットが今週不具合を起こし、壁と天井の角のようなランダムなストーリーを投稿した。
人々が実際にSnapchatsのmy AIとチャットしようとしたところ、反応がなかったのだ。
しかし、Snapchatの広報担当者は、「一時的な障害が発生しましたが、すぐに解決しました。
というわけで、私見ではあるが、ニュースではないようなものだ。
数週間前に、NVIDIAの技術であるneuroangeloについて話しました。それは完全にNerfではありませんが、非常に似た技術を使用しています。
ネルフとは違いますが、ネルフに非常によく似た技術を使っています。ある場所や物体の周りの画像をたくさん撮ると、それが実際に3D画像になります。
そしてニューロアンジェロでは、実際に滑らかなまとまりのある画像を作成する。
このニューロアンジェロ・テクノロジーは現在NVIDIAによって提供されており、必要であればダウンロードして自分のローカルマシンで実行することができます。
同様の流れで、Luma AIはフライスルーを発表したばかりだ。
これはモバイルアプリで、実際に歩き回り、その場所のビデオを撮影するだけで、その場所を3Dのネルフに変え、ドローンカメラがその場所を飛び回っているように見せることができる。
今のところ、非常に限定的だ。
カメラやスピードをコントロールしたり、映像のキーフレームを設定したりすることはできません。
実際には、カメラに映したものがそのまま表示され、ドローン撮影のようなものに変わるだけだ。
しかし、時間が経てば、これは非常に興味深いものになるでしょう。実際に家の中をバーチャルに歩いたり、作成した3Dの部屋の中で一人称視点でキャラクターを動かしたりできるようなものに変えていくつもりなのでしょう。
ルマ・ラボの通常のAIツールを使えば、すでにこのようなことができる。
しかし、このフライ・スルー・ツールは、今のところ、不動産や家の紹介などに向けたものです。
しかし、この技術は本当にクールだ。
それは見て、どのように展開するかを見るのが楽しいものになるでしょう。
アップルストアで今すぐダウンロードしてiPhoneで使うことができる。
近い将来、アンドロイドでも使えるようになると思う。
しかし、もしあなたがiPhoneを持っているなら、今すぐ無料でダウンロードして遊ぶことができる。
それが今日の私の提供です。
ここ数週間、私は非常に限られたカンファレンスに多くの時間を費やしてきた。
シググラフにも行った。
人工のカンファレンスにも行った。
ポッドキャストにもたくさん出演した。
会議にもたくさん出席した。
そして、実際には過去数週間、このYouTubeチャンネルで週に2本の動画しか投稿していませんでした。
またもっと増やしたい。
動画のアイデアはたくさんあるんだ。
ただ、出張が多くて、いろいろなカンファレンスに行っているんだ。
でも、スケジュールは完全にクリアした。
カンファレンスとかポッドキャストとか、みんなから頼まれることを断るのがうまくなってきた。
私は頭を下げて、ただクールなAIコンテンツを作ることに集中し、研究に没頭し、新しいツールについて深く学び、Future toolsのウェブサイトを更新し、より良いビデオやAIのチュートリアル、ニュース、研究のブレークスルーなど、数ヶ月前にやっていたクールなものすべてを作っていくつもりだ。
私は、そのようなスタイルのビデオを作ることに再び軌道に乗せるつもりです。私は、ビデオのために持っているいくつかのものといくつかのアイデアを共有することに興奮しています。
もしあなたがまだ購読していないなら、このチャンネルに購読し、この動画にいいねをして、本当に本当に助かるのは、小さなベルの通知ボタンをクリックしていただくことです。
そうすれば、私が新しいビデオを公開するたびに、YouTubeのフィードに表示されるようになります。
登録するだけで、YouTubeはルールを変えたようなものです。
購読しても動画は自動的に表示されません。
確実に見たければ、ベルを押す必要がある。
しかし、私はクールなAIの動画を増やす予定ですし、これまでに参加したこれらのカンファレンスからはたくさんのクールなものが進行中です。
私が参加したこれらのカンファレンスから、たくさんのクールなものが生まれています。驚くべき、素晴らしいAIツールやテクノロジーが、本当に間もなくリリースされる予定です。
だから、近い将来にそれを期待している。
まだの方は、「いいね!」と「購読」をお願いします。
本当にありがとう。
futuretools.ioをチェックしてね。
AIに興味があるなら、クールなものがたくさんあるよ。
それが私が持っている全てです。
とりとめもなく話してしまった。
ありがとう。
また次のビデオで。
ではまた。 ありがとう。