【生成AIニュースまとめ】 4/14〜4/20｜Instagram、ファンへの対応を自動化する機能「Creator A.I.」をテスト中

2024年4月21日 23:55

5分で生成AIを振り返られる、要約ニュースです。
2024年 4/14〜4/20のトレンド生成AIニュース総まとめ。

Instagram、インフルエンサーの「声」をAIに学習させて、ファンへの対応を自動化する機能「Creator A.I.」をテスト中

MetaのCEO、マーク・ザッカーバーグは、事業のあらゆる面にAIを統合することを推進しており、日常のタスクを助けるAIアシスタントの導入を目指している。この取り組みはGoogleやMicrosoft、OpenAIとの競争の一環である。The New York Timesによると、MetaはCreator A.I.というチャットボットを開発中で、これはインフルエンサーの声を模倣してファンと交流する。しかし、AIが不適切な応答をするリスクがあり、多くのインフルエンサーやファンはAIが人間らしい交流を損なうことを懸念している。Metaはこのチャットボットをさらに開発し、問題への対応を模索している。
https://gigazine.net/news/20240416-meta-instagram-influencers-creator-ai/

Adobe、PDF文書を要約したり内容についての質問に答えたりするAIツール「Acrobat AI Assistant」をサブスクで提供開始

Adobeは2024年4月15日に、PDF編集・閲覧ソフトウェアのAdobe AcrobatやAcrobat Readerのユーザーに対し、PDF文書を要約したり内容に関する質問に答えたりするAIツール「Acrobat AI Assistant」をサブスクリプション形式で提供すると発表した。このツールはデスクトップとブラウザで利用可能であり、早期アクセス価格は月額4.99ドルである。Adobeはこのツールによって、税務、契約の共同作業、研究論文の作成と共有など、PDFの信頼できるプラットフォームを通じて、ユーザーがドキュメントをより深く活用できるようにするとしている。
https://gigazine.net/news/20240416-adobe-acrobat-ai-assistant-pdf-summarize/

Stability AI、「Stable Diffusion 3」とチャットbot「Stable Assistant」発表

英国のStability AIは、画像生成AI「Stable Diffusion 3」と「Stable Diffusion 3 Turbo」、及びAIチャットボット「Stable Assistant」を発表した。これらは現在開発者プラットフォームでプレビュー段階にあり、新しいMultimodal Diffusion Transformerアーキテクチャを採用してテキストの理解とスペル能力を向上させている。これにより、テキストから画像への生成能力が競合他社のAIと比較しても同等またはそれ以上であるとしている。一般公開は控え、専門家と連携してさらなるモデルの改善を目指す。
https://www.itmedia.co.jp/news/articles/2404/18/news099.html

Adobe Premiere Pro、生成AIで「映像内のオブジェクト追加・削除」「フレームの追加」「映像素材の生成」を実行する機能が搭載予定

Adobeは2024年後半にPremiere Proに新たな生成AI機能を導入すると発表した。この機能には、Firefly Video Modelと他社製AIモデルが含まれ、映像の編集拡張、オブジェクトの追加・削除、テキストからのBロール生成が可能となる。これにより、映像編集の自動化とクリエイティビティが向上する。さらに、2024年5月には新しいAIオーディオ編集機能も導入される。これらの機能は、Adobeの透明性と信頼性を高めるContent Credentialsを通じて提供される。Premiere Proの新機能により、動画制作のワークフローが効率化され、編集プロセスがよりスムーズになることが期待される。
https://gigazine.net/news/20240416-adobe-premiere-pro-with-ai-firefly/

イーロン・マスク、マルチモーダルAI「Grok-1.5」を発表、「GPT-4V」や「Gemini Pro 1.5」に匹敵する性能

イーロン・マスク氏が設立したAI企業「xAI」が新型マルチモーダルAIモデル「Grok-1.5」を発表した。このモデルは画像の理解が可能で、フローチャートを解析してコードを生成したり、栄養成分表示を見てカロリーを計算する機能を持つ。Grok-1.5は現在既存ユーザーと選ばれたテスターによるテスト段階にあり、一般公開に先立って性能を評価している。さらに、xAIは新しいベンチマーク「RealWorldQA」を導入し、765枚の画像とそれに基づく質問を含むこのベンチマークを通じて、モデルの空間認識能力を評価している。Grok-1.5は、複数のベンチマークで他のAIモデルよりも優れたスコアを記録しており、その進歩が示されている。
https://gigazine.net/news/20240415-grok-1-5-xai-multimodal-ai/

Google、無限の長さのテキストを処理できる新技術「Infini-attention」発表

Googleの研究者が、大規模言語モデル（LLM）が無限の長さのテキストを処理できる新技術「Infini-attention」を発表した。これは、AIのコンテキストウインドウの限界を克服し、トークンの量を効率的に増やすことでモデルのパフォーマンスを向上させるものである。この技術は、圧縮メモリを活用し、長期間にわたる注意機構と局所的な注意機構を組み合わせた単一のTransformerブロックを構築する。実験によると、Infini-attentionを利用したモデルは従来のベースラインモデルよりも優れた成績を示し、理論的には任意の長さのトークンを同じレベルの品質で処理できる可能性がある。
https://gigazine.net/news/20240415-google-llm-infini-attention/

Meta、AIアシスタント「Meta AI」をInstagramやMessengerでロールアウト

米Metaは4月18日、英語版のAIアシスタント「Meta AI」をInstagram、Facebook、Messenger、WhatsAppに北米やシンガポールを含む数十カ国で導入すると発表した。このアシスタントは、新版LLM「Llama 3」に基づいて構築され、Google検索やMicrosoft Bingの情報をリアルタイムで統合する。また、Meta AIはWebサイトmeta.aiやMetaスマートグラスでも利用可能で、画像生成機能「Imagine」を提供し、ユーザーがリアルタイムで画像を生成、アニメーション化しGIFとして保存、共有できるようになる。
https://www.itmedia.co.jp/news/articles/2404/19/news094.html

「Amazon Music」、AIによるプレイリスト作成機能「Maestro」を提供へ

Amazonは、Amazon MusicでAIによるプレイリスト作成機能「Maestro」を提供開始すると発表した。この機能は、米国のiOSおよびAndroidユーザーを対象にベータ版が先行提供され、ユーザーはテキストや絵文字をプロンプトとして利用できる。Amazon Musicは広告付きのFreeプランから、Prime加入者向けのPrime、高品質のUnlimitedプランまで、さまざまなオプションを提供している。この新技術は不適切なプロンプトをブロックする仕組みも備えているが、完璧に動作する保証はないとしている。
https://japan.cnet.com/article/35217870/

Google、ハードウェアとAIの部門を再編　トップはオステルロー氏に

Googleのスンダー・ピチャイCEOは、AI、ハードウェア、ソフトウェアの融合によってコンピューティングの未来を形成するための大規模な部門再編を発表した。Pixel、Android、Chrome、Googleフォトなどを担当していたDSPAとP&Eを統合し、新たなPlatforms & Devicesチームを設立する。この新チームのトップには、リック・オステルロー上級副社長が就任する。また、ヒロシ・ロックハイマー氏は新プロジェクトに取り組むとともに、日本担当のエグゼクティブスポンサーを務める。新チームでは、Google Researchから画像解析や端末上AIを担当するメンバーも参加予定である。この再編により、AIイノベーションの加速と、Qualcommとの戦略的コラボレーションが期待される。
https://www.itmedia.co.jp/news/articles/2404/19/news117.html

Meta、無料で商用可の新LLM「Llama 3」、ほぼすべてのクラウドでアクセス可能に

Metaは、オープンソースのLLM「Llama 3」を発表した。この新モデルには80億パラメータと700億パラメータのバージョンがあり、主要なクラウドプラットフォームで利用可能になる。Llama 3は、先代のLlama 2に比べ、トレーニングデータセットが7倍大きく、4倍のコードが含まれており、非英語データも5％以上を占める。これにより、モデルの応答の多様性と精度が向上し、誤った拒否率が減少した。また、推論やコード生成などの機能も改善された。このモデルは、複数のベンチマークで他のオープンモデルを上回るパフォーマンスを示している。さらに、MetaはこのAIを自社のプラットフォームにも導入し、将来的には様々なハードウェアプラットフォームでの利用も計画している。
https://www.itmedia.co.jp/news/articles/2404/19/news095.html

Microsoft、UAEのAI企業G42に15億ドル投資。スミス副会長を取締役として派遣

米Microsoftは4月16日、アラブ首長国連邦（UAE）のAI企業G42への15億ドルの戦略的投資を発表した。この投資により、MicrosoftとG42は、UAEを含む世界各国でAIの導入と展開を強化する。G42はこの提携を通じて、自社のAIアプリケーションとサービスをMicrosoft Azureプラットフォーム上で展開し、グローバル市場に提供する。さらに、Microsoftのブラッド・スミス副会長兼プレジデントがG42の取締役会に加わる。スミス氏は、UAEと米国の両政府と協力して、信頼できるAI技術と国際基準を推進する意向を表明している。
https://www.itmedia.co.jp/news/articles/2404/16/news167.html

「2025～2026年にはAIモデルの学習費用が1兆円を超えて人類に脅威をもたらすAIが登場する」とAI企業・AnthropicのCEOが予言

AI技術の発展には膨大な計算資源が必要である。特に、大規模言語モデルやマルチモーダルAIモデルを学習させるためには、高価なGPUやAIアクセラレータが必須である。これらのチップは性能が高いが、そのコストも非常に高い。例えば、NVIDIA製のAI特化GPU「H100」の価格は1台あたり約2万5000ドルにものぼる。これにより、GoogleやAmazonといった大企業が数万台、MetaやMicrosoftが数十万台のH100を購入している。AnthropicのCEOダリオ・アモデイ氏は、AIモデルの学習コストが今後数年で約100億ドルに達すると推測しており、これによってAIの安全性に対する懸念も高まっている。
https://gigazine.net/news/20240416-anthropic-ceo-ai-training-cost/

▼X(twitter)のポストまとめ

よっしゃ！3日でハックした。

・動画生成：Haiper AI
・固定画像：Midjourney
・台本：GPTs
・プロンプト：GPTs
・音楽：SunoAI
・編集：CupCut

美女は顔崩れるので、
後ろ姿とかがおすすめ。

ちなみに作業時間20分。
↓ pic.twitter.com/seijkU2spM
— こはく@AIを図解×動画にする人 (@Kohaku_NFT) April 15, 2024

【⚡️超朗報：OpenAIの動画生成AI「Sora」が年内にAdobe Premier Proで使用可能に】

これはAdobeが最強になるな。

動画編集中に

・障害物を消す
・アイテムを変更する
・背景を変える
・動画を生成する

など

複数の生成AIを活用して、テキストだけで自由に編集できる模様。… pic.twitter.com/XEVedA0JCU
— チャエン | 重要AIニュースを毎日発信⚡️ (@masahirochaen) April 16, 2024

Premiere Pro＋生成AI（Firefly）
ゲームチェンジャー、来ました！

☑ ここにコレを足したい
☑ ここのコレを消したい
☑ フッテージを伸ばしたい
☑ テキストから動画を生成したい（ChatGPT、Runway）

さらに上記を非破壊で!!!

※リリースは2023年中。https://t.co/Lxq4PfYHox pic.twitter.com/DLiOktoAyP
— DTP Transit (@DTP_Transit) April 15, 2024

粘土を捏ねると形に応じてギリシャ彫刻のようなビジュアルに常に変化する生成AI👀‼️pic.twitter.com/1Yg59Q8rES
— らんまる👀✨ (@Sg3Lu) April 16, 2024

動画生成AI「Haiper AI」はアニメもハイクオリティー！！

Soraに最も近いAIと話題ですが、実写だけでなくアニメ作品も高精度で動画化されています。

いずれ有料化されると思うので、無料のうちに使い倒しましょう！！pic.twitter.com/dhDawPGnnf
— ハルオミ (@HaruAiman) April 16, 2024

AIが作った案を参考にデザイナーが商品デザインを完成させたとのこと。これを見るとAIのデザインの方向はそのままに野暮ったさをデザイナーが補正調整しているようなイメージでしょうか。

マンダムが『パッケージデザイン用生成AI』を活用し商品開発 https://t.co/1fQ6Hcu6cZ pic.twitter.com/WDD9yJLuRd
— 金成奎 (@seikei_kin) April 17, 2024

Microsoftが人の静止画1枚と音源データから、その静止画の人物が自然な表情で話す動画を生成できる「VASA-1」を発表。

生成結果のクオリティ高いし、なにより動画後半の「生成された人物を左右上下好きなアングルから切り替え」ができる凄すぎる。… pic.twitter.com/yjPJFByyN7
— KAJI | 梶谷健人 / 新刊「生成AI時代を勝ち抜く事業・組織のつくり方」発売！ (@kajikent) April 18, 2024

生成AIが描いた「デジタル庁の職員が日本のデジタル化について会議室で議論している様子」。 pic.twitter.com/OSTs35N3GD
— 河野太郎 (@konotarogomame) April 18, 2024

生成AIがついに動画編集にも。最新バージョンのAdobe Premierに生成AI機能が実装され、ついに手軽に動画でも自由にオブジェクトの追加・削除・編集が可能になった。いよいよ画面の中は何も信じられない世界が到来。SFX系の業者も厳しくなるかも。 pic.twitter.com/VoEzXe8uJO
— Brandon K. Hill | CEO of btrax 🇺🇸x🇯🇵/2 (@BrandonKHill) April 18, 2024

【もうChatGPTに課金しなくも良い？】無料で複数のAIモデルが使えるアプリが登場。

遂に、iOSアプリ版HuggingChatが公開。

これでスマホで複数の無料オープンソースのモデルを利用できる。

Gemini Pro 1.5やClaude 3 Sonnetにより高精度のLlama 3も使える。

使わない理由はない。 pic.twitter.com/nKTxGExpZI
— チャエン | 重要AIニュースを毎日発信⚡️ (@masahirochaen) April 19, 2024

本当にヤバいAIが出てきた...

1枚の写真を動画化できるAIはいいぞ...

確実に今後の画像生成業界を変えるツール。pic.twitter.com/WxaizNyQJ1
— あるる ChatGPT × AIツール (@chatgptair) April 19, 2024

ついにMeta AIがサイト上で簡単に使えるように！
ㅤ
・ChatGPTライクなUIで、同じ要領で使いやすい✨
・まさかの「Webサーチ」機能にも対応
・「画像生成」もサイト上でできる！
ㅤ
やばいのが完全無料で使えちゃうところなので、GPTに課金してないライトユーザーにオススメ
ㅤ
ただ注意点もあって、 pic.twitter.com/gXRtdggOcf
— すぐる | ChatGPTガチ勢 𝕏 (@SuguruKun_ai) April 19, 2024

llama3 70b & Groq pic.twitter.com/LCIswYpZ5O
— 元木大介@生成AI塾&Arbor言語開発者 (@ai_syacho) April 19, 2024

以上、先週の振り返りニュースでした。
毎週配信しています✨ ↓

XではリアルタイムでAIに関する情報を発信しています☺︎📝✨
👉https://twitter.com/kurayu_yuki

この記事が気に入ったらサポートをしてみませんか？