【生成AIニュースまとめ】 4/14〜4/20|Instagram、ファンへの対応を自動化する機能「Creator A.I.」をテスト中
5分で生成AIを振り返られる、要約ニュースです。
2024年 4/14〜4/20のトレンド生成AIニュース総まとめ。
Instagram、インフルエンサーの「声」をAIに学習させて、ファンへの対応を自動化する機能「Creator A.I.」をテスト中
MetaのCEO、マーク・ザッカーバーグは、事業のあらゆる面にAIを統合することを推進しており、日常のタスクを助けるAIアシスタントの導入を目指している。この取り組みはGoogleやMicrosoft、OpenAIとの競争の一環である。The New York Timesによると、MetaはCreator A.I.というチャットボットを開発中で、これはインフルエンサーの声を模倣してファンと交流する。しかし、AIが不適切な応答をするリスクがあり、多くのインフルエンサーやファンはAIが人間らしい交流を損なうことを懸念している。Metaはこのチャットボットをさらに開発し、問題への対応を模索している。
https://gigazine.net/news/20240416-meta-instagram-influencers-creator-ai/
Adobe、PDF文書を要約したり内容についての質問に答えたりするAIツール「Acrobat AI Assistant」をサブスクで提供開始
Adobeは2024年4月15日に、PDF編集・閲覧ソフトウェアのAdobe AcrobatやAcrobat Readerのユーザーに対し、PDF文書を要約したり内容に関する質問に答えたりするAIツール「Acrobat AI Assistant」をサブスクリプション形式で提供すると発表した。このツールはデスクトップとブラウザで利用可能であり、早期アクセス価格は月額4.99ドルである。Adobeはこのツールによって、税務、契約の共同作業、研究論文の作成と共有など、PDFの信頼できるプラットフォームを通じて、ユーザーがドキュメントをより深く活用できるようにするとしている。
https://gigazine.net/news/20240416-adobe-acrobat-ai-assistant-pdf-summarize/
Stability AI、「Stable Diffusion 3」とチャットbot「Stable Assistant」発表
英国のStability AIは、画像生成AI「Stable Diffusion 3」と「Stable Diffusion 3 Turbo」、及びAIチャットボット「Stable Assistant」を発表した。これらは現在開発者プラットフォームでプレビュー段階にあり、新しいMultimodal Diffusion Transformerアーキテクチャを採用してテキストの理解とスペル能力を向上させている。これにより、テキストから画像への生成能力が競合他社のAIと比較しても同等またはそれ以上であるとしている。一般公開は控え、専門家と連携してさらなるモデルの改善を目指す。
https://www.itmedia.co.jp/news/articles/2404/18/news099.html
Adobe Premiere Pro、生成AIで「映像内のオブジェクト追加・削除」「フレームの追加」「映像素材の生成」を実行する機能が搭載予定
Adobeは2024年後半にPremiere Proに新たな生成AI機能を導入すると発表した。この機能には、Firefly Video Modelと他社製AIモデルが含まれ、映像の編集拡張、オブジェクトの追加・削除、テキストからのBロール生成が可能となる。これにより、映像編集の自動化とクリエイティビティが向上する。さらに、2024年5月には新しいAIオーディオ編集機能も導入される。これらの機能は、Adobeの透明性と信頼性を高めるContent Credentialsを通じて提供される。Premiere Proの新機能により、動画制作のワークフローが効率化され、編集プロセスがよりスムーズになることが期待される。
https://gigazine.net/news/20240416-adobe-premiere-pro-with-ai-firefly/
イーロン・マスク、マルチモーダルAI「Grok-1.5」を発表、「GPT-4V」や「Gemini Pro 1.5」に匹敵する性能
イーロン・マスク氏が設立したAI企業「xAI」が新型マルチモーダルAIモデル「Grok-1.5」を発表した。このモデルは画像の理解が可能で、フローチャートを解析してコードを生成したり、栄養成分表示を見てカロリーを計算する機能を持つ。Grok-1.5は現在既存ユーザーと選ばれたテスターによるテスト段階にあり、一般公開に先立って性能を評価している。さらに、xAIは新しいベンチマーク「RealWorldQA」を導入し、765枚の画像とそれに基づく質問を含むこのベンチマークを通じて、モデルの空間認識能力を評価している。Grok-1.5は、複数のベンチマークで他のAIモデルよりも優れたスコアを記録しており、その進歩が示されている。
https://gigazine.net/news/20240415-grok-1-5-xai-multimodal-ai/
Google、無限の長さのテキストを処理できる新技術「Infini-attention」発表
Googleの研究者が、大規模言語モデル(LLM)が無限の長さのテキストを処理できる新技術「Infini-attention」を発表した。これは、AIのコンテキストウインドウの限界を克服し、トークンの量を効率的に増やすことでモデルのパフォーマンスを向上させるものである。この技術は、圧縮メモリを活用し、長期間にわたる注意機構と局所的な注意機構を組み合わせた単一のTransformerブロックを構築する。実験によると、Infini-attentionを利用したモデルは従来のベースラインモデルよりも優れた成績を示し、理論的には任意の長さのトークンを同じレベルの品質で処理できる可能性がある。
https://gigazine.net/news/20240415-google-llm-infini-attention/
Meta、AIアシスタント「Meta AI」をInstagramやMessengerでロールアウト
米Metaは4月18日、英語版のAIアシスタント「Meta AI」をInstagram、Facebook、Messenger、WhatsAppに北米やシンガポールを含む数十カ国で導入すると発表した。このアシスタントは、新版LLM「Llama 3」に基づいて構築され、Google検索やMicrosoft Bingの情報をリアルタイムで統合する。また、Meta AIはWebサイトmeta.aiやMetaスマートグラスでも利用可能で、画像生成機能「Imagine」を提供し、ユーザーがリアルタイムで画像を生成、アニメーション化しGIFとして保存、共有できるようになる。
https://www.itmedia.co.jp/news/articles/2404/19/news094.html
「Amazon Music」、AIによるプレイリスト作成機能「Maestro」を提供へ
Amazonは、Amazon MusicでAIによるプレイリスト作成機能「Maestro」を提供開始すると発表した。この機能は、米国のiOSおよびAndroidユーザーを対象にベータ版が先行提供され、ユーザーはテキストや絵文字をプロンプトとして利用できる。Amazon Musicは広告付きのFreeプランから、Prime加入者向けのPrime、高品質のUnlimitedプランまで、さまざまなオプションを提供している。この新技術は不適切なプロンプトをブロックする仕組みも備えているが、完璧に動作する保証はないとしている。
https://japan.cnet.com/article/35217870/
Google、ハードウェアとAIの部門を再編 トップはオステルロー氏に
Googleのスンダー・ピチャイCEOは、AI、ハードウェア、ソフトウェアの融合によってコンピューティングの未来を形成するための大規模な部門再編を発表した。Pixel、Android、Chrome、Googleフォトなどを担当していたDSPAとP&Eを統合し、新たなPlatforms & Devicesチームを設立する。この新チームのトップには、リック・オステルロー上級副社長が就任する。また、ヒロシ・ロックハイマー氏は新プロジェクトに取り組むとともに、日本担当のエグゼクティブスポンサーを務める。新チームでは、Google Researchから画像解析や端末上AIを担当するメンバーも参加予定である。この再編により、AIイノベーションの加速と、Qualcommとの戦略的コラボレーションが期待される。
https://www.itmedia.co.jp/news/articles/2404/19/news117.html
Meta、無料で商用可の新LLM「Llama 3」、ほぼすべてのクラウドでアクセス可能に
Metaは、オープンソースのLLM「Llama 3」を発表した。この新モデルには80億パラメータと700億パラメータのバージョンがあり、主要なクラウドプラットフォームで利用可能になる。Llama 3は、先代のLlama 2に比べ、トレーニングデータセットが7倍大きく、4倍のコードが含まれており、非英語データも5%以上を占める。これにより、モデルの応答の多様性と精度が向上し、誤った拒否率が減少した。また、推論やコード生成などの機能も改善された。このモデルは、複数のベンチマークで他のオープンモデルを上回るパフォーマンスを示している。さらに、MetaはこのAIを自社のプラットフォームにも導入し、将来的には様々なハードウェアプラットフォームでの利用も計画している。
https://www.itmedia.co.jp/news/articles/2404/19/news095.html
Microsoft、UAEのAI企業G42に15億ドル投資。スミス副会長を取締役として派遣
米Microsoftは4月16日、アラブ首長国連邦(UAE)のAI企業G42への15億ドルの戦略的投資を発表した。この投資により、MicrosoftとG42は、UAEを含む世界各国でAIの導入と展開を強化する。G42はこの提携を通じて、自社のAIアプリケーションとサービスをMicrosoft Azureプラットフォーム上で展開し、グローバル市場に提供する。さらに、Microsoftのブラッド・スミス副会長兼プレジデントがG42の取締役会に加わる。スミス氏は、UAEと米国の両政府と協力して、信頼できるAI技術と国際基準を推進する意向を表明している。
https://www.itmedia.co.jp/news/articles/2404/16/news167.html
「2025~2026年にはAIモデルの学習費用が1兆円を超えて人類に脅威をもたらすAIが登場する」とAI企業・AnthropicのCEOが予言
AI技術の発展には膨大な計算資源が必要である。特に、大規模言語モデルやマルチモーダルAIモデルを学習させるためには、高価なGPUやAIアクセラレータが必須である。これらのチップは性能が高いが、そのコストも非常に高い。例えば、NVIDIA製のAI特化GPU「H100」の価格は1台あたり約2万5000ドルにものぼる。これにより、GoogleやAmazonといった大企業が数万台、MetaやMicrosoftが数十万台のH100を購入している。AnthropicのCEOダリオ・アモデイ氏は、AIモデルの学習コストが今後数年で約100億ドルに達すると推測しており、これによってAIの安全性に対する懸念も高まっている。
https://gigazine.net/news/20240416-anthropic-ceo-ai-training-cost/
▼X(twitter)のポストまとめ
以上、先週の振り返りニュースでした。
毎週配信しています✨ ↓
XではリアルタイムでAIに関する情報を発信しています☺︎📝✨
👉https://twitter.com/kurayu_yuki
この記事が気に入ったらサポートをしてみませんか?