【生成AIニュースまとめ】 2/25〜3/2｜Adobeが音楽生成AI『Project Music GenAI Control』を発表

2024年3月4日 07:30

5分で生成AIを振り返られる、要約ニュースです。
2023年 2/25〜3/2のトレンド生成AIニュース総まとめ。

X(Twitter)のトレンドポストもピックアップしています！

1. 高画質画像生成AI「Stable Diffusion 3」発表、画像生成AIが苦手とする「指定した文字の描写」「複数の被写体の描写」などを高精度に実現可能

Stability AIは、新たな画像生成AI「Stable Diffusion 3」を2024年2月23日に発表した。このAIは、従来の画像生成AIでは難しかった「指定した文字を画像内に自然に描写する」や「複数の被写体を高精細に描写する」といった機能を実現している。例えば、「教室の机の上にリンゴが置かれた映画風の写真、黒板にはチョークで『go big or go home』と記されている」というプロンプトで、指示通りの文字が黒板に描写された画像や、「宇宙飛行士が豚に乗り、コマドリがトップハットを着用している」という複雑なシーンも、指示通りに生成することが可能である。また、「黒い背景でカメレオンを接写したスタジオ写真」というプロンプトでは、カメレオンの顔付近がクリアに描写され、マクロレンズで撮影されたような雰囲気の画像が生成されている。Stable Diffusion 3には800万から80億パラメータの複数のモデルが存在し、現在は先行プレビュー段階で、ウェイトリストに登録が可能である。
https://gigazine.net/news/20240226-stable-diffusion-3/

2. Adobeが生成AI搭載の音楽版Photoshop「Project Music GenAI Control」を発表

Adobeは、テキストプロンプトから音楽を生成し編集できる「Project Music GenAI Control」を発表した。ユーザーは「パワフルなロック」「ハッピーダンス」などのスタイルを指定して音楽を生成し、生成された音楽のテンポや構造、繰り返しパターンの調整やカット編集が可能である。このツールは、音楽をリミックスしたり、映像コンテンツのBGMに適したループを設定するのに役立つ。Adobe Researchのニコラス・ブライアン氏によると、Project Music GenAI Controlは、生成AIを共同作成者として活用し、放送局やポッドキャスターに適したプロジェクト用音楽の作成に貢献する。他の音楽生成AIと異なり、生成した音楽を編集する機能を備えている点が特徴である。Adobeはこのプロジェクトを「早期段階の実験」と説明し、将来的にはAuditionやPremiere Proなどの既存ソフトに組み込む可能性があるが、現時点では一般公開されておらず、リリース日も未定である。
https://gigazine.net/news/20240229-adobe-project-music-genai-control/

3. ChatGPT、会話内容の記憶が可能に。新たにメモリ機能のテスト開始

OpenAIはChatGPTにメモリ機能を追加し、ユーザーとの会話内容を記憶する能力を持たせた。この機能は、無料ユーザーおよび有料ユーザーの一部を対象にテスト運用される。ユーザーの好みや情報を記憶し、より洞察力に富んだ回答を提供することが可能である。メモリ機能は、オフにすることや、特定の情報を削除することも可能だ。Temporary Chat機能を利用すれば、メモリを使用せずに会話することができ、モデルのトレーニングにも使用されない。さらに、プライバシーと安全性を考慮し、個人の機密情報は積極的に記憶されないよう措置が講じられている。この機能はカスタマイズされたGPTモデルにも適用され、ユーザーの好みに応じた推薦が可能になる。ただし、ChatGPTでの会話内容はモデル学習に使用されることがあり、特定のバージョンではこれが対象外である。

https://aismiley.co.jp/ai_news/openai-chatgpt-memory/

4. マイクロソフト、生成AIのリスク特定に役立つ「PyRIT」ツールを公開

Microsoftは、生成型AIが虚偽の情報生成や悪用のリスクを持つことに対処し、「Python Risk Identification Toolkit for generative AI（PyRIT）」を発表した。このツールは、生成AIシステムのリスクを特定するためにMicrosoftのAI Red Teamが使用している。Microsoftは生成AIシステムのレッドチーミングを行い、通常のセキュリティリスクに加えて、有害なコンテンツや偽情報の生成リスクも考慮する必要があることを学んだ。生成AIモデルはアーキテクチャーが異なり、結果にばらつきがあるため、リスク特定は退屈で時間のかかるプロセスであった。PyRITは、悪意のあるプロンプトを送信し、応答を評価することで、リスクの高い部分を自動で特定し、作業効率を向上させる。これにより、作業時間の大幅な短縮が可能である。
https://japan.cnet.com/article/35215692/

5. Microsoft「Copilot」発表から1周年。デザインの改良や画像生成の新機能を発表

Microsoftは、AIチャットボットCopilotの1周年を記念して、デザインの改良と画像生成機能の追加を発表した。Copilotはこれまでに50億回以上のチャット利用と50億枚以上の画像生成を経験しており、その人気に応えて新機能が追加される。新デザインでは、ユーザーがアイデアを実現しやすいように合理的に設計されており、複数の提案プロンプトをカルーセル形式で表示する。画像生成機能も強化され、CopilotのDesigner機能にはインライン編集が可能になった。これにより、チャットから離れることなく、生成した画像の背景をぼかすなどの編集ができる。さらに、アイデアを視覚化する専用キャンバスとして機能する「Designer GPT」が近日中に導入される予定である。
https://aismiley.co.jp/ai_news/microsoft-copilot_carousel_designer/

6. 「LINE」アプリ内で、生成AIを活用した新サービス「LINE AIアシスタント」が提供開始

「LINE」アプリ内で、生成AIを活用した「LINE AIアシスタント」の提供が開始された。このサービスでは、ユーザーからの質問や相談にOpenAIのAPIなどを使用してAIが回答する。AIによる画像解析機能を通じて、翻訳、要約、画像解析が可能になる。LINEヤフー株式会社は、このサービスを通じて、日常生活の問題や疑問の解決をサポートする。利用者はメッセージを送るだけで、様々なフォーマットのファイルや画像に書かれた文字の翻訳、ファイルの内容の要約、料理の画像からカロリーや栄養情報の提供などが受けられる。また、「カロミルAPI」との連携により、料理レシピの提示も可能である。このサービスには、一日5通までの返信を受け取れる無料プランと、すべての機能が使い放題の有料プランがある。無料プランでは、テキストメッセージのみ利用でき、画像・ファイルの翻訳・要約、画像解析は利用できない。LINEヤフーは、生成AIを活用した新しい取り組みを継続し、便利なAI体験を提供していくとしている。
https://aismiley.co.jp/ai_news/line-ai-assistant-release-generative-ai/

7. Google、「Gemini」での人物画像生成機能を停止に。機能の大幅改善に取り組む

Googleは、生成AIツール「Gemini」の人物画像生成機能に問題があったことを認め、一時的に利用停止している。この問題は、Geminiが不正確で不快な人物画像を生成したり、問題のないプロンプトに対して応答を拒否する場合があったことに起因する。Geminiは、画像生成AIモデル「Imagen 2」に基づいて構築され、多様な人物の画像を提供することを目的としていた。しかし、多様性を追求した結果、歴史上や文化上ありえない描写が生じたり、モデルが過度に慎重になる傾向があった。Googleは、この機能の再開に向けて大幅な改善に取り組むとしており、生成AIの既知の課題である「ハルシネーション」への対応も継続していくと述べている。
https://aismiley.co.jp/ai_news/gemini-suspend-imagegeneration-people/

8. 写真やイラストをリアルに歌わせたりしゃべらせたりできるAIシステム「EMO」が登場

Alibabaのインテリジェント・コンピューティング研究所は、写真や画像をリアルに話したり歌ったりする映像に変換できるAIシステム「EMO」を発表した。EMOは、入力されたオーディオトラックに合わせて滑らかで表現力豊かな表情と頭の動きを生成する。このシステムには拡散モデルというAI技術が使用されており、合計250時間以上のスピーチや映像を用いてトレーニングされている。EMOは3Dの顔モデルや輪郭合成を使わずに、直接音声から映像を生成するため、歌唱や発話に伴う微妙な動きや個性を捉えることができる。ただし、この技術がディープフェイク映像の作成や誤情報拡散に悪用される可能性もあり、研究者は合成映像を検出する方法を検討している。
https://gigazine.net/news/20240301-emote-portrait-alive/

9. 目指すは「1億人のパーソナルアシスタント」　LINEヤフーと生成AI

LINEヤフーは、生成AIの活用を進め、LINEやYahoo! JAPANのサービスに導入し、売上収益で年間1,100億円、生産性改善で同100億円の寄与を見込んでいる。全従業員は生成AI利用研修を受講し、研修後には「LY ChatAI」を利用できるようになる。エンジニアには「GitHub Copilot」が導入され、生産性向上が確認されている。LY ChatAIは約2万人の従業員に利用され、約7%の生産性改善が図られている。このAIは社外秘情報を扱うことができ、セキュリティ対策も整えられている。また、生成AIの課題であるハルシネーションを抑制する「RAG(Retrieval Augmented Generation)」ツールの開発も進めている。LINEヤフーは、LINE AIアシスタントやYahoo!検索など16サービスを展開し、特にYahoo!フリマやYahoo!知恵袋では生成AIの活用が進んでいる。LINEヤフーは、生成AIを活用して日本の課題に対応し、国内最大級のユーザー基盤を活かしていく方針である。
https://www.watch.impress.co.jp/docs/news/1572373.html

10. 「Copilot」の新機能「ノートブック」最大1万8000字のプロンプトに対応

Microsoftの「Copilot」に新たに実装された「ノートブック」とは、チャットダイアログなしでプロンプトの作成、改善、修正を行うための新インターフェースである。この機能はCopilotのウェブページからアクセス可能で、左右にテキストボックスが並べられた画面が表示される。ノートブックの特徴として、文字制限が1万8000字に増えており、長文の作成やドキュメントの校正、要約に適している。プロンプトの編集が容易になっており、チャットダイアログを排除することで、過去のプロンプトに対する微調整が簡単に行えるようになっている。結果の応答後も左側のテキスト入力ボックスに以前のプロンプトが残り、必要に応じてテキストの追加や削除が可能である。これにより、プロンプトの微調整がはるかに容易になっている。
https://japan.cnet.com/article/35215873/

11. マイクロソフトとボッシュ、生成AIで自動運転技術の改善を目指す--安全性と利便性を向上

Robert Boschは、生成AIを活用して自動運転技術を改善し、安全性と利便性を高めるためにMicrosoftと協業することを発表した。この協力により、自動運転車の機能向上が図られ、すべての道路利用者の安全性が向上するとされている。生成AIは、道路上の突発的な状況、例えばボールが転がり出てきた際の子供の飛び出しを予測し、適切な判断を下すのに役立つという。また、BoschとMicrosoftは、クラウドと連携するソフトウェア定義自動車（SDV）の実現に向けた自動車向けソフトウェア定義プラットフォームの共同開発にも取り組んでいる。
https://japan.cnet.com/article/35215957/

12. ベネッセ、生成AI活用の幼児向け会話型AI「しまじろう」日英対応、モニター1万人募集

ベネッセホールディングスとソフトバンクロボティクスは、生成AIを搭載した幼児向け新サービスAI「しまじろう」を開発した。このサービスは、「こどもちゃれんじ」のノウハウを基に、年少児向けにカスタマイズされている。専用アプリと「しまじろうぬいぐるみ」を組み合わせ、子どもたちは自由に会話や遊びが楽しめる。日本語と英語に対応し、保護者向けに子どもの感情や興味の動きをレポートする機能も備えている。モニター募集は「こどもちゃれんじほっぷ」の受講者を対象に行われ、1万人を抽選で選出する。ベネッセは、子どもたちのコミュニケーション力や課題解決力の育成を目的とし、生成AIの活用を進めている。今後、利用者の意見を取り入れながらサービスをブラッシュアップし、本格導入に向けた検討が進められる。
https://japan.cnet.com/article/35215756/

13. パーソルグループ、社員の生成AI活用能力向上のため研修プログラムを実施。アップスキリングを推進

パーソルホールディングス株式会社は、社員の生成AI活用能力を高めるための研修プログラムを推進している。このプログラムにより、1,500名以上の社員が専門研修を受け、3,800名以上が動画研修を完了し、200名以上が「生成AIパスポート」の資格試験に挑戦している。研修内容は、生成AIの基本から業務への応用までをカバーしており、社員は社内GPT「PERSOL Chat Assistant」を活用し、メール作成、議事録の要約、英文作成など様々な業務でAIを用いることができる。この取り組みにより、業務効率の向上と新たなビジネス機会の創出が期待されている。パーソルグループは、継続的なアップスキリングを通じて社員のパフォーマンス向上と生成AIのリスク管理を図る方針である。
https://aismiley.co.jp/ai_news/persol-generative-ai-skilling/

▼Xのポストまとめ

CanvaのAI機能、使いこなせていますか？

実は、CanvaのAI機能を使えば

・画像生成
・画像編集
・文章生成
・字幕生成

などあらゆる作業をCanva内で完結できます。

このスレッドではCanvaの便利なAI機能を
10個厳選して動画で紹介。

ブックマークして活用してみて↓ pic.twitter.com/adsKHuis2v
— ナギ| AI活用術×図解 (@nagi__blog) February 24, 2024

【速報】

楽天×OpenAI、通信業界に向けた最先端のAIツール提供に向けて協業を発表

通信業界は、テクノロジーの進化に取り残されるか否かが問われている

・この協業は2023年11月に発表された戦略的パートナーシップを基に、通信事業者向けに特化したAIツールの開発を進める
・「Rakuten… pic.twitter.com/bD7KGODvZA
— 木内翔大＠SHIFT AI代表「日本をAI先進国に」𝕏 (@shota7180) February 26, 2024

ChatGPTユーザーは絶対に見て。

GPTsを活用すれば日々の作業を
何十倍も効率化することができます。

20,000個を超えるGPTsの中から
特に使える10個を厳選して紹介。

それぞれのGPTsの詳しい使い方を
知りたい方はRT・「🐧」で教えて。

スレッドに全URL載せてます。

保存推奨↓ pic.twitter.com/FOY8Fs1hFa
— ナギ| AI活用術×図解 (@nagi__blog) February 26, 2024

【速報】Microsoft Copilot、Copilot GPTが導入！

タスクに特化したGPTsと同様の機能を追加した

最初にロールアウトされたCopilot GPTは以下の4つ↓

デザイナー：デザイン作業を支援
バケーションプランナー：休暇や旅行の計画を手伝う
クッキングアシスタント：料理のレシピや調理方法を提案… pic.twitter.com/FSTjgX6NC6
— 木内翔大＠SHIFT AI代表「日本をAI先進国に」𝕏 (@shota7180) February 27, 2024

部屋の模様替えでAIが意外に使える

右のデザインはAIが生成したものです

誰でもサクッと建築デザインを作成する方法：

ブックマーク保存をおすすめします↓ pic.twitter.com/9Lp0D8MBsh
— あるる ChatGPT × AIツール (@chatgptair) February 27, 2024

形式不揃いのデータ修正作業、スプシ上で動くAI、Numerousが最適。

動画①全角やスペース混じり→半角に
動画②フルネーム→名字のみ（精度高）
動画③日本の住所→英語かつ英語圏順番に

データの機密性や精度などは勿論注意が必要だけど、ざっくりとしたクレンジングなら便利。色々使い方ありそう。 pic.twitter.com/qObI6B9Bs9
— usutaku@AI情報解説 (@usutaku_com) February 28, 2024

【⚡️速報：Copilot GPTが登場！！】

Microsoft CopilotでCopilot GPTが展開。

・デザイン作成
・休暇の計画
・新しいレシピ学習
・ワークアウトプラン作成

などのGPTがデフォルトで搭載。

RAGも活用されているとのこと。

Copilot 365導入企業では使われそう。 pic.twitter.com/KCbGkiw44F
— チャエン | 重要AIニュースを毎日発信⚡️ (@masahirochaen) February 27, 2024

アリババが静止画と音源をアップロードすると表情豊かに歌ったり話したりする面白AI出してきた。

アリババはダンス動画生成AIといい、エンタメ用途のAIにフォーカスして研究しまくってますね。 pic.twitter.com/jaFB1bcW9u
— KAJI | 梶谷健人 / 新刊「生成AI時代を勝ち抜く事業・組織のつくり方」発売！ (@kajikent) February 28, 2024

ChatGPT4もGemini ProもStable Diffusionも使えて、ノーコードで独自AIアプリも作れるAIプラットフォーム「Anakin AI」が超便利！

以下全て実現可能で、、

・ワンストップで、ツール切り替えの手間なく1000以上のAIツールを使うことができる… pic.twitter.com/i9od4HI90I
— 木内翔大＠SHIFT AI代表「日本をAI先進国に」𝕏 (@shota7180) February 29, 2024

GPTsの「作者ランキング」が閲覧できるサイトが便利
ㅤ
今までは基本的にGPTs自体のランキングしかありませんでしたが、
✅製作者のランキングが見れるものは初めて！
ㅤ
製作者ごとのサーチはまだ公式には実装されていないので、
✅このサイト独自の機能と言えます！ pic.twitter.com/dngbghFHIV
— すぐる | GPTsガチ勢💻 (@SuguruKun_ai) March 1, 2024

1万円未満でアパレル屋1人で開業できる裏技〜AI編〜

使うAIはこれ↓
・Stable Diffusion（人物,衣装生成）
・Canva（背景除去）
・OOTDiffusion（着用写真作成）
・SUZURI（出品・制作）

サービス月額料だけやから1万所か数千円でいけるレベルは、さすがにAIヤバい笑pic.twitter.com/OtZIusk9am
— RY🌐AIとマーケの人 (@ry_jiyuu) March 1, 2024

キタコレ。

北京大学、Soraの再現Openプロジェクト開始🔥

OpenAI のビデオ生成モデルを再現することを目的とした Open Sora。

1ビデオ VQ-VAE。
2ノイズ除去拡散トランス。
3コンディションエンコーダー

長尺ビデオのプロンプト実現。

一強ではなく、より加速するよう
盛り上がって欲しい。 pic.twitter.com/yfqCAU2GsO
— ホーダチ | AI✖️Cloud✖️Dev | 外資×ひとり法人 (@hokazuya) March 2, 2024

以上、先週の振り返りニュースでした。
毎週配信しています✨ ↓

XではリアルタイムでAIに関する情報を発信しています📝
フォローで応援よろしくお願いします☺︎🌟！
👉https://twitter.com/kurayu_yuki

この記事が気に入ったらサポートをしてみませんか？