見出し画像

【生成AIニュースまとめ】 2/25〜3/2|Adobeが音楽生成AI『Project Music GenAI Control』を発表

5分で生成AIを振り返られる、要約ニュースです。
2023年 2/25〜3/2のトレンド生成AIニュース総まとめ。

X(Twitter)のトレンドポストもピックアップしています!


1. 高画質画像生成AI「Stable Diffusion 3」発表、画像生成AIが苦手とする「指定した文字の描写」「複数の被写体の描写」などを高精度に実現可能

Stability AIは、新たな画像生成AI「Stable Diffusion 3」を2024年2月23日に発表した。このAIは、従来の画像生成AIでは難しかった「指定した文字を画像内に自然に描写する」や「複数の被写体を高精細に描写する」といった機能を実現している。例えば、「教室の机の上にリンゴが置かれた映画風の写真、黒板にはチョークで『go big or go home』と記されている」というプロンプトで、指示通りの文字が黒板に描写された画像や、「宇宙飛行士が豚に乗り、コマドリがトップハットを着用している」という複雑なシーンも、指示通りに生成することが可能である。また、「黒い背景でカメレオンを接写したスタジオ写真」というプロンプトでは、カメレオンの顔付近がクリアに描写され、マクロレンズで撮影されたような雰囲気の画像が生成されている。Stable Diffusion 3には800万から80億パラメータの複数のモデルが存在し、現在は先行プレビュー段階で、ウェイトリストに登録が可能である。
https://gigazine.net/news/20240226-stable-diffusion-3/

2. Adobeが生成AI搭載の音楽版Photoshop「Project Music GenAI Control」を発表

Adobeは、テキストプロンプトから音楽を生成し編集できる「Project Music GenAI Control」を発表した。ユーザーは「パワフルなロック」「ハッピーダンス」などのスタイルを指定して音楽を生成し、生成された音楽のテンポや構造、繰り返しパターンの調整やカット編集が可能である。このツールは、音楽をリミックスしたり、映像コンテンツのBGMに適したループを設定するのに役立つ。Adobe Researchのニコラス・ブライアン氏によると、Project Music GenAI Controlは、生成AIを共同作成者として活用し、放送局やポッドキャスターに適したプロジェクト用音楽の作成に貢献する。他の音楽生成AIと異なり、生成した音楽を編集する機能を備えている点が特徴である。Adobeはこのプロジェクトを「早期段階の実験」と説明し、将来的にはAuditionやPremiere Proなどの既存ソフトに組み込む可能性があるが、現時点では一般公開されておらず、リリース日も未定である。
https://gigazine.net/news/20240229-adobe-project-music-genai-control/

3. ChatGPT、会話内容の記憶が可能に。新たにメモリ機能のテスト開始

OpenAIはChatGPTにメモリ機能を追加し、ユーザーとの会話内容を記憶する能力を持たせた。この機能は、無料ユーザーおよび有料ユーザーの一部を対象にテスト運用される。ユーザーの好みや情報を記憶し、より洞察力に富んだ回答を提供することが可能である。メモリ機能は、オフにすることや、特定の情報を削除することも可能だ。Temporary Chat機能を利用すれば、メモリを使用せずに会話することができ、モデルのトレーニングにも使用されない。さらに、プライバシーと安全性を考慮し、個人の機密情報は積極的に記憶されないよう措置が講じられている。この機能はカスタマイズされたGPTモデルにも適用され、ユーザーの好みに応じた推薦が可能になる。ただし、ChatGPTでの会話内容はモデル学習に使用されることがあり、特定のバージョンではこれが対象外である。

https://aismiley.co.jp/ai_news/openai-chatgpt-memory/

4. マイクロソフト、生成AIのリスク特定に役立つ「PyRIT」ツールを公開

Microsoftは、生成型AIが虚偽の情報生成や悪用のリスクを持つことに対処し、「Python Risk Identification Toolkit for generative AI(PyRIT)」を発表した。このツールは、生成AIシステムのリスクを特定するためにMicrosoftのAI Red Teamが使用している。Microsoftは生成AIシステムのレッドチーミングを行い、通常のセキュリティリスクに加えて、有害なコンテンツや偽情報の生成リスクも考慮する必要があることを学んだ。生成AIモデルはアーキテクチャーが異なり、結果にばらつきがあるため、リスク特定は退屈で時間のかかるプロセスであった。PyRITは、悪意のあるプロンプトを送信し、応答を評価することで、リスクの高い部分を自動で特定し、作業効率を向上させる。これにより、作業時間の大幅な短縮が可能である。
https://japan.cnet.com/article/35215692/

5. Microsoft「Copilot」発表から1周年。デザインの改良や画像生成の新機能を発表

Microsoftは、AIチャットボットCopilotの1周年を記念して、デザインの改良と画像生成機能の追加を発表した。Copilotはこれまでに50億回以上のチャット利用と50億枚以上の画像生成を経験しており、その人気に応えて新機能が追加される。新デザインでは、ユーザーがアイデアを実現しやすいように合理的に設計されており、複数の提案プロンプトをカルーセル形式で表示する。画像生成機能も強化され、CopilotのDesigner機能にはインライン編集が可能になった。これにより、チャットから離れることなく、生成した画像の背景をぼかすなどの編集ができる。さらに、アイデアを視覚化する専用キャンバスとして機能する「Designer GPT」が近日中に導入される予定である。
https://aismiley.co.jp/ai_news/microsoft-copilot_carousel_designer/

6. 「LINE」アプリ内で、生成AIを活用した新サービス「LINE AIアシスタント」が提供開始

「LINE」アプリ内で、生成AIを活用した「LINE AIアシスタント」の提供が開始された。このサービスでは、ユーザーからの質問や相談にOpenAIのAPIなどを使用してAIが回答する。AIによる画像解析機能を通じて、翻訳、要約、画像解析が可能になる。LINEヤフー株式会社は、このサービスを通じて、日常生活の問題や疑問の解決をサポートする。利用者はメッセージを送るだけで、様々なフォーマットのファイルや画像に書かれた文字の翻訳、ファイルの内容の要約、料理の画像からカロリーや栄養情報の提供などが受けられる。また、「カロミルAPI」との連携により、料理レシピの提示も可能である。このサービスには、一日5通までの返信を受け取れる無料プランと、すべての機能が使い放題の有料プランがある。無料プランでは、テキストメッセージのみ利用でき、画像・ファイルの翻訳・要約、画像解析は利用できない。LINEヤフーは、生成AIを活用した新しい取り組みを継続し、便利なAI体験を提供していくとしている。
https://aismiley.co.jp/ai_news/line-ai-assistant-release-generative-ai/

7. Google、「Gemini」での人物画像生成機能を停止に。機能の大幅改善に取り組む

​​Googleは、生成AIツール「Gemini」の人物画像生成機能に問題があったことを認め、一時的に利用停止している。この問題は、Geminiが不正確で不快な人物画像を生成したり、問題のないプロンプトに対して応答を拒否する場合があったことに起因する。Geminiは、画像生成AIモデル「Imagen 2」に基づいて構築され、多様な人物の画像を提供することを目的としていた。しかし、多様性を追求した結果、歴史上や文化上ありえない描写が生じたり、モデルが過度に慎重になる傾向があった。Googleは、この機能の再開に向けて大幅な改善に取り組むとしており、生成AIの既知の課題である「ハルシネーション」への対応も継続していくと述べている。
https://aismiley.co.jp/ai_news/gemini-suspend-imagegeneration-people/

8. 写真やイラストをリアルに歌わせたりしゃべらせたりできるAIシステム「EMO」が登場

Alibabaのインテリジェント・コンピューティング研究所は、写真や画像をリアルに話したり歌ったりする映像に変換できるAIシステム「EMO」を発表した。EMOは、入力されたオーディオトラックに合わせて滑らかで表現力豊かな表情と頭の動きを生成する。このシステムには拡散モデルというAI技術が使用されており、合計250時間以上のスピーチや映像を用いてトレーニングされている。EMOは3Dの顔モデルや輪郭合成を使わずに、直接音声から映像を生成するため、歌唱や発話に伴う微妙な動きや個性を捉えることができる。ただし、この技術がディープフェイク映像の作成や誤情報拡散に悪用される可能性もあり、研究者は合成映像を検出する方法を検討している。
https://gigazine.net/news/20240301-emote-portrait-alive/

9. 目指すは「1億人のパーソナルアシスタント」 LINEヤフーと生成AI

LINEヤフーは、生成AIの活用を進め、LINEやYahoo! JAPANのサービスに導入し、売上収益で年間1,100億円、生産性改善で同100億円の寄与を見込んでいる。全従業員は生成AI利用研修を受講し、研修後には「LY ChatAI」を利用できるようになる。エンジニアには「GitHub Copilot」が導入され、生産性向上が確認されている。LY ChatAIは約2万人の従業員に利用され、約7%の生産性改善が図られている。このAIは社外秘情報を扱うことができ、セキュリティ対策も整えられている。また、生成AIの課題であるハルシネーションを抑制する「RAG(Retrieval Augmented Generation)」ツールの開発も進めている。LINEヤフーは、LINE AIアシスタントやYahoo!検索など16サービスを展開し、特にYahoo!フリマやYahoo!知恵袋では生成AIの活用が進んでいる。LINEヤフーは、生成AIを活用して日本の課題に対応し、国内最大級のユーザー基盤を活かしていく方針である。
https://www.watch.impress.co.jp/docs/news/1572373.html

10. 「Copilot」の新機能「ノートブック」最大1万8000字のプロンプトに対応

Microsoftの「Copilot」に新たに実装された「ノートブック」とは、チャットダイアログなしでプロンプトの作成、改善、修正を行うための新インターフェースである。この機能はCopilotのウェブページからアクセス可能で、左右にテキストボックスが並べられた画面が表示される。ノートブックの特徴として、文字制限が1万8000字に増えており、長文の作成やドキュメントの校正、要約に適している。プロンプトの編集が容易になっており、チャットダイアログを排除することで、過去のプロンプトに対する微調整が簡単に行えるようになっている。結果の応答後も左側のテキスト入力ボックスに以前のプロンプトが残り、必要に応じてテキストの追加や削除が可能である。これにより、プロンプトの微調整がはるかに容易になっている。
https://japan.cnet.com/article/35215873/

11. マイクロソフトとボッシュ、生成AIで自動運転技術の改善を目指す--安全性と利便性を向上

Robert Boschは、生成AIを活用して自動運転技術を改善し、安全性と利便性を高めるためにMicrosoftと協業することを発表した。この協力により、自動運転車の機能向上が図られ、すべての道路利用者の安全性が向上するとされている。生成AIは、道路上の突発的な状況、例えばボールが転がり出てきた際の子供の飛び出しを予測し、適切な判断を下すのに役立つという。また、BoschとMicrosoftは、クラウドと連携するソフトウェア定義自動車(SDV)の実現に向けた自動車向けソフトウェア定義プラットフォームの共同開発にも取り組んでいる。
https://japan.cnet.com/article/35215957/

12. ベネッセ、生成AI活用の幼児向け会話型AI「しまじろう」日英対応、モニター1万人募集

ベネッセホールディングスとソフトバンクロボティクスは、生成AIを搭載した幼児向け新サービスAI「しまじろう」を開発した。このサービスは、「こどもちゃれんじ」のノウハウを基に、年少児向けにカスタマイズされている。専用アプリと「しまじろうぬいぐるみ」を組み合わせ、子どもたちは自由に会話や遊びが楽しめる。日本語と英語に対応し、保護者向けに子どもの感情や興味の動きをレポートする機能も備えている。モニター募集は「こどもちゃれんじ ほっぷ」の受講者を対象に行われ、1万人を抽選で選出する。ベネッセは、子どもたちのコミュニケーション力や課題解決力の育成を目的とし、生成AIの活用を進めている。今後、利用者の意見を取り入れながらサービスをブラッシュアップし、本格導入に向けた検討が進められる。
https://japan.cnet.com/article/35215756/

13. パーソルグループ、社員の生成AI活用能力向上のため研修プログラムを実施。アップスキリングを推進

パーソルホールディングス株式会社は、社員の生成AI活用能力を高めるための研修プログラムを推進している。このプログラムにより、1,500名以上の社員が専門研修を受け、3,800名以上が動画研修を完了し、200名以上が「生成AIパスポート」の資格試験に挑戦している。研修内容は、生成AIの基本から業務への応用までをカバーしており、社員は社内GPT「PERSOL Chat Assistant」を活用し、メール作成、議事録の要約、英文作成など様々な業務でAIを用いることができる。この取り組みにより、業務効率の向上と新たなビジネス機会の創出が期待されている。パーソルグループは、継続的なアップスキリングを通じて社員のパフォーマンス向上と生成AIのリスク管理を図る方針である。
https://aismiley.co.jp/ai_news/persol-generative-ai-skilling/


▼Xのポストまとめ

以上、先週の振り返りニュースでした。
毎週配信しています✨ ↓

XではリアルタイムでAIに関する情報を発信しています📝
フォローで応援よろしくお願いします☺︎🌟!
👉https://twitter.com/kurayu_yuki

この記事が気に入ったらサポートをしてみませんか?