見出し画像

【生成AIニュースまとめ】 3/10〜3/16|動画生成技術「EMO」登場

5分で先週の生成AIを振り返られる、要約ニュースです。
2024年 3/10〜3/16のトレンド生成AIニュース総まとめ。


1. 歌や会話などの音声に合わせてリアルに動く人物動画生成技術「EMO」登場

AlibabaのInstitute for Intelligent Computingは、単一の参照画像と音声データからリアルに動く人物動画を生成する技術「EMO」を発表した。この技術は、会話や歌声に合わせた自然な動きや表情を持つアバターを生成する。音声エンコーダーとフレームエンコーディングにより、音声内容に基づく動画を生成し、バックボーンネットワークを使用して表情の再現範囲を広げ、キャラクターの独自性を捉える。多言語や様々な速度の音声に対応し、映画制作やソーシャルメディアコンテンツなど幅広い応用が期待される。
https://aismiley.co.jp/ai_news/emote-portrait-alive/

2. マイクロソフト、「Copilot」無料版にも「GPT-4 Turbo」を搭載

Microsoftが「Microsoft Copilot」の無料版に「GPT-4 Turbo」を搭載し、これまでのGPT-4を上回る機能を無料で提供開始した。GPT-4 Turboは、処理できるテキストの量がGPT-4の4倍の12万8000に増加し、2023年4月までの知識に対応している。これにより、ユーザーはOpenAIの最先端モデルを無料で体験できるようになった。Microsoftはユーザーエクスペリエンスの向上を目指し、Copilot Proユーザーは引き続きGPT-4とGPT-4 Turboの切り替えが可能である。
https://japan.cnet.com/article/35216479/

3. グーグル、言葉の指示に従いゲームをプレイするAI「SIMA」を発表

Googleが発表したAIエージェント「Scalable Instructable Multiworld Agent(SIMA)」は、自然言語の指示に従って様々なゲーム内でタスクを実行し、見たことのないゲームもプレイできる能力を持つ。DeepMindの研究チームは、人間のプレイヤーに模倣させて「No Man's Sky」など複数のゲームで学習させ、600種類のスキルを評価した。SIMAはゲーム間の知識移転を利用してスキルを学習し、指示に従うことができた。DeepMindは、より多くの環境で目標達成し、ユーザーと会話ができるAIシステム開発を目指す。
https://japan.cnet.com/article/35216493/

4. 世界初の「AI規制法」を欧州議会が賛成多数で承認

2023年12月に欧州委員会、EU理事会、欧州議会の合意により、世界初となるAI規制法案が2024年3月13日、賛成523票で欧州議会にて承認された。この法案は、社会におけるAI使用時のリスクを考慮し、特定のAIアプリケーションの禁止や高リスクなAIシステムに対する法的義務を明確に定める。生体認証システムの使用制限や、ディープフェイクの明示義務、汎用AIの透明性要件などが規定されており、新興企業や中小企業への支援策も含まれる。法案成立には理事会の承認が必要で、公式発効後24カ月で完全適用される。
https://gigazine.net/news/20240314-european-parliament-artificial-intelligence-act/

5. 「ChatGPT」、多要素認証が可能に

「ChatGPT」等のAI利用時のセキュリティ向上のため、OpenAIが多要素認証(MFA)機能を導入。ユーザーは不正アクセス防止が可能になる。設定は「Settings」から「Multi-factor authentication」を有効化し、認証アプリでQRコードをスキャンしてワンタイムコードを入力する流れ。Google AuthenticatorやMicrosoft Authenticatorが使用可能。この新機能により、簡単な操作でアカウントのセキュリティが強化される。
https://japan.cnet.com/article/35216317/

6. イーロン・マスク、ChatGPTに対抗する生成AI「Grok」を間もなくオープンソース化すると発表

イーロン・マスク氏のAI企業・xAIが開発したチャットAI「Grok」がオープンソース化されるとマスク氏が発表した。GrokはOpenAIのChatGPTに対抗するAIとして注目され、「SF小説『銀河ヒッチハイク・ガイド』にインスピレーションを受けた」AIと紹介されている。オープンソース化により、一般の研究者や開発者がGrokを自由に使えるようになり、研究開発が加速すると期待されている。マスク氏は過去にもテスラやXの技術をオープンソース化しており、この動きはOpenAIがMicrosoftと提携し、営利企業へと移行したことへの対抗策と見られる。
https://gigazine.net/news/20240312-elon-musk-xai-grok-open-source/

7. 自律型AIソフトウェアエンジニア「Devin」発表。課題から情報収集して環境構築・ビルド・デプロイまで

AIスタートアップCognitionは、自律的に情報を参照しコーディングからデバッグ、デプロイまで行うAIソフトウェアエンジニア「Devin」を発表した。Devinはプロンプトで与えられた課題に対して、自身でプランを立て、Webで情報を検索し、エラーがあれば自身でデバッグを行う。また、GitHubリポジトリのReadmeを読んで環境を構築するなど、高度な自律性を持っている。DevinはReal World Software Engineering Performance(SWE-bench)で優れた成績を示し、アーリーアクセス版として利用可能になっている。
https://www.techno-edge.net/article/2024/03/15/2982.html

8. ELYZAが新たな日本語LLMを開発 「GPT-3.5 Turboにも匹敵」 チャット形式のデモサイトも公開

東京大学発のAIスタートアップ、ELYZAは700億パラメータの大規模言語モデル「ELYZA-japanese-Llama-2-70b」を開発したと発表した。このモデルは、日本の企業が開発したLLMを大きく上回る性能を持ち、グローバルなモデルとも匹敵する。ELYZAはこのLLMのデモ版を公開し、自社のベンチマーク「ELYZA Tasks 100」で性能評価を行い、GPT-3.5 Turbo、Claude 2、Gemini 1.0 Proといった海外モデルと同等の性能を示した。同社はこのLLMを企業向けに「ELYZA LLM for JP」シリーズとして春以降に提供開始する予定である。
https://www.itmedia.co.jp/news/articles/2403/12/news149.html

9. ChatGPTや大規模言語モデル(LLM)から隠された情報や一部機能を盗み出す攻撃手法が登場

OpenAIやGoogleのPaLM-2などから機密情報を盗む「モデル窃盗攻撃」が研究者により発表された。この攻撃は、隠された情報を盗み出すもので、Google DeepMindや他の大学と研究機関のチームが考案。研究は、稼働中の言語モデルAPIでこの攻撃が可能であることを2023年に確認。影響を受けるサービスに対して情報が開示され、GoogleとOpenAIはアップデートを実施。研究チームは、GPT-3のAdaやBabbageモデルからデータを盗み出し、GPT-3.5のモデルにもこの攻撃が効果的であることを確認したが、全モデルを復元することは難しいとしている。
https://gigazine.net/news/20240313-ai-llm-model-stealing-attack/

10. CRMの生成AI機能拡充 セールスフォース、日本市場に攻勢

セールスフォース・ジャパンは、生成AIを活用してデータ連携を支援する新機能を製品に組み込む。この新機能は「Einstein 1 Studio」と「Data Cloud」に追加され、「プロンプトビルダー」と「モデルビルダー」、「データフェデレーション」と「ベクトルデータベース」が特徴である。これにより、クラウド上の顧客データを生成AIで活用し、非構造化データと構造化データを統合して生成AIのプロンプト上で活用することが可能になる。セールスフォース・ジャパンは、これを日本市場への攻勢の足掛かりとしている。
https://news.yahoo.co.jp/articles/038b0235775c2e7d16f40467144246ffaa0b87f8

▼X(twitter)のポストまとめ

以上、先週の振り返りニュースでした。
毎週配信しています✨ ↓

XではリアルタイムでAIに関する情報を発信しています☺︎📝✨
👉https://twitter.com/kurayu_yuki


この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?