見出し画像

Googleの新AI検索が炎上/iPhoneに実装されるのはChatGPTかGeminiか?/天気に合わせた服装コーデAIアプリ/しまむら、AIモデル「るな」起用/スカーレット・ヨハンソンがOpenAIに抗議/TikTokが60分動画をテスト中【週刊AIのニュース 2024年5月27日号】

こんにちは。AIのある暮らしです。

2024年5月20日〜5月26日の「週刊AIのニュース」をお届けします。


【1】文章生成AIニュース

グーグルのGemini用AIプロンプトガイドを、AIにまとめてもらった

この記事では、GoogleがGoogle I/Oで配布したGemini用のAIプロンプトガイドについて紹介しています。このガイドは、Google Workspaceを効果的に利用するための方法を示しており、具体的には21語程度でペルソナ、タスク、コンテキスト、フォーマットを含めてプロンプトを書くことが推奨されています。

ガイドはPDF版が無料でダウンロード可能で、人事や営業など様々な職業での使用例が含まれています。また、AIプロンプトを書く際の重要なポイントとして、適切な長さ、具体的なタスク、背景情報、希望する出力形式を明確にすることが挙げられています。ガイドを使用することで、Google Workspaceの各アプリと連携し、生産性と業務効率を向上させる方法が説明されています。

Gemini for Google Workspace のできる・できないを解説

この記事では、Google Workspaceに統合されたAIアシスタント「Gemini for Google Workspace」の機能と限界について解説しています。旧「Duet AI for Google Workspace」から名称が変更されたGeminiは、Gmail、ドキュメント、スプレッドシート、スライド、Meetなどで使用できます。

「Help me write」機能で文章や比較表の作成、「Create image with Gemini」機能で画像生成、「Help me organize」機能でデータ整理のテンプレート作成が可能です。しかし、画像生成機能はドキュメント内ではサポートされておらず、スプレッドシートのテンプレート作成では計算式を含めることができないなどの制約があります。Gmailの「Help me write」ではメール本文の作成が支援されますが、カレンダー連携機能はありません。今後、Geminiはさらに多くの機能を提供し、業務効率の向上をサポートしていく予定です。

Copilot AIで仕事の生産性がアップ。便利になったMicrosoft Teamsの機能 #MicrosoftBuild

この記事では、Microsoftが「MS Build 2024」で発表したTeamsの新機能について紹介しています。今回の発表では、AIアシスタント「Copilot」を組み込むことでTeamsの機能を強化し、ビジネス向けチャットツールとしての利便性を向上させました。

主な新機能には、ビデオ会議の内容を要約する機能、発言者や話題ごとに会議を録画する機能、会議内容についてAIに質問する機能、チャット上で画像を生成する機能があります。

これらの機能により、会議の議事録作成や次のタスク提示、発言の振り返りが容易になり、業務の効率化が期待されます。Copilotは今後も進化を続け、会議のアジェンダ作成やファイルの検索、タスク管理などの機能も追加される予定です。これらの機能が普及することで、多くのビジネスパーソンが日常業務を効率化し、生産性を向上させることができるでしょう。

翻訳でも生成AI台頭?「DeepL」が見いだす勝ち筋

この記事では、翻訳ツール「DeepL」の成功戦略とその独自性について解説しています。DeepLは、2017年のサービス開始以来、高い翻訳精度と一貫性を武器に、ビジネス向けの翻訳サービスとして成長してきました。現在は32言語、700の言語組み合わせに対応しており、日本国内でも広く利用されています。

DeepLは、無料版から有料版、API提供など多岐にわたるサービスを展開しており、特に企業向けの需要が高いです。企業の通信や文書作成において、翻訳の正確性やセキュリティが求められる場面で支持を得ています。2024年には、「DeepLWritePro」として、大規模言語モデル(LLM)を初めて搭載した文章作成サポートツールを発表しました。これにより、執筆者の言語能力に関係なく、高品質な文章作成が可能となります。

DeepLは、高い翻訳精度と独自のLLMを組み合わせることで、競争が激化する生成AI市場での差別化を図っています。今後も対応言語を拡大しながら、ビジネスシーンでの利用をさらに推進していく予定です。

【2】画像生成AI関連のニュース

しまむら、AIモデル「るな」起用 20歳の服飾専門学生(という設定)

アパレルチェーン大手「しまむら」は、5月15日にAIファッションモデル「Luna(るな)」を発表しました。Lunaは身長158cmの20歳の服飾専門学生という設定で、公式Instagramアカウント「しまスタイル」を通じてファッション情報を発信します。

しまむらはこの発表に先立ち、ユーザーからキャラクター名の投票を受け付けていました。現在、Lunaの生成に使用された画像生成AIや学習データの詳細は明かされていません。

モデルが衣服を“着用”している画像をAIで生成、グーグルの新しい広告ツールが目指していること

この記事では、Googleが発表した新しいAI広告ツールについて紹介しています。AIを用いて異なる体型や肌の色のモデルが衣服を着用している画像を生成し、オンラインショッピングの広告に表示することで、消費者が商品が自分に合うかどうかをよりリアルに想像できるようにします。この新機能は特に、返品を減らし、顧客満足度を向上させることを目指しています。

この広告ツールは、Googleがバーチャル試着ツールの延長線上で開発したもので、広告主が詳細な寸法を共有することなく、モデルの画像と商品の画像を合成できます。また、Googleはこの機能を通じてAmazonやTikTokとの競争に対抗し、収益性の高いオンライン広告事業を強化しようとしています。

さらに、Googleは広告主が自ら制作したショート動画を検索エンジンの広告と連動させる新しいフォーマットも提供し始めました。これにより、若い世代の消費者に対してより効果的にアピールすることができます。AIを活用することで、広告制作のコストを削減しつつ、より魅力的な広告を作成することが可能となります。

今すぐ試したい!オリジナル3Dモデルからイラスト生成AIを作れるAvalabがリリース!

この記事では、生成AIスタートアップ企業Namerakaがリリースした新しいサービス「Avalab」について紹介しています。このサービスは、オリジナルの3Dモデルから簡単にAIイラストを生成するプラットフォームで、特にVRMアバターを用いた画像生成に優れています。これにより、専門知識がなくてもオリジナルキャラクターの生成AIを作成できるようになりました。

Namerakaは、生成AIでクリエイティブを加速することを目指しており、クリエイター以外の人々も含め、多くの人が創作活動を楽しめる世界を目指しています。現在、Avalabは無料で提供されていますが、将来的には有料サービスの展開も視野に入れています。Avalabで生成されたイラストは商用利用が可能で、生成回数やアバター登録数を増やす機能やウォーターマーク削除機能などが追加される予定です。

Namerakaは、開発陣が全員20代という若いチームで、既に多くの海外ユーザーも獲得しています。今後は中華圏や英語圏への展開をさらに進め、より広範なユーザー層にサービスを提供することを目指しています。

画像生成AIに照明革命 日本と世界で同時に“神ツール”登場

この記事では、画像生成AIにおける新技術「ICライト(Imposing Consistent Light)」について紹介しています。これは、特定の照明効果を後から画像に追加する技術であり、照明の方向や色、強さを自由に調整できる点が特徴です。ICライトは、Stable DiffusionとControlNetの技術を組み合わせて開発されており、プロンプトに従って画像を生成する際に、一貫したライティング効果を適用します。

ICライトの性能は高く、短時間で高品質な画像を生成することができます。この記事では、キャラクター「明日来子さん」の画像を使った具体例を紹介しており、背景の照明効果を追加することで、より自然で魅力的な画像が生成される様子が説明されています。また、この技術は、広告やクリエイティブな表現の分野での応用が期待されています。

さらに、ICライトは他の画像生成AIツールとも連携可能であり、「ComfyUI」や「A1111」といった環境向けの拡張機能が既に開発されています。これにより、ユーザーは簡単に照明効果を調整し、動的に変化させた動画を作成することもできます。今後、この技術は広告や映像制作など、様々な分野で活用されることが期待されています。

モザイク・ぼかしより自然に、東大がAI生成画像でプライバシー保護

東京大学の徐安然大学院生と矢谷浩司准教授らが、モザイクやぼかしに代わる新しいプライバシー保護手法を開発しました。この手法は、人工知能(AI)を使って人物やナンバープレートなどを生成画像に置き換えるもので、より自然な見た目を実現します。従来のモザイク処理などと比べて、プライバシーを守りながらも視覚的な違和感を大幅に減少させることが可能です。

AI生成画像を用いることで、対象物の置き換えが自動的に行われるため、手作業による編集の手間を省くことができるほか、特定の人物や物体を認識して自動的に処理することが可能です。この技術は、監視カメラの映像やSNSでの画像投稿など、プライバシー保護が重要な場面での利用が期待されています。

開発チームは、今後この技術の実用化を目指し、さらに研究を進めていく予定です。

アドビが「Adobe Express」のエンタープライズ機能でコンテンツ作成の生産性加速

アドビは、デザインツール「Adobe Express」にエンタープライズ向け新機能を追加しました。これにより、企業はマーケティングコンテンツの作成を加速させ、ブランドに沿ったコンテンツ制作を簡単に行えるようになります。新機能には、生成AI「Adobe Firefly Image 3 Foundation」モデルが搭載され、フォトリアリスティックな出力やプロンプト入力からの迅速な生成が可能です。また、ブランド管理機能や一括作成・生成機能、カスタムモデルも提供されます。

「Adobe Express for Enterprise」では、マーケターがキャンペーン用コンテンツを再利用したり、地域ごとにアセットをローカライズしたりすることが容易になり、営業チームもクライアント向けの資料を迅速にカスタマイズして作成できます。さらに、将来的には「Adobe GenStudio」との統合も予定されており、コンテンツの再利用やパフォーマンス測定がシームレスに行えるようになる予定です。これにより、専門的なクリエイティブスキルがなくてもコンテンツを直接編集できるようになります。

【3】動画生成AI関連のニュース

画期的な動画生成AIの「Sora」「Veo」の登場を導いた新技術と⁠⁠、これから私たちが向き合うべき生成AIの課題

この記事では、OpenAIの動画生成AIモデル「Sora」とGoogle DeepMindの「Veo」の登場に関する技術的背景と今後の課題について解説しています。2024年2月に発表された「Sora」は、テキストプロンプトから1分間の動画を生成できるAIモデルで、Googleの「Veo」も同様に1080pの動画を生成可能です。これらのモデルは、従来の動画生成AIに比べて滑らかな映像を生成できる点が特徴です。

技術的な進展には、LoRA、ControlNet、LCM(Latente Consistency Models)などが大きな役割を果たしており、生成AIの一貫性と高速化を実現しています。特に「Sora」は、自然な映像生成が可能でありながら、物理的な相互作用や時間経過に関する描写に課題が残っています。

生成AI技術の発展は、コンテンツ制作の効率化や新しいビジネスチャンスを生み出す一方で、有害コンテンツの生成や誤情報の拡散、学習データの著作権問題などの課題も存在します。今後、生成AIの安全性と信頼性を確保するための規制や法整備が進むことが期待されています。

AIと天気を組み合わせた服装コーディネートアプリ「そらコーデ」を公開

日本気象協会と株式会社そらかぜは、AIを活用した服装コーディネートアプリ「そらコーデ」を2024年5月22日に公開しました。このアプリは、天気予報とユーザーのプロフィール情報(体質、用途、年代など)を基に、その日の最適な服装を提案します。AIを用いてコメントとイラストでコーディネートを表示し、複数の提案から選択することも可能です。

「そらコーデ」は、天気予報の詳細情報や生活指数、季節情報も提供し、服装選びをサポートします。プライバシー保護に配慮し、個人情報はコーディネート提案の目的のみに使用され、AIの学習データとしては利用されません。無料で利用できますが、月額課金のプレミアムプランでは広告非表示や着替え回数の上限緩和などの機能が利用可能です。

【4】モバイルAI関連のニュース

iPhone実装候補「8つの生成AI」、ChatGPTかGeminiか? それとも「アップル製」か?

この記事では、アップルが新たに導入する予定の生成AIチャットボット「Apple GPT」について解説しています。iPhoneの販売が低迷する中、アップルは販売促進の起爆剤として生成AIを導入する計画です。特に、今秋リリース予定のiOS 18にこの機能を実装する見込みです。

アップルは過去に21社のAIスタートアップを買収しており、独自の大規模言語モデル(LLM)を開発しています。しかし、他社からのアウトソーシングも含め、iPhoneに搭載されるLLMの候補が乱立している状態です。具体的な実装候補として、ChatGPTやGemini、アップル独自のモデルが挙げられています。

6月10日から14日に開催される開発者会議「WWDC」で詳細が発表される予定です。この新しい生成AIチャットボットがiPhoneの販売促進にどのように寄与するかが注目されています。

AmazonがAIアシスタント「Alexa」を再設計してサブスクリプション形式で提供する可能性

Amazonが生成AIを活用した新しい「Alexa」を2024年後半にサブスクリプション形式で提供する予定です。この決定は、生成AIの使用に伴うコストを相殺するための措置です。新しいAlexaは、より自然な会話ができるようアップグレードされ、OpenAIやGoogleのチャットボットと競争することを目指しています。既存の「Amazonプライム」とは別枠での提供となる予定です。

また、2024年1月には「Alexa Plus」という有料版が開発中であることが報じられており、自然な会話が可能であるとされています。これにより、AmazonはAIアシスタント市場での競争力を強化しようとしています。

Googleも、映像と音声から質問に答えるAIアシスタント「Project Astra」を準備しており、これらの動向はAlexaやAppleのSiriに対する脅威と見なされています。

【5】その他 生成AI関連ニュース

OpenAIの「そっくり」な合成音声に抗議したスカーレット・ヨハンソン、法廷で争う可能性と見えてきた論点

OpenAIが開発した合成音声「Sky」が、映画『her/世界でひとつの彼女』でスカーレット・ヨハンソンが演じたAIアシスタントの声に似ているとして、ヨハンソン本人が抗議し、利用停止となりました。

ヨハンソンは、OpenAIがデモンストレーションで使用した声が自身の声に非常に似ていることに対してショックと怒りを表明し、弁護士を通じて対応を求めました。OpenAIはこの声が別の女優のものであると主張していますが、ヨハンソンはパブリシティ権の侵害を主張する可能性があります。この問題は、他のアーティストや作家がOpenAIに対して提起した訴訟とも関連しており、法的な論点として注目されています。

Open AIのアルトマンCEO、「Microsoft Build」にサプライズで登場

この記事では、OpenAIの最高経営責任者(CEO)であるサム・アルトマン氏が、Microsoftの年次開発者会議「Microsoft Build」にサプライズで登場し、Microsoftの最高技術責任者(CTO)であるケビン・スコット氏と対談した様子を報じています。アルトマン氏は、AI技術が急速に普及している現状に驚いており、開発者が既存のプロジェクトに利用できる一連のAPIを提供することで、新しいAIアプリケーションの実現をサポートしていると述べました。

また、AIの未来については、モデルが今後さらにスマート化し、より堅牢で安全かつ便利になると予測しています。特に、GPT-4oの「Voice Mode」の改善や、トークンの価格と待ち時間の半減などに言及し、AIの進化が続くと強調しました。Microsoftは、OpenAIのモデルを利用して自社サービスを最適化し続け、GPT-4oを「Azure AI」で一般提供することを発表しました。

グーグル 生成AI活用した新たな検索サービスで誤情報が表示

アメリカのIT大手グーグルが今月提供を開始した生成AIを活用した新たな検索サービス「AIオーバービュー」で誤った情報が表示されたと報じられています。具体的には、ピザにチーズをくっつけるために接着剤を使うことを勧めたり、ガソリンでパスタを調理すると辛い味付けになると回答するなどの誤情報が含まれていました。

また、オバマ元大統領がイスラム教徒であるという誤った情報も表示されました。グーグルはこれらの問題について「まれな質問によるもので、システムの改善に努める」とコメントしています。このような生成AIによる誤情報の問題は他のIT企業でも発生しており、改善が求められています。

グーグル、プロも驚く音楽生成AI「Music AI Sandbox」を開発

この記事では、Googleが開発した音楽生成AI「Music AI Sandbox」について紹介しています。このAIは、Google DeepMindが手がけた高品質な音楽生成ツールであり、プロの音楽家やプロデューサーを対象としています。

Google I/Oで発表されたこのツールは、ユーザーが入力したメロディーを元に異なるスタイルの音楽を生成することができます。例えば、プロデューサーのWyclef Jeanがギターのメロディーを入力し、ブラジル風に変換するデモンストレーションが行われました。

Music AI Sandboxは、Google DeepMindが開発したAIモデル「Lyria」をベースにしており、複数の声や楽器が同時に含まれる音楽を高品質かつ一貫性を保って生成することが可能です。このツールは、音楽制作のスピードを大幅に向上させ、クリエイティブなプロセスを加速させることを目的としています。音楽家やプロデューサーにとって、創造力を高める新しい手段となることが期待されています。

生成AIを巡る日本の現状は? 東大・松尾教授の考察資料が無料公開 「1年間、日本は最善手を指し続けている」

この記事では、内閣府が5月23日に公開した「第9回 AI戦略会議」の資料について紹介しています。この資料は東京大学の松尾豊教授が作成したもので、「生成AIの産業における可能性」に関する全33ページの詳細な考察が含まれています。資料では、ここ1年間での日本の生成AIに関する取り組みがまとめられており、各産業でのAI活用方法が議論されています。

松尾教授は、日本のAI政策が厳しい状況から始まったものの、過去1年間で最善の手を指し続けていると評価しています。特に「広島AIプロセス」などの国際的なリーダーシップや、AI関連予算の増加、GPUの増強が挙げられます。また、日本はAIに対する積極的な取り組み、人件費の安さ、大企業のデジタルトランスフォーメーション(DX)余地の大きさから、世界的に注目を集めています。

さらに、資料では産業別の生成AI活用例や、新しい展開の提案も行われており、生成AIが日本の産業をエンパワーし、人材の能力を引き出し、人々の生活を豊かにする手助けになると松尾教授は述べています。

GPT-4oの動画・画像、音声の能力は? これから使える機能、今わかっていることまとめ

OpenAIの新型AIモデル「GPT-4o」の特徴についての記事です。GPT-4oは、動画理解や音声処理能力に優れており、45分の専門家向け講義動画を数分で正確に要約する能力を持ちます。また、高品質な画像生成や3Dオブジェクトの生成も可能です。

このモデルは、動画・映像の理解や生成において非常に高い性能を示し、特にリアルタイムでの処理能力が注目されています。具体的な性能例として、講義動画の理解と要約のスピードが挙げられています。GPT-4oは、画像生成でも極めて高い性能を持ち、従来のAIモデルでは難しかった作業を克服しています。

【6】その他 SNS関連ニュース

TikTok、60分動画機能を一部のクリエイターでテスト中——中国スタートアップシーン週間振り返り(5月20~26日)

この記事では、2024年5月20日から5月26日の期間に中国のスタートアップシーンで起きた主要なニュースを振り返っています。主な内容として、TikTokが一部のクリエイターに対して60分間の動画をアップロードできる機能をテストしていることが挙げられます。

TikTokはこれまで短い動画で人気を築いてきましたが、YouTubeやMetaといった競合他社に対抗するため、長い形式の動画を取り入れることでユーザー基盤を維持し、拡大を目指しています。この新機能は、コンテンツクリエイターにより多くのシェアを促す意図があります。

この記事の詳細は、TechNodeの「News Feed」から翻訳されたもので、TikTokの新機能についてのTechCrunchの報道を引用しています。

TikTokフォロワー数2469万人の“世界的美女インフルエンサー”日本デビュー決定

パキスタン出身のモデル・女優であり、TikTokフォロワー数が2,469万人、Instagramフォロワー数が568万人を誇る世界的なインフルエンサー、ジャナット・ミルザ(23歳)が日本でデビューすることが決定しました。彼女は日本とパキスタンの両方で生活しており、日本文化にも親しんでいます。8月に日本で女優・モデルとして活動を開始する予定です。

ジャナットはelite management Japanの系列会社であるChatnoir model agencyに所属しており、コロナ禍の影響でしばらく日本での活動を控えていましたが、今回日本での活動を本格化させる意向を示しています。日本語は流暢ではないもののある程度理解でき、英語は問題なく話せるため、今後は日本語と英語を活用しながら活動を広げていく予定です。

Instagram縦長動画が活況!動画の勝ちパターンは?/Meta次世代パフォーマンスサミット

この記事では、2024年のデジタルマーケティングにおける生成AIの普及と縦長動画広告の重要性について解説しています。特に、縦長動画広告市場は昨年比156.3%増の526億円に達し、急成長しています。サイバーエージェントは「Vertical Creative Lab」を設立し、縦長動画広告の制作と運用を支援しています。

Facebook Japanの服部タカユキ氏は、縦長動画広告がミッドファネルの攻略に有効であると指摘しています。縦長動画は静止画広告に比べて情報量が多く、ユーザーに商品の魅力を伝えやすい利点があります。また、制作コストが低く抑えられ、効果的な広告運用が可能です。

具体例として、あるクライアントは静止画広告から縦長動画広告に移行し、配信予算が約160%増加し、CPA(顧客獲得単価)を約1万円下げつつも配信量を約2倍にすることができたと述べています。このように、縦長動画広告はマーケティングにおいて大きなチャンスを提供しています。

公式LINE登録で特典がもらえます


AIのある暮らし公式LINEに登録いただくと「AIの最新情報」「勉強会の募集」の案内が届きます。

また「指示文」と送信して頂ければ、「本当にしごとに役立つ指示文20選」ががもらえます。

毎月AIの勉強会を開催しています

第3回 AIの勉強会 「調べる・検索する」

6月25日(火) 19時~20時

次回は仕事や暮らしに使える「AIと話す・AIで発想する」について勉強します。ぜひ公式LINEに登録いただければ無料でご参加頂けます。

お申し込みはこちらから。

第1回 勉強会「書く・要約する」 補講

2024年6月6日(木)19時~20時

ご好評頂いた第一回AIの勉強会「書く・要約する」の補講の開催も決定しました。受講がまだという方はぜひ遊びに来てくださいね。

今後の開催予定

第1回 「書く・要約する」 4月25日(木) 19時~20時
第2回 「調べる・検索する」 5月28日(火) 19時~20時
第1回  「書く・要約する」 補講 6月6日(木)19時~20時
第3回 「話す・発想する」6月25日(火) 19時~20時
第4回 「画像をつくる」7月24日(水) 19時〜20時
第5回 「動画をつくる」 8月28日(水) 19時~20時

AI導入研修無料相談

またAI導入研修も開催しています。30分の無料相談が可能ですのでぜひご活用下さい。

さいごに

ここまでお読みいただきありがとうございました。

また今後もしごとや暮らしに役立つAI情報を発信していく予定ですので、アカウントのフォローをお願いいたします。

それではまた次の投稿でお会いしましょう!

公式グッズの販売はこちらから


この記事が気に入ったらサポートをしてみませんか?