見出し画像

【話題の生成AIニュースまとめ】 12/01〜12/10|Googleの生成AIモデル「Gemini」登場

5分で生成AIを振り返られる、要約ニュースです。
2023年 12/01〜12/10のトレンド生成AIニュース総まとめ。

X(Twitter)のトレンドポストもピックアップしています!


1. 「専門家を超えるAI」 グーグルの次世代生成AIモデル「Gemini」登場

グーグルは、新しいAIモデル「Gemini」を発表した。このモデルはマルチモーダルであり、画像、テキスト、音声、動画など複数の要素を同時に処理できる。Geminiは、Googleの開発者向けイベントで公開された「PaLM 2」のスーパーセットである。最上位モデルのGemini Ultraは、32種類のベンチマークのうち30で既存の最高水準を上回り、57科目の組み合わせで知識や問題解決能力を測るMMLUテストで90%のスコアを達成した。Geminiは3つのモデルがあり、中規模のProと小規模のNanoが今年中に公開され、大規模のUltraは2024年初めに公開予定だ。特にNanoはスマートフォン内のオンデバイスAIとして利用され、音声文字起こしに要約機能を追加する予定である。

https://www.watch.impress.co.jp/docs/news/1552601.html

2. メタ、画像生成AIサービス開始 Instagram投稿データなどで学習

メタは、新しい画像生成AI「Imagine」のブラウザー版を米国のユーザーに公開した。このAIは、テキスト入力に基づいて画像を生成し、Instagramなどの投稿データを学習した「Emu」という画像基盤モデルを利用している。Imagineはメタのサービスを経由せずに直接使用でき、Metaアカウントでログイン後、テキストボックスにプロンプトを入力すると画像を生成する。ただし、日本のMetaアカウントではまだ利用できない。

https://news.yahoo.co.jp/articles/477edf0003434f6b46b9e4e419f442b83c484561

3. Amazon、ビジネス向けの生成AIアシスタント「Amazon Q」を発表

Amazon Web Services(AWS)は、ビジネス専用の生成AIアシスタント「Amazon Q」を発表した。このサービスは、企業が蓄積したデータを基に、関連性の高い回答や提案を生成する。Amazon Qは、Amazon S3、Salesforce、Google ドライブ、Microsoft 365など40以上のビジネスアプリケーションと連携し、企業内の既存システムとの統合を容易にする。料金プランは、ビジネスプランが月額20ドル、ビルダープランが月額25ドルで、他社の同種サービスと比べて手頃な価格である。また、ユーザーの役職や役割に基づいて対話を調節可能で、企業情報の安全性も保たれている。

https://aismiley.co.jp/ai_news/amazon-web-service-amazonq-chat-ai/

4. 生成AIプロンプトポータル「教えて.AI byGMO」が、画像生成に対応

GMOインターネットグループの一部であるGMO教えてAI株式会社は、生成AIプロンプトポータル「教えて.AI byGMO」で、2023年11月30日より画像生成プロンプトの投稿・検索と、プロンプトを利用してサイト内で画像を生成できる機能を開始した。この機能は、OpenAIのAPI(モデルGPT-4)を利用しており、ユーザーは通常有料の「ChatGPT PLUS」で利用可能な「DALL・E 3」を完全無料で使うことができる。この更新により、生成AI市場におけるユーザーニーズにさらに応えることが可能となっている。
https://japan.cnet.com/release/30922263/

5. マクドナルドがGoogleの生成AIを導入へ

マクドナルドは、Googleとのパートナーシップを通じて、Googleのクラウド技術や生成AIソリューションを世界中の店舗に導入する予定である。この提携により、マクドナルドはモバイルアプリやセルフサービスキオスクなどにGoogle Cloudのエッジコンピューティングを導入し、これらを強化する。さらに、Google Cloudの専任チームがマクドナルドのグローバルイノベーションセンター、Speedee Labsに常駐し、多くの事業に生成AI技術を適用する計画である。

https://pc.watch.impress.co.jp/docs/news/1552712.html

6. 「GPT-4 Turbo」と「新DALL-E 3」、Microsoft Copilotに実装へ

米Microsoftは、生成AI群「Copilot」の誕生1周年を記念し、2024年を目処に新機能を順次実装する計画を発表した。これには、OpenAIの最新モデル「GPT-4 Turbo」が含まれ、より複雑で長いタスクに取り組む能力が強化される。現在は一部のユーザー向けにテスト中で、数週間以内にCopilotに統合される予定だ。また、画像生成AIモデル「DALL-E 3」が更新され、より正確に高品質なイメージを生成できるようになる。この機能はbing.com/createやCopilotのイメージ作成機能を介して利用可能になる。さらに、Edge向けのインライン編集機能が実装され、ほとんどのWebサイトで利用可能になる。また、Bing画像検索はGPT-4と組み合わせて、ユーザーの問いに対してより正確な検索結果を提供するようになる。

https://pc.watch.impress.co.jp/docs/news/1552348.html

7. Pixel 8 Pro、生成AI「Gemini」が使える初のスマホに アップデートの配信スタート

Googleは、最新の生成AI「Gemini」を「Pixel 8 Pro」に実装し、12月7日から日本を含むグローバルでアップデートの配信を開始した。Geminiは3つのモデル(Ultra、Pro、Nano)を備えており、Pixel 8 Proにはスマートデバイス向けの最小モデル「Nano」が搭載されている。このモデルは、Google Tensor G3チップ上で動作し、ネットワーク接続なしで利用可能である。Gemini Nanoは、文字起こしや返信文の提案などを行うボイスレコーダーアプリや「Gboard」で利用できる。また、2024年初頭からは、Nano以外のモデルを使用したAIアシスタント「Assistant with Bard」の提供も予定されている。
https://www.itmedia.co.jp/news/articles/2312/07/news150.html

8. rinna、GPT活用の日本語音声認識モデル「Nue ASR」を公開--商用利用可能

rinnaは、大規模言語モデルGPTを活用した日本語音声認識モデル「Nue ASR」を開発し、商用利用可能なライセンスで公開した。このモデルは、日本語に特化したテキスト基盤モデルGPTと、音声基盤モデルHuBERTを統合し、畳み込み層を挟んで構築されている。事前学習済みの基盤モデルを使用することで、音声認識モデルの学習コストを軽減できる。また、高速推論手法DeepSpeedを導入し、リアルタイムファクタを0.22から0.15に短縮し、文字誤り率を大幅に改善した。このモデルは、OpenAI WhisperシリーズやReazonSpeechモデルと同等の性能を持ち、今後の改良の余地も大きい。

https://japan.cnet.com/article/35212492/

9. Meta、生成AIの悪用を防ぐプロジェクト「Purple Llama」

Metaは「Purple Llama」プロジェクトを立ち上げ、生成AIの悪用を防ぐ取り組みを強化している。このプロジェクトでは、開発者に対して、安全性を高め、責任ある開発体制を支援するツールや評価方法が提供される。Metaが開発した大規模言語モデル(LLM)のLlamaは、オープンモデルとして公開され、多くのプロジェクトで利用されているが、生成AI全般に対するサイバーセキュリティの課題も指摘されている。これに対応するため、Metaは業界標準やガイダンスに沿ったサイバーセキュリティの安全評価方法を構築し、リスクの定量化の指標や、不適切なコード生成を防ぐツール「Llama Guard」をリリースした。

https://www.watch.impress.co.jp/docs/news/1553133.html

10. 動画を認識し文章で表現する新技術 NECが開発

NECは、動画を認識して文章で表現する新たな生成AI技術を開発した。この技術では、100を超えるAIが協力し、動画内の人物や物体を認識して断片的な言葉として文字化する。その後、生成AIがこれらをまとめて文章に整える。この技術は、例えば、ドライブレコーダーの動画から交通事故の原因を分析して報告書を作成するなど、様々な応用が考えられる。この種の技術は、アメリカの大手IT企業も開発を進めているが、多数のAIを組み合わせる方法は珍しいため、新たな競争分野で日本の企業の存在感が高まる可能性がある。

https://www3.nhk.or.jp/news/html/20231204/k10014276841000.html

11. お金を払ってでも生成AIを利用したい人はわずか5%にとどまる【GMOリサーチ】

GMOリサーチとGMO AI & Web3は、生成AIに関する自主調査を実施し、以下の結果が得られた。

  • 生成AIの認知率は63.6%であるが、利用率は16.6%にとどまり、有料の生成AIツールの利用率は5.0%と低い。

  • 生成AIを信頼していない人の割合は、信頼している人より8.2ポイント高い。しかし、生成AIの利用経験者は未利用者と比較して信頼度が33.2ポイント高い。

  • 2023年11月時点で「生成AI」と言えば「ChatGPT」が連想キーワード第1位となっており、41.6%の回答者が選んだ。次いで「Google Bard」(8.3%)や「Meta AI」(7.4%)が挙げられた。

  • しかし、全回答者の51.5%は具体的なAI関連キーワードを認識していないことが明らかになり、AI教育の必要性を示唆している。

https://prtimes.jp/main/html/rd/p/000004241.000000136.html

12. プロンプト不要!Teams上で簡単に使える「AI Worker」先行案内開始

株式会社AI Shiftは、プロンプトを使わずにMicrosoft Teams上で容易に利用できる業務改善プラットフォーム「AI Worker」の先行受付を開始した。これは、ChatGPTの登場以来、生成AIの活用に期待を寄せる企業のニーズに応えるためのもので、日本企業の約7割がセキュリティーリスク等の問題から生成AIの使用を禁止または検討している現状を踏まえたものである。AI Workerは直感的なUI/UXで利用でき、企業の業務課題に合わせた個別タスクの開発も提供する。また、生成AIの組織浸透や社員のリテラシー向上を通じて業務改善を促進する。

https://prtimes.jp/main/html/rd/p/000000097.000055962.html

13. AIモデル「Gemini Pro」で大幅強化されたBardが利用可能に。2024年にはGemini Ultra搭載の「Bard Advanced」

Googleは、Google DeepMindによって開発されたAIモデル「Gemini」を、対話型AI「Bard」に導入したと発表しました。Geminiは、GPT-4を超える性能を持つマルチモーダルAIで、3つのモデルが用意されています:「Gemini Ultra」、「Gemini Pro」、「Gemini Nano」。Gemini Proは、8つのベンチマークのうち6つでGPT-3.5を上回るスコアを出し、Bardにおける文章理解、要約、推論、コーディング、プランニングの能力を向上させました。2024年には、Gemini Ultraを搭載した「Bard Advanced」がリリースされる予定で、テキストだけでなく画像、音声、映像も処理し、高品質なコードの理解と生成が可能になります。

https://gigazine.net/news/20231207-google-bard-advanced-gemini-ai/

▼X(twitter)のポストまとめ


以上、振り返りニュースでした。
AIに関する情報を配信しています☺️ ↓

X(twitter)ではリアルタイムでAIに関する情報を発信しています📝
良かったらフォローしていただけると嬉しいです!
https://twitter.com/kurayu_yuki


この記事が気に入ったらサポートをしてみませんか?