![見出し画像](https://assets.st-note.com/production/uploads/images/143263506/rectangle_large_type_2_6ca95aa29d997e2f0a93784c5701b0b8.png?width=800)
[06/01~06/07] 生成AI Weekly News|NotebookLM を PickUp!
今回も社内で話題になった生成AIに関するニュースをご紹介します。
Google から NotebookLM、中国発の動画生成AIサービス「KLING」、Chatbot ArenaでGemini 1.5 Proが日本語ではGPT-4oを超えて1位になったりと、今週も盛りだくさんです。
それでは今週のニュースです!
ピックアップ|NotebookLM
NotebookLM 登場
先日の Google I/O で発表されたサービスの「NotebookLM」が登場しました。
![](https://assets.st-note.com/img/1717749085736-4rkhFFuWyt.png?width=800)
これは何かというと、ファイルから適切なデータを検索して質問に回答する機構(= RAG)が簡単に作れるチャットボットです。
現時点では Gemini も無料で使えるため、この「NotebookLM」を利用するのに費用はかかりません。
では実際に使ってみましょう。
サービスにログインすると、「ノートブック」というものが表示されます。
![](https://assets.st-note.com/img/1717749286903-m7vjh6d02g.png?width=800)
これはチャットボットのようなもので、この中に特定のファイルを入れていきます。
![](https://assets.st-note.com/img/1717749472180-AbnopBMckA.png?width=800)
早速チャットをしてみます。
![](https://assets.st-note.com/img/1717749537220-9VkIPl1pyn.png?width=800)
すると、以下のようにアップロードしたファイルを参照した上で回答を生成してくれます。文末の数字をクリックすると、回答生成にあたって参考にした箇所が表示されます。
![](https://assets.st-note.com/img/1717749853851-2fkjIFnVpw.png?width=800)
これだけだとただの RAG ができるチャットボットですが、「NotebookLM」という名前にあるように メモを残していくことを特徴としています。
Chat View と メモの View を切り替えられるようになっており、チャットボットに質問をしながら適宜メモを取ることができます。
![](https://assets.st-note.com/img/1717750093456-fS1f50p5E7.png?width=800)
![](https://assets.st-note.com/img/1717750089796-rzxuIFkuF9.png?width=800)
![](https://assets.st-note.com/img/1717750097426-0JwNiDf4Ij.png?width=800)
さらに作成したメモを選択して、要約や学習ガイドの作成等の指示出しもできるようです。なかなか新鮮で面白い機能ですね。
![](https://assets.st-note.com/img/1717750235756-6ItC6W9iu4.png?width=800)
社内データの活用としても RAG は有効な手段であり、そのようなサービスは昨年から多数出てきましたが、Google も「NotebookLM」でそれをできるようにしました。
企業で実際に使うとなると、セキュリティ面が気になるところですね。
↓↓ あわせて読みたい ↓↓
※ 余談ですが、弊社でも似たような RAG を使える法人向けChatGPT環境サービスの「生成AI SmartAssistant」があります。大手水準のセキュリティですので、ご興味があればお問い合わせください。
![](https://assets.st-note.com/img/1717750647816-HC6GXz6j4a.png?width=800)
プロダクト・サービス
中国発の動画生成AIサービス 「KLING」
以前 OpenAI から動画生成AI として「Sora」が発表され、話題を集めていましたが、実際に触って動かすことはできない状態でした。
今回、発表された中国の「KLING」というサービスでは中国の電話番号があれば、実際に動かすことができるようです。画像生成AI 同様、どこまでプロンプトで調整が可能か楽しみです。
A Chinese AI video generator just dropped before we got access to Sora
— Rowan Cheung (@rowancheung) June 6, 2024
Can generate 2-minute videos at 30fps, 1080p quality, available on the KWAI iOS app with a Chinese phone number
A few generations from their site:
1. pic.twitter.com/NEmWiqKHiO
↓↓ あわせて読みたい ↓↓
こちらの方が 画像生成AI のリリース年表を随時更新してくれてますので、振り返りにおすすめです。
プロンプトのみでフローチャートを作成 「eraser」
「eraser」では、フローチャートからシーケンス図、アーキテクチャなどが作成可能です。
Wondering how to effectively build with AI while managing an existing product?
— Eraser (@eraserlabs) May 23, 2024
In this week's ◆Decision Node◆, Eraser's Head of Engineering @yoelsays dives into how Eraser navigated product and technical decisions while building Eraser AI over the last twelve months. pic.twitter.com/qsf0jY3sXy
#eraser をサクッとお試し!AzureでのRAGアーキテクチャを書かせてみた!
— まる@生成AI勉強中 (@RunRfa) June 3, 2024
ちょっと最初に情報詰め込み過ぎて無茶させた気がしないでもないけど、これいいなぁ。
段階的にプロンプト追加しながら作っていくの良いかな?
こっからIaCに落とせたら最高。 https://t.co/bEArcUzQRF pic.twitter.com/IPQkBjbBpO
全コンテンツが生成AIで作成された動画配信サイト 「Showrunner」
全コンテンツが生成AI の動画配信サイトがリリースされました。
α版として提供されており、リンクから公開されている動画が閲覧可能です。
🚨ANNOUNCING SHOWRUNNER🚨
— The Simulation (@fablesimulation) May 30, 2024
We believe the future is a mix of game & movie.
Simulations powering 1000s of Truman Shows populated by interactive AI characters.
🚨Welcome to Sim Francisco & Showrunner!🚨
SOUND ON!
Link to Signup in Bio pic.twitter.com/yptMocqOfW
GPT-4o、応答に基づいて口調や声のトーンを変更するデモが公開
先日 OpenAI Spring Update で発表された GPT-4o ですが、新しいデモ動画として、対話の中での応答に基づいて口調や声のトーンを変えて喋るデモが公開されました。
音声認識と回答の速度、ナチュラルさでも話題になった GPT-4o ですが、まだ実際に触ったりすることはできないため、一般公開が待たれます。
create.xyz、Dify とも連携ができるように
https://t.co/b44aLjQzGD 、こんな感じでDifyとも連携できるようになりました。
— さとこよ/Satokoyo (@koyo_koyoy) June 4, 2024
この実装例では、API仕様に関するプロンプトは9割くらいは公式のリファレンスを貼っているだけです。入力の変数などの情報を整えてあげればあとはいい感じにcreateが処理を構築してくれます。… pic.twitter.com/4UrLJ3rxmu
ニュース
ELYZAが、国立研究開発法人 産業技術総合研究所が募集した大規模生成AI研究開発支援プログラムに採択
【お知らせ】ELYZAが、国立研究開発法人 産業技術総合研究所が募集した大規模生成AI研究開発支援プログラムに採択されました。ABCIの計算資源を優先的に利用し、日本語LLMの開発を推進します。https://t.co/ImXns1qMyd
— ELYZA, Inc. (@ELYZA_inc) June 4, 2024
セガサミー、おもちゃ開発に生成AI デザイン案100倍に
セガサミーホールディングスが、おもちゃ開発で生成AI を活用し始めたようです。
生成AIにはセガフェイブのおもちゃのデザインを学習させた。初期デザイン案は簡単なコンセプトなどを入力すれば、生成AIが複数パターンのイメージ画像を作成する。従来は担当者が考えたアイデアを絞り込んで社内デザイナーに依頼し、手書きのデザイン案を作成していた。
論文・技術系
Chatbot Arena Leaderboard: Gemini 1.5 Proが日本語ではGPT-4oを超えて1位に
Google の Gemini 1.5 Pro ですが、Chatbot Arena という LLM の総合評価で日本語としては GPT-4o を超えて 1位になりました。
![](https://assets.st-note.com/img/1717748985027-KIUyvSehuu.png?width=800)
https://t.co/mbRRuKxCmH でGoogleのGemini 1.5 Pro(5/14モデル)が日本語で世界一になりました。2ヶ月前のモデル (4/9モデル)よりかなり改善されました。4ヶ月前より私がGemini 1.5 Proの非英語事後学習の担当になり、チームの皆と一緒に改善しました (https://t.co/DRhGYEJdVj… pic.twitter.com/YsOmSUBs7U
— シェイン・グウ (@shanegJP) June 4, 2024
AI エージェントの5段階分け
「Five Levels of AI Agents」というコンセプトは、AIエージェントの複雑さと能力の進化を示す5つのレベルに分類されています。
この分類の中では、現在はレベル2.5 と言われています。
![](https://assets.st-note.com/img/1717748002917-J9U2PsVXGr.png?width=800)
<レベル1> ルールベースのエージェント(知覚 + 行動):
技術: ルールベースのAI + ツール (知覚 + 行動)
性能: 未熟な人間に相当する
能力: 単純なステップのフォロー
主な特徴: ユーザーまたは開発者によって事前に定義された正確な手順を完了する
ユースケース: 「メッセンジャーを開く」、「メールを読む」、「アリスに電話する」
狭い範囲のドメイン: 単一ルールベースのシステム、SHRDLU、GOFAI
一般的な広範囲ドメイン: 新興AGI、ChatGPT、Gemini、Llama 2 など
<レベル2> IL/RLベースのAI + ツール (知覚 + 行動) + 推論 & 意思決定:
技術: IL/RLベースのAI + ツール (知覚 + 行動) + 推論 & 意思決定
性能: 熟練した大人の50%に相当
能力: 熟練した大人のタスクの決定論的な自動化
主な特徴: ユーザーの記述に基づいてタスクを自動的に完了
ユースケース: 「今日の北京の天気をチェック」
狭い範囲のドメイン: LLM、RAGなどのフレームワークを使用した会話AI
一般的な広範囲ドメイン: 熟練したAGI、未達成
<レベル3> LLMベースのAI + ツール (知覚 + 行動) + 推論 & 意思決定 + 記憶 & 反映:
技術: LLMベースのAI + ツール (知覚 + 行動) + 推論 & 意思決定 + 記憶 & 反映
性能: 熟練した大人の90%に相当
能力: 戦略的なタスクの自動化
主な特徴: ユーザー定義のタスクを使用し、自律的に計画し、フィードバックに基づいて繰り返し
ユースケース: 「アリスにビデオ通話をかける」
狭い範囲のドメイン: 特定のタスク指向のエージェント
一般的な広範囲ドメイン: 専門家AGI、未達成
<レベル4> LLMベースのAI + ツール (知覚 + 行動) + 推論 & 意思決定 + 記憶 & 反映 + 自律学習 & 汎化:
技術: LLMベースのAI + ツール (知覚 + 行動) + 推論 & 意思決定 + 記憶 & 反映 + 自律学習 & 汎化
性能: 熟練した大人の100%以上に相当
能力: 真のデジタルペルソナ
主な特徴: ユーザーのコンテキストを理解し、個人化されたサービスを提供
ユースケース: 「ロボット掃除機に今日の掃除を指示」、「スケジュールを更新」
狭い範囲のドメイン: AlphaFold、Deep Blueなどの専門的な狭域AI
一般的な広範囲ドメイン: 専門家AGI、未達成
<レベル5> LLMベースのAI + ツール (知覚 + 行動) + 推論 & 意思決定 + 記憶 & 反映 + 自律学習 & 汎化 + 人格 (感情 & 特性) + 協調行動 (マルチエージェント):
技術: LLMベースのAI + ツール (知覚 + 行動) + 推論 & 意思決定 + 記憶 & 反映 + 自律学習 & 汎化 + 人格 (感情 & 特性) + 協調行動 (マルチエージェント)
性能: 熟練した大人の100%以上に相当
能力: 真のデジタルペルソナ
主な特徴: ユーザーの代わりに行動し、他のユーザーと協力し、安全性と信頼性を確保
ユースケース: 「どの都市が最近の旅行に適しているか調査」
狭い範囲のドメイン: AlphaFold、AlphaZero、StockFishなどのスーパー人間狭域AI
一般的な広範囲ドメイン: 人工超知能(ASI)、未達成
LLMにまつわる"評価"を整理する
その他ニュース
韓国発「ライオンロケット」 生成AIで作画アシスト
韓国発の LionRocket 社の技術では、10枚程度の絵をもとに作品の画風を学習させると、スケッチを軽く書いたり簡単な操作のみで作画が可能とのこと。
リスキリング支援の拡充、10月から給付拡大へ
政府は、リスキリングを支援する公的給付を10月から拡充する方針のようです。生成AI活用と補助金はうまく組み合わせていきたいですね。
[ご案内] 生成AI活用のお悩み相談、開催中
現在弊社では、生成AI 活用をご検討されている企業様のお悩み相談を、
1時間無料で受け付けております。
![](https://assets.st-note.com/img/1717751622402-gMIjAFOt8H.png?width=800)
業務効率化のための法人向け ChatGPT 環境のサービスや、生成AI に関する研修にご興味がある方は、コチラから。
今週もニュースが盛りだくさんの1週間でした。来週もどんなニュースがあるのか楽しみです!
今週もお疲れ様でした!
=========================================
この note が気に入ってくれた方は、
ぜひ「いいね」と「フォロー」をお願いします♪
X でも生成AI や LLM に関する情報を発信してますので、
ぜひ覗いてみてください!
「株式会社エクスプラザ(公式)」アカウント
https://twitter.com/explaza_inc
「生成AI事例集」アカウント
https://twitter.com/explaza_usecase
生成AI事例集
会社HP
この記事が気に入ったらサポートをしてみませんか?