[03/23~03/29] LLM Weekly News

2024年3月29日 16:18

今回も社内で話題になったLLMに関するニュースをご紹介します。
2023年度は LLM が文字通り破竹の勢いて成長してきました。その歴史を追いかけてきた「LLM Weekly News」ですが、年度末最後の記事となります。
来年度から新しい取り組みも初めてまいりますので、ぜひ楽しみにしてお待ちください！

それでは今週の LLM ニュースです！

プロダクト・サービス

誰でも簡単に web サイトが作れる「create.xyz」

今週、一番社内がざわつきました。
テキストだけで web ページの UI を作成、React でコード生成も可能です。

＜特徴＞

テキストだけでページを作成できる（生成されたものもそれぞれコンポーネント化されており修正可能）
コードは React で生成
スクショ（画像）を読み込ませてそれを元に生成させることも可能
API 連携も標準搭載（ChatGPTやGoogle系、画像生成AIなどのAPIが標準で搭載されている）

右側のチャット画面でテキストを打ち、「Generate」ボタンを押すと UI とコードを生成してくれる。生成されたものに対して、プロンプトを修正してアップデートしていくことも可能。

無料で使えるので、気になる方はぜひ触ってみてください。

感情知能を備えた会話型AI 「Hume」

”感情”を搭載した AI が登場しました。

EVIは、ユーザーの声のトーンを理解し、すべての言葉に意味を付加し、それを使用して独自の言語と音声をガイドしてくれるようです。

EVIには独自の共感能力がいくつもある。

1.人間のような声のトーンであなたの表情に反応する
2.あなたのニーズに応え、満足度を最大化する言葉であなたの表情に反応する
3.EVIは、あなたの声のトーンを最先端のターン終了検知に使用するため、いつ話すべきかを知っている
4.中断されると止まりますが、いつでも中断したところから再開できます
5.時間をかけて自己改善するために、あなたの反応を適用することによって、あなたが幸せになるように学習します。

Meet Hume’s Empathic Voice Interface (EVI), the first conversational AI with emotional intelligence. pic.twitter.com/aAK5lIsegl
— Hume (@hume_ai) March 27, 2024

Heygen、進化

これまでは上半身のみで表情や言語を変えて、入力したテキスト通りに喋る動画を生成できてました。新機能「 Avatar in Motion 1.0」が搭載されたことにより、体全体の動きのある動画に対応できるようになりました。

[NEW] — Avatar in Motion 1.0🏃‍♂️✨

Move your hands, make gestures, use unique tones of voice, and HeyGen will flawlessly track, translate, and lip-sync your video with any input text.

Can't believe it?

👇Comment a script for what we should make Nik say & we’ll post the video! pic.twitter.com/d1X75Z5m2S
— HeyGen (@HeyGen_Official) March 27, 2024

写真から位置情報を特定されるアプリがダークウェブ上で販売されたニュースもありましたので、リアル情報を隠すためにも芸能人も使うようになるかもしれませんね。

↓ あわせて読みたい

【悲報：写真から位置情報を特定するアプリがダークウェブ上で販売される】

このアプリの名は「BadGemini」
ダークウェブ上で$45で販売されている

写真をアップすると写真の情報を読み込んで、Google Map上で正確な住所を表示

また、検出不可能なハッキング用のコードも生成可能

生成AIの闇の部分 pic.twitter.com/G6ijsLWTrd
— チャエン | 重要AIニュースを毎日発信⚡️ (@masahirochaen) March 27, 2024

ニュース

GPTs 一部ユーザーで収益化開始、スマホアプリでメンション機能のリリースも

アメリカの一部ユーザー限定で、GPTs で収益化が始まったようです。スマホの登場で App Store が栄えていったように、ChatGPT もより活発になっていきますね。

We’re partnering with a small group of US builders to test usage-based GPT earnings. Our goal is to create a vibrant ecosystem where builders are rewarded for their creativity and impact and we look forward to collaborating with builders on the best approach to get there.
— OpenAI (@OpenAI) March 27, 2024

また、海外の Android ユーザーから、モバイルアプリでもメンション機能が使えるようになったと報告が上がっているようです。スマホ上でいろんな GPTs を呼び出せるようになりました。
メンション機能もより使われるようになると、AI に依頼したらなんでもよしなにタスク実行をしてくれる AI エージェントの時代が到来しますね。
それに合わせたデバイスの登場も楽しみです。

LLM の「価格 VS スピード」の比較表

LLM の推論とスピードを比較した表です。

速度とコストでは groq が頭ひとつ抜けている
Claude 3 Opus は一番高い（その分性能も良いが）

LLM Pricing vs. Speed 💰

I ran experiments comparing inference cost vs. speed

Task: Text Generation.

Given Item 1 (Business) from latest 10-K, explain Nvidia's business model.

Experiment setup:
• 10 runs per model
• 1000 max output tokens
• calculate cost per run
•… pic.twitter.com/kWKCRJKBkh
— virat (@virattt) March 22, 2024

実際に Groq のスピードがどのくらい速いのか試した方、下記リンクから適当に質問を投げかけてみてください。予想を超えて速いです。思わず「えっっっ！？」って声が出ました。

↓ あわせて読みたい

Groq について

LLM の一覧とトークン毎の価格とコンテキストウィンドが表で纏められてるサイト「BotGenuity」

GPT-4、Gemini、Claude 3 で画像読み取り機能を比較

今話題の LLM で画像読み取り機能の精度を検証した結果、GPT-4：エアコン室外機、Gemini ：ショートケーキ、Claude 3：外に放置された食洗機（正解）、と回答。
マルチモーダルを謳っている Gemini が正解と一番遠そうな回答をしていることは驚きでした。Claude はさすがですね。

生成AI も起用し、MINORI 障害に備えるみずほ、膨大なエラーメッセージ読解し自動処理

エラーを減らすのではなく、自動処理をするようにするという方向性が興味深いです。

2023年夏にリリースした新システムを見ていこう。米Splunk（スプランク）の製品をベースに、エラーメッセージを受け取ると運用担当が使うマニュアルの手順に沿った対処を実行できるようにロジックをつくり込んだものだ。判断材料にするのはメッセージIDや対象システムなど。システムの状態を確認したり開発担当に「Teams」で連絡したり、あるいは対処不要と判断したりといった対応を自動で進めてくれる。
経営幹部などを対象としたダッシュボードも併せて開発した。システム単位や業務単位でエラーの発生状況を一覧でき、件数や時系列など表示内容は柔軟に変更できる。米ServiceNow（サービスナウ）の製品を使っている。「複数システムに障害が波及しても気付きやすい」（山本執行理事）利点もある。それまでは個々のシステムの状況は把握できても、システム全体の状況をつかむのは難しかった。

「Transformer」後継と期待される「RetNet」活用　PKSHAが日英対応の独自LLMを開発　日本MSも協力

LLM で課題として挙げられている GPU の問題ですが、RetNet は従来の Transformer と比較してメモリ消費を 1/3、レイテンシは 1/15 に抑えられ、スループットは最大8倍速いといわれています。

PKSHA Technology さんは、この RetNet 技術を活用した LLM を開発したと発表しました。今後の取り組みにも注目です！

日本IBMが金融向けに生成AIを「拡張」、MicrosoftやAWSのサービスも選択可能に

日本IBMが金融機関向けに生成AI（人工知能）の機能を「拡張」し、短期間で導入できるサービスを開発した。アプリケーションから生成AIのモニタリング・制御、インフラまでまとめて提供する。生成AIやインフラは米Microsoft（マイクロソフト）や米Amazon Web Services（アマゾン・ウェブ・サービス、AWS）のサービスも選べるようにする。日本IBMとして、銀行などの生成AIプロジェクトで蓄積した知見やノウハウを標準化し、横展開する狙いだ。

論文・技術系

Claude 3 Opus モデルの品質を維持しつつ、低コスト化する方法

Opus API を使用して、Haiku モデル用のプロンプトを自動生成するシステムが紹介されていました。
Opus は性能がかなり優れているものの、コストの課題がありました。この仕組みを使うことで一定解消ができるようです。

このコードは、AnthropicのClaude-3 Opus APIを使用して、与えられたタスク、プロンプト例、レスポンス例から、Claude-3 Haikuモデル用のプロンプトを自動生成するシステムです。主な処理は以下の通りです。

1. generate_candidate_prompts関数: 
   - タスク、プロンプト例、レスポンス例を受け取り、Claude-3 Opusモデルを使って7つの追加のプロンプト/レスポンスペアを生成。
   - 生成されたペアは多様で、元の例とは異なるものになる。

2. generate_system_prompt関数:
   - タスクと生成されたプロンプト/レスポンスペアを受け取り、Claude-3 Opusモデルを使ってタスクを完璧に記述するシステムプロンプトを生成。

3. test_haiku関数:
   - 生成されたプロンプト/レスポンスペア、元のプロンプト例、生成されたシステムプロンプトを受け取り、Claude-3 Haikuモデルでテスト。
   - Haikuモデルのレスポンスを返す。

4. run_haiku_conversion_process関数:
   - 上記の関数を順番に呼び出し、Haikuモデル用のプロンプトを生成。
   - 生成されたプロンプトをhaiku_prompt.pyファイルに保存。

このシステムを使うことで、ユーザーはOpusモデルの品質を維持しつつ、よりコストの低いHaikuモデルを使用するためのプロンプトを自動的に生成できます。最終的に生成されたプロンプトは、ディレクトリ内のhaiku_prompt.pyファイルに保存されます。

Introducing `claude-opus-to-haiku` ✍️

Get the quality of Claude 3 Opus, at a fraction of the cost and latency.

Give one example of your task, and Claude 3 Opus will teach Haiku (60x cheaper!!) how to do the task perfectly.

And it's open-source: https://t.co/nrivU2BWmn pic.twitter.com/0HW6NTZ1HN
— Matt Shumer (@mattshumer_) March 21, 2024

ディベート（討論）において、人間は人間よりもGPT-4が相手のとき81.7%高い確率で意見を変える（つまり討論に負ける）傾向にあった

もはやいうまでもないかもしれませんが、GPT-4 とディベートしても勝てないということが改めて示されました。
生成AI と戦うのではなく、どう使い倒すかが重要ですね。

ディベート（討論）において、人間は人間よりもGPT-4が相手のとき81.7%高い確率で意見を変える（つまり討論に負ける）傾向にあったとの実験結果が報告されています。

なお、討論相手の情報をLLMが把握することで、この大きな有意差が生まれるとのこと。

"On the Conversational Persuasiveness of… pic.twitter.com/i0rNH1gzLx
— AIDB (@ai_database) March 26, 2024

その他ニュース

Amazon が Anthropic に追加で 27億5,000万ドルを投資

Claude 3 を提供する Anthropic に対して、Amazon が追加で投資をしました。昨年9月にも12億5,000万ドルを投資しているため、好調具合が伺えます。
今回リリースされた Claude 3 の評判が良かったことも影響してそうです。

生成AI 活用は泥臭さが大事

やっぱり生成AI活用促進は泥臭さ。でもこれができる会社がほとんどいないんだよなぁ。

メンバーズデータアドベンチャーカンパニーは、社員の約90%が業務に生成AIを活用。

4ヶ月間の内部プロジェクトを通じて、コード生成、情報収集、アイデア出し、文章作成等の用途で成果。

【取り組みの内容】… pic.twitter.com/7wyBcGv6w0
— おざけん (@ozaken_AI) March 27, 2024

生成AI の登場で様々な業務の効率化・自動化ができるようになりましたが、プロダクトを導入しただけで「あら不思議！勝手に自動化されていく〜。」なんてことはありません。
昨年秋に公開された PwC のレポートにもあるように、生成AI活用に求められているのは「高度なテクニカルスキル」ではなく「基本的なAIリテラシー」です。それらを実現するためには、泥臭さが必要になります。

生成AI が便利でビジネス上のインパクトが大きいことは言うまでもなく、それらを使いこなすための「泥臭さ」が必要だということは改めて念頭に置いておきたいですね。

↓ あわせて読みたい

今週もニュースが盛りだくさんの1週間でした。来週もどんなニュースがあるのか楽しみです！

今週もお疲れ様でした！

=========================================
この note が気に入ってくれた方は、
ぜひ「いいね」と「フォロー」をお願いします♪

X（旧Twitter）でも生成 AI や LLM に関する情報を発信してますので、
ぜひ覗いてみてください！

「株式会社エクスプラザ（公式）」アカウント
https://twitter.com/explaza_inc
「生成AI事例集」アカウント
https://twitter.com/explaza_usecase

生成AI事例集

会社HP

この記事が気に入ったらサポートをしてみませんか？

[03/23~03/29] LLM Weekly News

プロダクト・サービス

誰でも簡単に web サイトが作れる 「create.xyz」

感情知能を備えた会話型AI 「Hume」

Heygen、進化

ニュース

GPTs 一部ユーザーで収益化開始、スマホアプリでメンション機能のリリースも

LLM の「価格 VS スピード」の比較表

GPT-4、Gemini、Claude 3 で画像読み取り機能を比較

生成AI も起用し、MINORI 障害に備えるみずほ、膨大なエラーメッセージ読解し自動処理

「Transformer」後継と期待される「RetNet」活用 PKSHAが日英対応の独自LLMを開発 日本MSも協力

日本IBMが金融向けに生成AIを「拡張」、MicrosoftやAWSのサービスも選択可能に

論文・技術系

Claude 3 Opus モデルの品質を維持しつつ、低コスト化する方法

ディベート（討論）において、人間は人間よりもGPT-4が相手のとき81.7%高い確率で意見を変える（つまり討論に負ける）傾向にあった

その他ニュース

Amazon が Anthropic に追加で 27億5,000万ドルを投資

生成AI 活用は泥臭さが大事

誰でも簡単に web サイトが作れる「create.xyz」

「Transformer」後継と期待される「RetNet」活用　PKSHAが日英対応の独自LLMを開発　日本MSも協力