[03/23~03/29] LLM Weekly News
今回も社内で話題になったLLMに関するニュースをご紹介します。
2023年度は LLM が文字通り破竹の勢いて成長してきました。その歴史を追いかけてきた「LLM Weekly News」ですが、年度末最後の記事となります。
来年度から新しい取り組みも初めてまいりますので、ぜひ楽しみにしてお待ちください!
それでは今週の LLM ニュースです!
プロダクト・サービス
誰でも簡単に web サイトが作れる 「create.xyz」
今週、一番社内がざわつきました。
テキストだけで web ページの UI を作成、React でコード生成も可能です。
<特徴>
テキストだけでページを作成できる(生成されたものもそれぞれコンポーネント化されており修正可能)
コードは React で生成
スクショ(画像)を読み込ませてそれを元に生成させることも可能
API 連携も標準搭載(ChatGPTやGoogle系、画像生成AIなどのAPIが標準で搭載されている)
無料で使えるので、気になる方はぜひ触ってみてください。
感情知能を備えた会話型AI 「Hume」
”感情”を搭載した AI が登場しました。
EVIは、ユーザーの声のトーンを理解し、すべての言葉に意味を付加し、それを使用して独自の言語と音声をガイドしてくれるようです。
Heygen、進化
これまでは上半身のみで表情や言語を変えて、入力したテキスト通りに喋る動画を生成できてました。新機能「 Avatar in Motion 1.0」が搭載されたことにより、体全体の動きのある動画に対応できるようになりました。
写真から位置情報を特定されるアプリがダークウェブ上で販売されたニュースもありましたので、リアル情報を隠すためにも芸能人も使うようになるかもしれませんね。
↓ あわせて読みたい
ニュース
GPTs 一部ユーザーで収益化開始、スマホアプリでメンション機能のリリースも
アメリカの一部ユーザー限定で、GPTs で収益化が始まったようです。スマホの登場で App Store が栄えていったように、ChatGPT もより活発になっていきますね。
また、海外の Android ユーザーから、モバイルアプリでもメンション機能が使えるようになったと報告が上がっているようです。スマホ上でいろんな GPTs を呼び出せるようになりました。
メンション機能もより使われるようになると、AI に依頼したらなんでもよしなにタスク実行をしてくれる AI エージェントの時代が到来しますね。
それに合わせたデバイスの登場も楽しみです。
LLM の「価格 VS スピード」の比較表
LLM の推論とスピードを比較した表です。
速度とコストでは groq が頭ひとつ抜けている
Claude 3 Opus は一番高い(その分性能も良いが)
実際に Groq のスピードがどのくらい速いのか試した方、下記リンクから適当に質問を投げかけてみてください。予想を超えて速いです。思わず「えっっっ!?」って声が出ました。
↓ あわせて読みたい
Groq について
LLM の一覧とトークン毎の価格とコンテキストウィンドが表で纏められてるサイト「BotGenuity」
GPT-4、Gemini、Claude 3 で画像読み取り機能を比較
今話題の LLM で画像読み取り機能の精度を検証した結果、GPT-4:エアコン室外機、Gemini :ショートケーキ、Claude 3:外に放置された食洗機(正解)、と回答。
マルチモーダルを謳っている Gemini が正解と一番遠そうな回答をしていることは驚きでした。Claude はさすがですね。
生成AI も起用し、MINORI 障害に備えるみずほ、膨大なエラーメッセージ読解し自動処理
エラーを減らすのではなく、自動処理をするようにするという方向性が興味深いです。
「Transformer」後継と期待される「RetNet」活用 PKSHAが日英対応の独自LLMを開発 日本MSも協力
LLM で課題として挙げられている GPU の問題ですが、RetNet は 従来の Transformer と比較してメモリ消費を 1/3、レイテンシは 1/15 に抑えられ、スループットは最大8倍速いといわれています。
PKSHA Technology さんは、この RetNet 技術を活用した LLM を開発したと発表しました。今後の取り組みにも注目です!
日本IBMが金融向けに生成AIを「拡張」、MicrosoftやAWSのサービスも選択可能に
論文・技術系
Claude 3 Opus モデルの品質を維持しつつ、低コスト化する方法
Opus API を使用して、Haiku モデル用のプロンプトを自動生成するシステムが紹介されていました。
Opus は性能がかなり優れているものの、コストの課題がありました。この仕組みを使うことで一定解消ができるようです。
このコードは、AnthropicのClaude-3 Opus APIを使用して、与えられたタスク、プロンプト例、レスポンス例から、Claude-3 Haikuモデル用のプロンプトを自動生成するシステムです。主な処理は以下の通りです。
1. generate_candidate_prompts関数:
- タスク、プロンプト例、レスポンス例を受け取り、Claude-3 Opusモデルを使って7つの追加のプロンプト/レスポンスペアを生成。
- 生成されたペアは多様で、元の例とは異なるものになる。
2. generate_system_prompt関数:
- タスクと生成されたプロンプト/レスポンスペアを受け取り、Claude-3 Opusモデルを使ってタスクを完璧に記述するシステムプロンプトを生成。
3. test_haiku関数:
- 生成されたプロンプト/レスポンスペア、元のプロンプト例、生成されたシステムプロンプトを受け取り、Claude-3 Haikuモデルでテスト。
- Haikuモデルのレスポンスを返す。
4. run_haiku_conversion_process関数:
- 上記の関数を順番に呼び出し、Haikuモデル用のプロンプトを生成。
- 生成されたプロンプトをhaiku_prompt.pyファイルに保存。
このシステムを使うことで、ユーザーはOpusモデルの品質を維持しつつ、よりコストの低いHaikuモデルを使用するためのプロンプトを自動的に生成できます。最終的に生成されたプロンプトは、ディレクトリ内のhaiku_prompt.pyファイルに保存されます。
ディベート(討論)において、人間は人間よりもGPT-4が相手のとき81.7%高い確率で意見を変える(つまり討論に負ける)傾向にあった
もはやいうまでもないかもしれませんが、GPT-4 とディベートしても勝てないということが改めて示されました。
生成AI と戦うのではなく、どう使い倒すかが重要ですね。
その他ニュース
Amazon が Anthropic に追加で 27億5,000万ドルを投資
Claude 3 を提供する Anthropic に対して、Amazon が追加で投資をしました。昨年9月にも12億5,000万ドルを投資しているため、好調具合が伺えます。
今回リリースされた Claude 3 の評判が良かったことも影響してそうです。
生成AI 活用は泥臭さが大事
生成AI の登場で様々な業務の効率化・自動化ができるようになりましたが、プロダクトを導入しただけで「あら不思議!勝手に自動化されていく〜。」なんてことはありません。
昨年秋に公開された PwC のレポートにもあるように、生成AI活用に求められているのは「高度なテクニカルスキル」ではなく「基本的なAIリテラシー」です。それらを実現するためには、泥臭さが必要になります。
生成AI が便利でビジネス上のインパクトが大きいことは言うまでもなく、それらを使いこなすための「泥臭さ」が必要だということは改めて念頭に置いておきたいですね。
↓ あわせて読みたい
今週もニュースが盛りだくさんの1週間でした。来週もどんなニュースがあるのか楽しみです!
今週もお疲れ様でした!
=========================================
この note が気に入ってくれた方は、
ぜひ「いいね」と「フォロー」をお願いします♪
X(旧Twitter)でも生成 AI や LLM に関する情報を発信してますので、
ぜひ覗いてみてください!
「株式会社エクスプラザ(公式)」アカウント
https://twitter.com/explaza_inc
「生成AI事例集」アカウント
https://twitter.com/explaza_usecase
生成AI事例集
会社HP
この記事が気に入ったらサポートをしてみませんか?