記事一覧
こんにちは!AIが賢くなるためのすごい技術、「RAG」について説明するよ! 〜 Cohere Cookbookのサンプルコードから
Gemini 1.5 Pro(Google AI Studio)を使い、Cohere Cookbook(notebooks)で見つけたRAG(Retrieval-Augmented Generation)のサンプルコードの解説を、Geminiを使い「高校生向け」にアレンジしてもらいました。
一部変更や追記などしています。
AIが賢くなる方法:RAGってなんだろう?みんな、こんにちは!今日はAI
Gemini 1.5 Flash は速いのか?
軽量で高速応答米Googleが5月14日(現地時間)、マルチモーダルモデル Gemini のアップデートを発表しました。
Gemini 1.5 Pro よりも軽量で高速な応答が可能なモデル Gemini 1.5 Flash が初登場です。
早速 Google AI Studio にプレビュー版が搭載されていました。
Claude の anthropic-cookbook に使われている画像を
GPT-4o 発表、そしてより多くのインテリジェンスなツールを ChatGPT に無料で展開
フリーユーザー向けに機能拡大米OpenAIは5月13日(現地時間)、GPT の新モデル GPT-4o を発表しました。
GPT-4o を契機に、無料で使える ChatGPT の機能拡大も始まります。
紹介されている追加機能は以下です。
今後数週間に渡り、提供されていくそうです。
Experience GPT-4 level intelligence
Get responses(opens
Fugaku-LLM/Fugaku-LLM-13B-instruct を Colab で試す
富岳を使ったLLM2024年5月10日に公開された、大規模言語モデル Fugaku-LLM を Google Colab で試しました。
スーパーコンピュータ 富岳 を用いて学習した130億パラメータの LLM です。
Hugging Face と GitHub に公開されています。
Fugaku-LLM-13B-instructInstruction-tuned model の Fugak
例えば、車のモデルチェンジデザイン予想に ChatGPT 4 とちょっと Claude
使用するプロンプトパターンChatGPT Plusの使い道を色々と考えています。
例えば、車のモデルチェンジのデザイン予想。
CIVIC TYPE R
例えば、本田技研工業のCIVIC TYPE R。
実際にサイトのURLの情報をどこまで参照できているかは不明です。
URLを指定することで、正しいエンブレムを装備してくれる効果はあるようです。
キーコンセプトとキーカラーは Claude に
#LetsStartGPTsCardBattle
GPTsでトレーディングカードゲームを作成したいと思い、試行錯誤しています。
うまくできない理由は最後に述べます。
試作中のバトルカードまず、プレイヤー1(自分)のカードと、相手となるプレイヤー2のカードを見せてもらいます。
カード同士のバトルシーンを視覚化もし、結果を知らせてもらいます。
あなた
Start
Battle Card
Battle Results:
Player 1's m
LlamaIndex CohereAI Embeddings
LlamaIndexのCohereAI Embeddings先日Cohere & LlamaIndexを使い、外部データを参照するコードを試していました。
調べている際にLlamaIndexのCohereAI Embeddingsも試したので、そのメモです。
上記サイトのコードを参照し、わからないところは Cohere Coral や ChatGPT(いずれも無料版)に聞きながら進めました。
RAG の概念と関連している処理をCohere & LlamaIndexで試す
Cohere DocsのLlamaIndex今回試したのはCohere DocsのLlamaIndexです。
ここに記載しているコードを、CohereのチャットインタフェースCoralの聞いて得た回答は、「Cohere の LLM サービスを使用して生成と埋め込みの両方を処理し、
RAG の概念と関連している処理です。完全な RAG モデルを実装しているわけではありません」でした。
RAG(
Llama 3をGroqとColabで試してみる
2024年4月18日、米Meta社がLLMのLlamaシリーズの最新モデルLlama 3を公開しました。
それを契機に、久しぶりにLLM関連を調べ、Llama 3自体を動かしたりしました。
自分のMacBook Pro(M1 Pro、16GB)ではローカルでLLMを動かすのは難しいので、クラウド環境で利用できるのものが中心です。
今回参考にさせて頂きました ↓。
Llama 3を高速動作させ
FooocusのInput Imageを今後も使うためのメモ
画像を用意FooocusのInput image。
Image Prompt など、画像をプロンプトとして使うImage To Image機能が使用可能。
# Fooocusを使い、angry(怒っている)を使ったプロンプトで画像生成。
# 使用したモデルはCivitaiから取得したanima_pencil-XL。
# 画面下のAdvancedにチェック。
# Model→Base Model
DALL·E 3が駄々をこねたら
最近、こう言われたことはありませんか?
申し訳ありませんが、実際のスケッチや画像を生成する機能はサポートしておりません。
進化の早い技術なので、すぐ言われなくなるかもしれませんが、
そんな時はこう言い返して画像を生成してもらいます。
DALLEは画像生成できるはずです。 デザイン画像を見せてください。
※カバー画像はChatGPT PlusのDALL·E 3に作成してもらいました。
以
生成AI Cohere ことはじめ
生成AIのスタートアップ企業カナダCohere(コーヒア)。
2024年4月4日、最新のLLMとなるCommand R+が公開されました。
公式サイトからアカウントを作成した後の遷移先では、APIキーの発行やチャットなどができます。
ただし、無料で使える範囲では、パフォーマンスに制限がかかるようです。
チャット型CoralチャットI/Fを使うにはCoralを選びます。
スペック比較表を作ってく
ChatGPTに画像からWebアプリを作ってもらう(プロトタイプ編)
画像からWebアプリ普段コードを書かない人でもどの程度できるのかな?、と興味を持ったのが始まりでした。
ChatGPTに上記画像をアップロードしてこう聞きました。
あなた
添付画像のインタフェースを持つWebアプリのPythonコードを教えてください。
ChatGPTはこう回答しました。
コードとHTMLテンプレートが提案されました。
ただ、Google Colaboratoryで動かし
試行錯誤しながら使うDALL·Eの画像編集機能
DALL·E3で作成した画像を編集できる機能がChatGPT Plusに備わりました。
しかし、思うように使えていません。
色々試しながら、Tipsを集めている最中です。
(今のところ、他のサイトを調べたりしないで使い始めてます)
#まずドラゴンの絵を作成 「空を飛ぶ漆黒の巨大ドラゴン。」
というプロンプトで生成し、この画像の編集を行います。
選択アイコン
画像をクリックすると編集のインタフェ
Gemini & Googleスプレッド & AI Studioの連携プレーでキーワードから商品企画
Gemini(旧称Bard)でインポートデータ作成GoogleスプレッドにエクスポートGeminiが生成した表の右下「Googleスプレッドシートにエクスポート」をクリック。
Google AI StudioでインポートCreat new → Structured prompt
Actions → Import examples
My Drive → Insert
Assign to を設定