owlet_notes99.9

owlet_notes99.9

最近の記事

#LetsStartGPTsCardBattle

GPTsでトレーディングカードゲームを作成したいと思い、試行錯誤しています。 うまくできない理由は最後に述べます。 試作中のバトルカードまず、プレイヤー1(自分)のカードと、相手となるプレイヤー2のカードを見せてもらいます。 カード同士のバトルシーンを視覚化もし、結果を知らせてもらいます。 あなた Start Battle Card Battle Results: Player 1's minimalist, cute rotary phone monster and

    • LlamaIndex CohereAI Embeddings

      LlamaIndexのCohereAI Embeddings先日Cohere & LlamaIndexを使い、外部データを参照するコードを試していました。 調べている際にLlamaIndexのCohereAI Embeddingsも試したので、そのメモです。 上記サイトのコードを参照し、わからないところは Cohere Coral や ChatGPT(いずれも無料版)に聞きながら進めました。 特に Cohere Coral の回答は下記の文章によく使っています。 埋め

      • RAG の概念と関連している処理をCohere & LlamaIndexで試す

        Cohere DocsのLlamaIndex今回試したのはCohere DocsのLlamaIndexです。 ここに記載しているコードを、CohereのチャットインタフェースCoralの聞いて得た回答は、「Cohere の LLM サービスを使用して生成と埋め込みの両方を処理し、 RAG の概念と関連している処理です。完全な RAG モデルを実装しているわけではありません」でした。 RAG(Retrieval Augmented Generation)。 外部データを活

        • Llama 3をGroqとColabで試してみる

          2024年4月18日、米Meta社がLLMのLlamaシリーズの最新モデルLlama 3を公開しました。 それを契機に、久しぶりにLLM関連を調べ、Llama 3自体を動かしたりしました。 自分のMacBook Pro(M1 Pro、16GB)ではローカルでLLMを動かすのは難しいので、クラウド環境で利用できるのものが中心です。 今回参考にさせて頂きました ↓。 Llama 3を高速動作させるGroq複数のLLMを試せるGroqChat。 Llama 3を高速に動かせる

        #LetsStartGPTsCardBattle

          FooocusのInput Imageを今後も使うためのメモ

          画像を用意FooocusのInput image。 Image Prompt など、画像をプロンプトとして使うImage To Image機能が使用可能。 # Fooocusを使い、angry(怒っている)を使ったプロンプトで画像生成。 # 使用したモデルはCivitaiから取得したanima_pencil-XL。 # 画面下のAdvancedにチェック。 # Model→Base Modelで以下コードでダウンロードしたモデルを選択。 # Fooocusインストール!

          FooocusのInput Imageを今後も使うためのメモ

          DALL·E 3が駄々をこねたら

          最近、こう言われたことはありませんか? 申し訳ありませんが、実際のスケッチや画像を生成する機能はサポートしておりません。 進化の早い技術なので、すぐ言われなくなるかもしれませんが、 そんな時はこう言い返して画像を生成してもらいます。 DALLEは画像生成できるはずです。 デザイン画像を見せてください。 ※カバー画像はChatGPT PlusのDALL·E 3に作成してもらいました。 以下DALL·E 3の説明です。

          DALL·E 3が駄々をこねたら

          生成AI Cohere ことはじめ

          生成AIのスタートアップ企業カナダCohere(コーヒア)。 2024年4月4日、最新のLLMとなるCommand R+が公開されました。 公式サイトからアカウントを作成した後の遷移先では、APIキーの発行やチャットなどができます。 ただし、無料で使える範囲では、パフォーマンスに制限がかかるようです。 チャット型CoralチャットI/Fを使うにはCoralを選びます。 スペック比較表を作ってくださいChatGPT同様に会話ができます。 レスポンスはよいです。 わずかに日本

          生成AI Cohere ことはじめ

          ChatGPTに画像からWebアプリを作ってもらう(プロトタイプ編)

          画像からWebアプリ普段コードを書かない人でもどの程度できるのかな?、と興味を持ったのが始まりでした。 ChatGPTに上記画像をアップロードしてこう聞きました。 あなた 添付画像のインタフェースを持つWebアプリのPythonコードを教えてください。 ChatGPTはこう回答しました。 コードとHTMLテンプレートが提案されました。 ただ、Google Colaboratoryで動かしたかったので、確認する前に追加の依頼をしました。 Google Colabで動

          ChatGPTに画像からWebアプリを作ってもらう(プロトタイプ編)

          試行錯誤しながら使うDALL·Eの画像編集機能

          DALL·E3で作成した画像を編集できる機能がChatGPT Plusに備わりました。 しかし、思うように使えていません。 色々試しながら、Tipsを集めている最中です。 (今のところ、他のサイトを調べたりしないで使い始めてます) #まずドラゴンの絵を作成「空を飛ぶ漆黒の巨大ドラゴン。」 というプロンプトで生成し、この画像の編集を行います。 選択アイコン 画像をクリックすると編集のインタフェースに切り替わります。 右上の「選択」アイコンを選ぶことで、画像の変更範囲を、描

          試行錯誤しながら使うDALL·Eの画像編集機能

          Gemini & Googleスプレッド & AI Studioの連携プレーでキーワードから商品企画

          Gemini(旧称Bard)でインポートデータ作成GoogleスプレッドにエクスポートGeminiが生成した表の右下「Googleスプレッドシートにエクスポート」をクリック。 Google AI StudioでインポートCreat new → Structured prompt Actions → Import examples My Drive → Insert Assign to を設定。 → Import 5 examples Test your promptT

          Gemini & Googleスプレッド & AI Studioの連携プレーでキーワードから商品企画

          統計表データをChatGPT 4に読ませてみて思った使い所

          ChatGPT 4に、数値情報が入った表データのPDFをアップロードし、どの程度正しく内容を解釈しているか試してみました。 試用後の感触としては、 要点や傾向・動向を確認するには十分使えそう PDFの情報をベースに提案してくれるアイデア発想力十分 でも、ピックアップしてくる数字については確認が必要 となります。 白書のデータを利用上記白書のポータルから、観光白書の「資料」(令和5年度版)を生成AIが解釈できるのかを試しました。 文章による解説はなく、主に表(8ペ

          統計表データをChatGPT 4に読ませてみて思った使い所

          GPTsのActionsに実装する犬猫API

          GPTsのActionsを使うと、外部APIからデータを取得できます。 実はつい最近まで「Schema(スキーマ)っ何?」と何もわかってない状態でした(今もなんとなくしか分かってません)。 犬や猫の写真を表示するAPI(The Dog APIとThe Cat API)を利用した例をネットでいくつか見つけ、参考にして使っていました。 ただこのAPIの使用例、ちょっとわからないことがあり、気になっていたので再度見直し整理しました。 DOG APIは2種類犬種によるフィルター

          GPTsのActionsに実装する犬猫API

          リアルタイムテキスト画像生成AIから動画生成まで

          今回、古い車好きの独り言です。 Stability AIの「SDXL Turbo」。 ・リアルタイムでテキストから画像への出力を生成することができる。 ・最初使った時は驚いた。 ・でもどんな楽しみ方が? ・Clipdropでは無料枠ですぐに上限回数のため使えなくなる。 ・ところがLeoanrd.Aiの「Realtime Generation」(無料枠での利用)。 ・たぶん同系統のエンジンを持ち、こちらは現状無制限らしい。 ・しかも画風を変える4つのスライダーを装備。

          リアルタイムテキスト画像生成AIから動画生成まで

          ChatGPTに教えてもらった短いコードを思った以上に修正した話

          ※カバー画像は「プログラミングは楽しい! それが伝わるピクトグラムを作成してください。 共通のアイコンにします。」とChatGPT 4に依頼しました。 使用したのは「ChatGPT 3.5」です。 短いプログラムのコードに関する質問だったので3.5で十分だと思いました。 Pythonコードを教えてもらうまず、ChatGPT 3.5に以下の依頼。 勾配ブースティングを scikit-learnのサンプルデータセットで試したいです。 やさしくコードを教えてください。 何度

          ChatGPTに教えてもらった短いコードを思った以上に修正した話

          グレート・ピレニーズをTVで見ていたらふとFooocusを使ってみようと思った(LoRA編)

          上記の続きです。 「Fooocus」で「LoRA」を試しました。 3種類のLoRAモデルを使用LoRAのファイルは「Civitai」から取得しました。 今回はなんとなく気になった3つ。 古いアニメスタイル、輝くネオンテーストが特徴のスタイル、データビジュアライズされたネットワークにインスパイアされたスタイル、の3つです。 (3つ目は意味がよくわかってませんが、統一感のある独特な作風です) LoRAファイルをGoogle Colabで「/content/Fooocus/mo

          グレート・ピレニーズをTVで見ていたらふとFooocusを使ってみようと思った(LoRA編)

          Claudeのプロンプトライブラリ「情報源を活用する」をチャット型で試す

          Anthropic社がClaudeの「プロンプトライブラリ」を公開しています。 ライブラリの中の「情報源を活用する」(Cite your source)を使ってみました。 ただし、APIにリクエストするのではなく、チャット型に対してプロンプトを投げます。 トヨタの決算情報について聞くデータソースはトヨタ自動車の「決算報告プレゼンテーション資料」に変更しました。 プレゼン資料なので、聞き手(株主や関連会社など)向けの文章が整理されています。 この資料のPDFをチャット型

          Claudeのプロンプトライブラリ「情報源を活用する」をチャット型で試す