Maki@Sunwood.ai.labs

エンジニアの日常を配信します. 画像生成/音楽生成/機械学習/強化学習/深層学習/スポ…

Maki@Sunwood.ai.labs

エンジニアの日常を配信します. 画像生成/音楽生成/機械学習/強化学習/深層学習/スポーツAI/資産形成/業務自動化

マガジン

最近の記事

Hugging Face CI/CDにおけるエラー解消: Git LFS設定と画像ファイルの履歴削除

はじめにこの記事では、Hugging Faceとの連携におけるCI/CDプロセス中に生じる可能性のあるエラーを解消する方法を解説します。具体的には、Gitリポジトリで大きな画像ファイル(PNG、GIF、JPG)を扱う際に発生する問題を解決するため、Git LFS(Large File Storage)の導入と、過去のコミットからのこれらファイルの削除に焦点を当てます。これにより、Hugging Faceでの自動化プロセスがスムーズに進行し、エラーが防げるようになります。 こ

    • OpenAI Python APIライブラリでGemini Proを呼び出してみた【Gemini-OpenAI-Proxy】

      OpenAIのPython APIライブラリを使用して、Gemini APIを呼び出す過程は、初心者にとっても分かりやすく、かつ実践的な学びを提供します。この記事では、具体的なコードブロックを使用して、その手順を詳しく解説していきます。Pythonの基礎知識があれば、このプロセスを通じて、AIとのインタラクションや、より複雑なプログラミング概念に対する理解を深めることができるでしょう。 初歩から学ぶAPI呼び出しAPIとは、アプリケーションプログラミングインターフェースの略

      • AIキャラクター実況をStyle-Bert-VITS2とVMagicMirrorで始めよう

        仮想オーディオデバイス「VB-CABLE」の設定実況や配信の環境構築の第一歩として、仮想オーディオデバイス「VB-CABLE」の設定から始めます。VB-CABLEは、異なるアプリケーション間でオーディオ信号を送受信するための仮想オーディオケーブルです。以下の手順で設定を行いましょう。 公式ウェブサイトからソフトウェアをダウンロードし、インストールします。 インストール後、システムのサウンド設定で「VB-CABLE」を出力および入力デバイスとして選択します。 ブラウザや録

        • 【Dockerでワンパン】PokéLLMonを動かしてみる

          PokéLLMonは、ポケモンバトルのゲームにおいて、人間並みのパフォーマンスを実現する最初のLLM(Large Language Model)を体現したエージェントです。この記事では、PokéLLMonを実際に動かすための手順を初心者向けに解説します。Dockerを使用して環境を構築し、ローカルでヒューリスティックボットと対戦する方法までを説明します。 こちらの記事もおすすめ 環境構築まずは、PokéLLMonを動かすための環境を構築することから始めます。Dockerを

        Hugging Face CI/CDにおけるエラー解消: Git LFS設定と画像ファイルの履歴削除

        マガジン

        • OpenInterpreter
          1本
        • ハッキング体験
          1本

        記事

          【日本語訳】PokéLLMon: A Human-Parity Agent for Pokémon Battles with Large Language Models

          概要(abstract)我々は、戦術的なバトルゲームにおいて人間並みのパフォーマンスを達成した初のLLM(大規模言語モデル)搭載エージェント、「ポケLLモン」を紹介します。これは、ポケモンバトルで示されています。ポケLLモンの設計は三つの鍵となる戦略を取り入れています。 三つの鍵となる戦略 インコンテキスト強化学習: バトルから得られたテキストベースのフィードバックを即時に活用し、ポリシー(方針)を反復的に洗練させる。 知識拡張生成: 外部知識を取得して幻覚を防ぎ、

          【日本語訳】PokéLLMon: A Human-Parity Agent for Pokémon Battles with Large Language Models

          高解像度のAI画像を0.5秒で生成する「PixArt-δ」の登場

          はじめに最新技術の進化は日々驚きをもたらしますが、特に注目を集めているのが、AIによる高解像度画像生成の分野です。この記事では、その最先端を行く「PixArt-δ(ピクサート・デルタ)」について、その驚異的な性能と特徴を詳しく見ていきましょう。 こちらの記事もおすすめ PixArt-δの登場背景まず、PixArt-δがどのような背景から開発されたのかを見てみましょう。このモデルは、Huawei Noah's Ark Lab、大連理工大学、Hugging Faceなどの研究

          高解像度のAI画像を0.5秒で生成する「PixArt-δ」の登場

          Android Studio で Geminiアプリ を作成して実機で動作確認してみる

          はじめにAndroidアプリの開発は、技術の進歩とともによりアクセスしやすくなっています。特にAndroid Studioは、開発者にとって非常に強力なツールです。この記事では、Android Studioを使用してGeminiアプリを作成し、実機での動作確認をする方法について、詳しく説明します。 大まかな流れはこちらの記事を参照してください。 こちらの記事もおすすめ スマートフォンを開発者モードに設定するまず、スマートフォンを開発者モードに設定し、USBデバッグを有効

          Android Studio で Geminiアプリ を作成して実機で動作確認してみる

          【Fate・東方ネタで学ぶ】LangChain の Tavily Search API を使ってみる【GooggleColabノートブック付】

          はじめに最近のAI技術の進化に伴い、LangChain と Tavily Search API が注目されています。この記事では、LangChain の枠組みと Tavily Search API の特徴に焦点を当て、初心者向けに簡潔に解説します。特に、下記のコードブロックを用いて、実際の使用方法を詳細に説明します。 こちらの記事もおすすめ LangChainとは?LangChainは、言語モデルを利用したアプリケーション開発のためのフレームワークです。このフレームワーク

          【Fate・東方ネタで学ぶ】LangChain の Tavily Search API を使ってみる【GooggleColabノートブック付】

          GPTs Actions Schemaの簡単構築術

          はじめにGPTs Actionsの構築は、今日のデジタル世界における重要なスキルの一つです。特に、GPTsに特化した「ActionsGPT」は、この分野での作業を劇的に簡素化します。この記事では、GPTs Actionsを構築するための簡単な方法と、ActionsGPTの利用方法を詳しく解説します。 この辺りのGPTsもこちらのワークフローで作成してます GPTs Actions Schemaの構築方法GPTs Actions Schemaを構築する際、まず理解するべきは

          GPTs Actions Schemaの簡単構築術

          Google Apps ScriptとGemini Proを活用してサーバーレスなLINE Botを構築する

          はじめにGoogle Apps Script(GAS)とGemini Proを使うことで、サーバーを必要とせずに機能豊かなLINE Botを簡単に構築できます。この記事では、具体的なコード例を用いて、その構築方法を解説します。 こちらのオウム返しできる環境が必要です。 Gemini Pro APIとの統合まず、Gemini Pro APIを使った応答生成機能をGASに統合します。以下の`getGeminiApiResponse`関数は、ユーザーからのメッセージ(プロンプト

          Google Apps ScriptとGemini Proを活用してサーバーレスなLINE Botを構築する

          Google Apps Script と LINEを使ったオウム返しBotの作成方法

          オウム返しBotは、入力されたメッセージをそのまま返すシンプルなBotです。この記事では、Google Apps Script (GAS) と LINEを使用して、10分程度でオウム返しBotを作成する方法をご紹介します。LINE botの基本設定は、こちらのリンク にて詳しく説明しています。 はじめにオウム返しBotを作成する前に、LINEでチャネルアクセストークンを生成し、GASのスクリプトプロパティに設定する必要があります。これにより、BotとLINEプラットフォーム

          Google Apps Script と LINEを使ったオウム返しBotの作成方法

          再生

          Perspectives on the State and Future of Deep Learning – 2023~日本語解説まとめ~

          著名な研究機関の専門家7名と、AI技術の最前線で活躍するChatGPTが集い、人工知能(AI)技術の「現在」と「未来」について深い議論を交わした「Perspectives on the State and Future of Deep Learning - 2023」の日本語解説です。 詳しくはこちら https://hamaruki.com/deep-learning-current-status-and-future-prospects-2023-japanese-commentary-summary/

          Perspectives on the State and Future of Deep Learning – 2023~日本語解説まとめ~

          再生

          AIの現況と未来:Perspectives on the State and Future of Deep Learning - 2023~日本語解説まとめ~

          はじめに著名な研究機関の専門家7名と、AI技術の最前線で活躍するChatGPTが集い、人工知能(AI)技術の「現在」と「未来」について深い議論を交わした「Perspectives on the State and Future of Deep Learning - 2023」の日本語解説です。 ざっくりスライド動画 作成中 Abstract Interlocutor Q1:最大の未解決問題**最も取り組むべきだが、まだ取り組まれていない大きな問題(Biggest p

          AIの現況と未来:Perspectives on the State and Future of Deep Learning - 2023~日本語解説まとめ~

          トカマクラブで学ぶGemini APIを用いたQAデータベースの自動生成

          はじめにGemini APIを使用して、東方のWikiからQAペアを自動生成し、それらをCSVファイルに保存する方法を説明します。 こちらの記事もおすすめ 手順の概要環境のセットアップ : 必要なライブラリのインストールとAPIキーの設定。 QAペアの生成 : テキストデータからQAペアを生成。 CSVへの保存 : 生成されたQAペアをCSVファイルに保存。 CSVの結合 : 複数のCSVファイルを結合して最終的なQAデータベースを形成。 コードの解説環境の

          トカマクラブで学ぶGemini APIを用いたQAデータベースの自動生成

          トカマクラブで学ぶGeminiAPIのEmbeddingに関する解説記事

          概要本記事では、Gemini APIを活用したドキュメント検索の手法を紹介します。ここではPythonクライアントライブラリを使用し、検索文字列とドキュメントの内容を比較できる埋め込みを作成するプロセスを学びます。特に、東方M1グランプリのトカマクラブに関連する質問に対して、埋め込みを用いた文書検索の実例を見ていきます。 こちらの記事もおすすめ 前提条件このチュートリアルはGoogle Colabで実行可能ですが、自分の開発環境で行う場合はPython 3.9とJupyt

          トカマクラブで学ぶGeminiAPIのEmbeddingに関する解説記事

          【Gemini API】Python Quickstart 日本語版

          はじめにこのコードは、GoogleのGemini APIを使用したPythonクイックスタートガイドです。Gemini APIは、Googleの大規模言語モデルにアクセスするためのPython SDKを提供します。このガイドでは、APIのセットアップから、テキストや画像を含むマルチモーダル入力を使ってテキスト応答を生成する方法まで、一連のステップを通じて詳細に説明されています。以下にその解説を行います。 下記の記事もおすすめ インポートとパッケージの準備import pa

          【Gemini API】Python Quickstart 日本語版