Maki@Sunwood.ai.labs

エンジニアの日常を配信します. 画像生成/音楽生成/機械学習/強化学習/深層学習/スポ…

Maki@Sunwood.ai.labs

エンジニアの日常を配信します. 画像生成/音楽生成/機械学習/強化学習/深層学習/スポーツAI/資産形成/業務自動化

マガジン

記事一覧

《Claude》チームプラン・iOSアプリを発表

Claudeに関する2つのアップデートを発表されました。新しいチームプランとiOSアプリです。 こちらの記事もおすすめ チームプランの特徴チームプランでは、メンバーの利用…

GitHub Actions CI/CDを使ってPyPIに自動アップロード

はじめにGitHub Actions CI/CDを利用すると、GitHubでのイベント発生をトリガーに、一連のコマンドを自動実行できます。これを活用して、Pythonパッケージをビルドし、PyPI…

Hugging Face CI/CDにおけるエラー解消: Git LFS設定と画像ファイルの履歴削除

はじめにこの記事では、Hugging Faceとの連携におけるCI/CDプロセス中に生じる可能性のあるエラーを解消する方法を解説します。具体的には、Gitリポジトリで大きな画像ファ…

2

OpenAI Python APIライブラリでGemini Proを呼び出してみた【Gemini-OpenAI-Proxy】

OpenAIのPython APIライブラリを使用して、Gemini APIを呼び出す過程は、初心者にとっても分かりやすく、かつ実践的な学びを提供します。この記事では、具体的なコードブロ…

2

AIキャラクター実況をStyle-Bert-VITS2とVMagicMirrorで始めよう

仮想オーディオデバイス「VB-CABLE」の設定実況や配信の環境構築の第一歩として、仮想オーディオデバイス「VB-CABLE」の設定から始めます。VB-CABLEは、異なるアプリケーシ…

9

【Dockerでワンパン】PokéLLMonを動かしてみる

PokéLLMonは、ポケモンバトルのゲームにおいて、人間並みのパフォーマンスを実現する最初のLLM(Large Language Model)を体現したエージェントです。この記事では、Poké…

2

【日本語訳】PokéLLMon: A Human-Parity Agent for Pokémon Battles with Large Language Models

概要(abstract)我々は、戦術的なバトルゲームにおいて人間並みのパフォーマンスを達成した初のLLM(大規模言語モデル)搭載エージェント、「ポケLLモン」を紹介します。…

4

高解像度のAI画像を0.5秒で生成する「PixArt-δ」の登場

はじめに最新技術の進化は日々驚きをもたらしますが、特に注目を集めているのが、AIによる高解像度画像生成の分野です。この記事では、その最先端を行く「PixArt-δ(ピク…

4

Android Studio で Geminiアプリ を作成して実機で動作確認してみる

はじめにAndroidアプリの開発は、技術の進歩とともによりアクセスしやすくなっています。特にAndroid Studioは、開発者にとって非常に強力なツールです。この記事では、And…

1

【Fate・東方ネタで学ぶ】LangChain の Tavily Search API を使ってみる【GooggleColabノートブック付】

はじめに最近のAI技術の進化に伴い、LangChain と Tavily Search API が注目されています。この記事では、LangChain の枠組みと Tavily Search API の特徴に焦点を当て、初…

6

GPTs Actions Schemaの簡単構築術

はじめにGPTs Actionsの構築は、今日のデジタル世界における重要なスキルの一つです。特に、GPTsに特化した「ActionsGPT」は、この分野での作業を劇的に簡素化します。この…

15

Google Apps ScriptとGemini Proを活用してサーバーレスなLINE Botを構築する

はじめにGoogle Apps Script(GAS)とGemini Proを使うことで、サーバーを必要とせずに機能豊かなLINE Botを簡単に構築できます。この記事では、具体的なコード例を用いて…

2

Google Apps Script と LINEを使ったオウム返しBotの作成方法

オウム返しBotは、入力されたメッセージをそのまま返すシンプルなBotです。この記事では、Google Apps Script (GAS) と LINEを使用して、10分程度でオウム返しBotを作成す…

4

Perspectives on the State and Future of Deep Learning – 2023~日本語解説まとめ~

著名な研究機関の専門家7名と、AI技術の最前線で活躍するChatGPTが集い、人工知能(AI)技術の「現在」と「未来」について深い議論を交わした「Perspectives on the State …

AIの現況と未来:Perspectives on the State and Future of Deep Learning - 2023~日本語解説まとめ~

はじめに著名な研究機関の専門家7名と、AI技術の最前線で活躍するChatGPTが集い、人工知能(AI)技術の「現在」と「未来」について深い議論を交わした「Perspectives on th…

トカマクラブで学ぶGemini APIを用いたQAデータベースの自動生成

はじめにGemini APIを使用して、東方のWikiからQAペアを自動生成し、それらをCSVファイルに保存する方法を説明します。 こちらの記事もおすすめ 手順の概要環境のセット…

《Claude》チームプラン・iOSアプリを発表

《Claude》チームプラン・iOSアプリを発表

Claudeに関する2つのアップデートを発表されました。新しいチームプランとiOSアプリです。

こちらの記事もおすすめ

チームプランの特徴チームプランでは、メンバーの利用量を増やしユーザーや請求を管理するツールを備えたワークスペースを作成できます。業界を問わずチームが次世代のClaude 3モデルファミリーを活用するのに最適な方法です。このプランは、ユーザー1人あたり月額30ドルで利用できます

もっとみる
GitHub Actions CI/CDを使ってPyPIに自動アップロード

GitHub Actions CI/CDを使ってPyPIに自動アップロード

はじめにGitHub Actions CI/CDを利用すると、GitHubでのイベント発生をトリガーに、一連のコマンドを自動実行できます。これを活用して、Pythonパッケージをビルドし、PyPIに自動公開するワークフローを構築できます。

こちらの記事もおすすめ

事前準備PyPIのアカウントを作成しておく

プロジェクトのGitHubリポジトリを用意する

PyPIへの信頼できる公開の設定Py

もっとみる
Hugging Face CI/CDにおけるエラー解消: Git LFS設定と画像ファイルの履歴削除

Hugging Face CI/CDにおけるエラー解消: Git LFS設定と画像ファイルの履歴削除

はじめにこの記事では、Hugging Faceとの連携におけるCI/CDプロセス中に生じる可能性のあるエラーを解消する方法を解説します。具体的には、Gitリポジトリで大きな画像ファイル(PNG、GIF、JPG)を扱う際に発生する問題を解決するため、Git LFS(Large File Storage)の導入と、過去のコミットからのこれらファイルの削除に焦点を当てます。これにより、Hugging F

もっとみる
OpenAI Python APIライブラリでGemini Proを呼び出してみた【Gemini-OpenAI-Proxy】

OpenAI Python APIライブラリでGemini Proを呼び出してみた【Gemini-OpenAI-Proxy】

OpenAIのPython APIライブラリを使用して、Gemini APIを呼び出す過程は、初心者にとっても分かりやすく、かつ実践的な学びを提供します。この記事では、具体的なコードブロックを使用して、その手順を詳しく解説していきます。Pythonの基礎知識があれば、このプロセスを通じて、AIとのインタラクションや、より複雑なプログラミング概念に対する理解を深めることができるでしょう。

初歩から

もっとみる
AIキャラクター実況をStyle-Bert-VITS2とVMagicMirrorで始めよう

AIキャラクター実況をStyle-Bert-VITS2とVMagicMirrorで始めよう

仮想オーディオデバイス「VB-CABLE」の設定実況や配信の環境構築の第一歩として、仮想オーディオデバイス「VB-CABLE」の設定から始めます。VB-CABLEは、異なるアプリケーション間でオーディオ信号を送受信するための仮想オーディオケーブルです。以下の手順で設定を行いましょう。

公式ウェブサイトからソフトウェアをダウンロードし、インストールします。

インストール後、システムのサウンド設定

もっとみる
【Dockerでワンパン】PokéLLMonを動かしてみる

【Dockerでワンパン】PokéLLMonを動かしてみる

PokéLLMonは、ポケモンバトルのゲームにおいて、人間並みのパフォーマンスを実現する最初のLLM(Large Language Model)を体現したエージェントです。この記事では、PokéLLMonを実際に動かすための手順を初心者向けに解説します。Dockerを使用して環境を構築し、ローカルでヒューリスティックボットと対戦する方法までを説明します。

こちらの記事もおすすめ

環境構築まずは

もっとみる
【日本語訳】PokéLLMon: A Human-Parity Agent for Pokémon Battles with Large Language Models

【日本語訳】PokéLLMon: A Human-Parity Agent for Pokémon Battles with Large Language Models

概要(abstract)我々は、戦術的なバトルゲームにおいて人間並みのパフォーマンスを達成した初のLLM(大規模言語モデル)搭載エージェント、「ポケLLモン」を紹介します。これは、ポケモンバトルで示されています。ポケLLモンの設計は三つの鍵となる戦略を取り入れています。

三つの鍵となる戦略

インコンテキスト強化学習:

バトルから得られたテキストベースのフィードバックを即時に活用し、ポリシー(

もっとみる
高解像度のAI画像を0.5秒で生成する「PixArt-δ」の登場

高解像度のAI画像を0.5秒で生成する「PixArt-δ」の登場

はじめに最新技術の進化は日々驚きをもたらしますが、特に注目を集めているのが、AIによる高解像度画像生成の分野です。この記事では、その最先端を行く「PixArt-δ(ピクサート・デルタ)」について、その驚異的な性能と特徴を詳しく見ていきましょう。

こちらの記事もおすすめ

PixArt-δの登場背景まず、PixArt-δがどのような背景から開発されたのかを見てみましょう。このモデルは、Huawei

もっとみる
Android Studio で Geminiアプリ を作成して実機で動作確認してみる

Android Studio で Geminiアプリ を作成して実機で動作確認してみる

はじめにAndroidアプリの開発は、技術の進歩とともによりアクセスしやすくなっています。特にAndroid Studioは、開発者にとって非常に強力なツールです。この記事では、Android Studioを使用してGeminiアプリを作成し、実機での動作確認をする方法について、詳しく説明します。

大まかな流れはこちらの記事を参照してください。

こちらの記事もおすすめ

スマートフォンを開発者

もっとみる
【Fate・東方ネタで学ぶ】LangChain の Tavily Search API を使ってみる【GooggleColabノートブック付】

【Fate・東方ネタで学ぶ】LangChain の Tavily Search API を使ってみる【GooggleColabノートブック付】

はじめに最近のAI技術の進化に伴い、LangChain と Tavily Search API が注目されています。この記事では、LangChain の枠組みと Tavily Search API の特徴に焦点を当て、初心者向けに簡潔に解説します。特に、下記のコードブロックを用いて、実際の使用方法を詳細に説明します。

こちらの記事もおすすめ

LangChainとは?LangChainは、言語モ

もっとみる
GPTs Actions Schemaの簡単構築術

GPTs Actions Schemaの簡単構築術

はじめにGPTs Actionsの構築は、今日のデジタル世界における重要なスキルの一つです。特に、GPTsに特化した「ActionsGPT」は、この分野での作業を劇的に簡素化します。この記事では、GPTs Actionsを構築するための簡単な方法と、ActionsGPTの利用方法を詳しく解説します。

この辺りのGPTsもこちらのワークフローで作成してます

GPTs Actions Schema

もっとみる
Google Apps ScriptとGemini Proを活用してサーバーレスなLINE Botを構築する

Google Apps ScriptとGemini Proを活用してサーバーレスなLINE Botを構築する

はじめにGoogle Apps Script(GAS)とGemini Proを使うことで、サーバーを必要とせずに機能豊かなLINE Botを簡単に構築できます。この記事では、具体的なコード例を用いて、その構築方法を解説します。

こちらのオウム返しできる環境が必要です。

Gemini Pro APIとの統合まず、Gemini Pro APIを使った応答生成機能をGASに統合します。以下の`get

もっとみる
Google Apps Script と LINEを使ったオウム返しBotの作成方法

Google Apps Script と LINEを使ったオウム返しBotの作成方法

オウム返しBotは、入力されたメッセージをそのまま返すシンプルなBotです。この記事では、Google Apps Script (GAS) と LINEを使用して、10分程度でオウム返しBotを作成する方法をご紹介します。LINE botの基本設定は、こちらのリンク にて詳しく説明しています。

はじめにオウム返しBotを作成する前に、LINEでチャネルアクセストークンを生成し、GASのスクリプト

もっとみる

Perspectives on the State and Future of Deep Learning – 2023~日本語解説まとめ~

著名な研究機関の専門家7名と、AI技術の最前線で活躍するChatGPTが集い、人工知能(AI)技術の「現在」と「未来」について深い議論を交わした「Perspectives on the State and Future of Deep Learning - 2023」の日本語解説です。

詳しくはこちら
https://hamaruki.com/deep-learning-current-stat
もっとみる

AIの現況と未来:Perspectives on the State and Future of Deep Learning - 2023~日本語解説まとめ~

AIの現況と未来:Perspectives on the State and Future of Deep Learning - 2023~日本語解説まとめ~

はじめに著名な研究機関の専門家7名と、AI技術の最前線で活躍するChatGPTが集い、人工知能(AI)技術の「現在」と「未来」について深い議論を交わした「Perspectives on the State and Future of Deep Learning - 2023」の日本語解説です。

ざっくりスライド動画

作成中

Abstract

Interlocutor

Q1:最大の未解決問

もっとみる
トカマクラブで学ぶGemini APIを用いたQAデータベースの自動生成

トカマクラブで学ぶGemini APIを用いたQAデータベースの自動生成

はじめにGemini APIを使用して、東方のWikiからQAペアを自動生成し、それらをCSVファイルに保存する方法を説明します。

こちらの記事もおすすめ

手順の概要環境のセットアップ : 必要なライブラリのインストールとAPIキーの設定。

QAペアの生成 : テキストデータからQAペアを生成。

CSVへの保存 : 生成されたQAペアをCSVファイルに保存。

CSVの結合 : 複数

もっとみる