株式会社IZAI 技術ブログ

人と協業するAIロボットの実現を目指す東大発スタートアップ「株式会社IZAI」の公式n…

株式会社IZAI 技術ブログ

人と協業するAIロボットの実現を目指す東大発スタートアップ「株式会社IZAI」の公式note。 カスタマサポートやコールセンター、コンテンツ業界、Web業界等で活用できる最新の技術情報を発信しています。 HP: https://www.izai.co.jp/

記事一覧

自動でプロンプトエンジニアリングする『APE(Automatic Prompt Engineering)』を試す。LangGraph

こんばんは、IZAIエンジニアリングチームです。今回は、自動プロンプトエンジニア(APE)についての論文のアイディアをもとに、遺伝的アルゴリズムチックにプロンプトを自動…

人間並みに自然な音声生成AI「Style-Bert-VITS2JP-Extra」を試してみた。

こんにちは、IZAIエンジニアチームです。今回はテキストから感情豊かな音声を生成できるOSS「Style-Bert-VITS2」の中でも日本語の音声生成に特化した「Style-Bert-VITS2JP-…

LLMエージェント機能を簡単に構築できるLangGraphを試してみた。RAGチャットボット

こんにちは!株式会社IZAI、エンジニアチームです。 今回は、LLM搭載サービスを開発するときに重要な、条件分岐やループ構造を簡単に構築できると話題の「LangGraph」を試…

RAGのチャンクサイズと検索手法(Vector Index / Summary Index)について考察してみた。Llama Index, LLM

こんにちは!株式会社IZAI、エンジニアチームです。 今回は、Llama IndexというOSSライブラリを使ってRAGを実装し、その検索精度に与える各パラメータの影響を考察してみま…

iPhone単体でオンデバイスLLMを試してみた。LLMFarm

こんにちはIZAIエンジニアチームです。 今回は、「LLMFarm」というiPhone上でLLMを動かせるOSSを、iPhone 15 Proを使って試してみます。 https://github.com/guinmoon/LLMF

RAGの効率を劇的に向上させる手法 xRAG(Extreme Context Compression for RAG)を試してみた。

こんにちは、IZAIエンジニアチームです。 今回は、先日arXivに公開されたxRAG: Extreme Context Compression for Retrieval-augmented Generation with One Tokenという論…

パラメータ効率が圧倒的に高いLLM学習手法ReFT(Representation Finetuning)を試してみた。

こんにちは!株式会社IZAI、エンジニアチームです。 今回は従来のLLMファインチューニング手法よりも10~50倍効率的とされているReFT(Representation Finetuning)を試してみ…

②RAGで社内文書を回答するChatGPTをAzure AI Searchで構築する方法。社内問い合わせAIを作る

RAGで社内文書を回答するChatGPTをAzure AI Searchで構築する方法の後編です。承認メールが届いたら早速RAGを構築しましょう。 手順①がまだお済みで無い方はこちらから↓…

①RAGで社内文書を回答するChatGPTをAzure AI Searchで構築する方法。社内問い合わせAIを作る

こんにちは、株式会社IZAI、エンジニアチームです。 今回は、社内情報を参照して回答するChatGPTをAzure上で構築する手順を説明します。 【はじめに】RAG = 外部データを…

自動でプロンプトエンジニアリングする『APE(Automatic Prompt Engineering)』を試す。LangGraph

こんばんは、IZAIエンジニアリングチームです。今回は、自動プロンプトエンジニア(APE)についての論文のアイディアをもとに、遺伝的アルゴリズムチックにプロンプトを自動で調整する方法を試してみました。 APE(Automatic Prompt Engineering)とはAPEはAutomatic Prompt Engineeringの略で、その名の通り自動でプロンプトエンジニアリングを行うアルゴリズムです。与えられたタスクをもとにオリジナルのプロンプトと意味的に近しいプロ

人間並みに自然な音声生成AI「Style-Bert-VITS2JP-Extra」を試してみた。

こんにちは、IZAIエンジニアチームです。今回はテキストから感情豊かな音声を生成できるOSS「Style-Bert-VITS2」の中でも日本語の音声生成に特化した「Style-Bert-VITS2JP-Extra」を使って、より自然な人の声が再現できるか試してみます。 公式チュートリアル動画もありますのでこちらもぜひ。 試してみる1. データの準備 今回は音声データとして国立研究開発法人情報通信研究機構(NICT)が公開している「話速変換コーパス:SpeedSpeech

LLMエージェント機能を簡単に構築できるLangGraphを試してみた。RAGチャットボット

こんにちは!株式会社IZAI、エンジニアチームです。 今回は、LLM搭載サービスを開発するときに重要な、条件分岐やループ構造を簡単に構築できると話題の「LangGraph」を試してみます。 LangGraphとはLangGraphとはLangChainの派生ライブラリで、LangChainの動作に加え、ステートマシンのような計算グラフを作成し条件分岐やループ処理などを行うことができます LangGraphを使ってみるLangGraphのグラフは通常の計算グラフ同様Node

RAGのチャンクサイズと検索手法(Vector Index / Summary Index)について考察してみた。Llama Index, LLM

こんにちは!株式会社IZAI、エンジニアチームです。 今回は、Llama IndexというOSSライブラリを使ってRAGを実装し、その検索精度に与える各パラメータの影響を考察してみます。 そもそもRAGとはRAG(Retrieval Augmented Generation)とはLLMにデータを入力する際に、 外部の知識ベースからその入力内容に合った情報を探し出し、その情報をLLMに渡すことで回答精度を上げる手法です。 RAG(Retrieval Augmented Gen

iPhone単体でオンデバイスLLMを試してみた。LLMFarm

こんにちはIZAIエンジニアチームです。 今回は、「LLMFarm」というiPhone上でLLMを動かせるOSSを、iPhone 15 Proを使って試してみます。 https://github.com/guinmoon/LLMFarm 「LLMFarm」は、数GB程度の軽量なモデルをiOS/M系Silicon で実行可能にするプロジェクトで、『ggml』と『llama.cpp』をベースにしています。TestFlight経由でiOSアプリが配布されているので、誰でも簡単に手

RAGの効率を劇的に向上させる手法 xRAG(Extreme Context Compression for RAG)を試してみた。

こんにちは、IZAIエンジニアチームです。 今回は、先日arXivに公開されたxRAG: Extreme Context Compression for Retrieval-augmented Generation with One Tokenという論文についてご紹介します。 xRAGとは?xRAGは、Retrieval-Augmented Generation (RAG)を拡張した手法です。RAGでは、検索結果のチャンク(文章断片)をそのまま言語モデルに入力するのに対し

パラメータ効率が圧倒的に高いLLM学習手法ReFT(Representation Finetuning)を試してみた。

こんにちは!株式会社IZAI、エンジニアチームです。 今回は従来のLLMファインチューニング手法よりも10~50倍効率的とされているReFT(Representation Finetuning)を試してみます。 現論文はこちら 1. ReFTとはファインチューニング ReFTとはRepresentation Finetuningの名前の通りファインチューニングにおける学習法です。今回紹介する手法は以下の図の赤枠の部分になります。 図を見て分かる通りァインチューニングでは

②RAGで社内文書を回答するChatGPTをAzure AI Searchで構築する方法。社内問い合わせAIを作る

RAGで社内文書を回答するChatGPTをAzure AI Searchで構築する方法の後編です。承認メールが届いたら早速RAGを構築しましょう。 手順①がまだお済みで無い方はこちらから↓↓↓ 本編 3. Azure OpenAIを有効にする申請が無事通ったら、Azure OpenAI Service を使ってRAG試用環境を作っていきます。 (実働時間 10分) 3-1. [リソースの作成]をクリック 3-2. Azure OpenAIを作成 3-3. リソース

①RAGで社内文書を回答するChatGPTをAzure AI Searchで構築する方法。社内問い合わせAIを作る

こんにちは、株式会社IZAI、エンジニアチームです。 今回は、社内情報を参照して回答するChatGPTをAzure上で構築する手順を説明します。 【はじめに】RAG = 外部データを参照する手法RAG(ラグ)とはRetrieval-Augmented Generationの略で、LLMに社内データを検索、参照させて回答を生成する手法で各社が様々な商品を提供しています。 Azure AI SearchとはAzure AI Searchというサービスは文字、表、非構造化データ