Local LLM

2024年8月18日 18:25

Reranking, RAG series 6/n

RAGシリーズ６回目。
5回目でskipした下記フローのうち、Rerankingのメモです。

RAGのフローを5つのStepに分割しています。
① Query Classification：RAGの要否判断
② Retrieval：情報源の取得
③ Reranking：取得情報の順序最適化
④ Repacking：構造化
⑤ Summarization：要約

概要上記フローの②、③のみです。

もっとみる

Pes Cafe

2024年8月18日 14:46

一般的なRAGのworkflow, RAG series 5/n

RAGシリーズ５回目。

本稿にはあまり関係ないのですが、下の図がわかりやすくて良いなと感じたので、下図に則ってメモを残していこうと思いました。

RAGのフローを5つのStepに分割しています。
① Query Classification：RAGの要否判断
② Retrieval：情報源の取得
③ Reranking：取得情報の順序最適化
④ Repacking：構造化
⑤ Summariza

もっとみる

Pes Cafe

2024年8月4日 17:39

Lens.orgの特許Data活用(TOYOTA 1/n)

企業がその特許にどれ程力を入れているかを示す指標のひとつとしてファミリー数があります。Lens.orgはそのファミリー数を簡単に取得できます。

ユーザー登録だけすれば、50,000件の特許の基本的なDataをファミリー数(Simple family, Extended family)とともに出力できます。

例えばLens.orgで出力したTOYOTAの特許を分類し、以下のような最近特に出願件数

もっとみる

Pes Cafe

2024年6月29日 20:44

Llama-3-ELYZA-JP-8Bを雑に触る

Llama-3-ELYZA-JP-8Bについては下記参照。

0. 環境

1. RAGに使用するDBの準備

下記で作成したDBを流用します。
DBの内容は、Google Patentsで「(semiconductor) country:US after:priority:20230101 language:ENGLISH」でヒットした857件の特許のうち、下記記事でFinFETに分類されたもの

もっとみる

Pes Cafe

2023年12月22日 00:04

[活用例]Local-LLM+Topic model+Langchain+ChromaDB

今回は集めた特許データをTopic modelで分類し、分類したtopicごとにChromaDBでデータベースを作成、Langchainを使ってRAGを設定し、Local-LLMに回答してもらうフローを整理しました。

フローは上のイメージ図の通り、下記の手順で進めます。

1. 特許からコンセプトを抽出
2. 抽出したコンセプトを分類
3. トピック毎にデータベースを作成
4. RAGの設定

もっとみる

Pes Cafe

2023年11月12日 17:12

Local-LLM+RAG, 1/n

特定の情報を基にLLMに応答させる手法として、言わずとも知れたRAG(検索拡張生成) システムですが、関連のテクニックが溢れて大変なので、メモがてら残していきます。

今回はLlamaIndexで子chunksを使ったRecursive Retriever + Node Referencesと検索でhitしたtextの前後のtextも参照するNode Sentence Windowです。

RAG

もっとみる

Pes Cafe

2023年11月3日 21:54

Local-LLMで特許文献整理

Bertopicで特許文献の整理をしてみました。
分類するため、要約にZephyr-7B-βを、要約文のembeddingにbge-large-en-v1.5を使用しました。

対象は、最近また騒がしい半導体を勉強がてら使用しました。

0. 環境

OS：Windows
CPU：Intel(R) Core i9-13900KF
RAM：128GB
GPU：RTX 4090

1. 特許情報取得

もっとみる

Pes Cafe

2023年10月29日 20:22

Zephyr-7B-βを試した

Zephyr-7B-βをαと比較しました。

0. 環境

OS：Windows
CPU：Intel(R) Core i9-13900KF
RAM：128GB
GPU：RTX 4090

1. Arxivの"NLP"論文のabstractを要約

Arxivの"NLP"最新論文の情報を収集

import arxivarxiv_query = "NLP"search = arxiv.Search(

もっとみる

フォローしませんか？

#技術

Reranking, RAG series 6/n

一般的なRAGのworkflow, RAG series 5/n

Lens.orgの特許Data活用(TOYOTA 1/n)

Llama-3-ELYZA-JP-8Bを雑に触る

[活用例]Local-LLM+Topic model+Langchain+ChromaDB

Local-LLM+RAG, 1/n

Local-LLMで特許文献整理

Zephyr-7B-βを試した