if001

強化学習、ニューラルネットワーク、機械学習、自然言語、 python、golang、 …

4 フォロー 23 フォロワー

xgenでJGLUEを試す

日本語ベンチマークとしてJGLUE(JP Language Model Evaluation Harness)が提案されている。以下のリポジトリで簡単に試せそうだったので試してみる。 xgenをqloraさせた…

if001

1年前

local llmでsentence embeddingどれ使えば良いんだっけ

最近の日本語喋れるLLMでそのままsentence embeddingしても良いんだっけ？そもそもどうやってsentence embeddingしてるんだっけ？と思っていたので調べてみた。単語単位…

if001

1年前

CTranslate2でrinna instructionをquantizeして動かす

これまでquantizeはllama.cppを使っていたが、GPUを使えなかったのでCTranslate2を使ってみた。 CTranslate2はtransfomer modelのメモリを削減、高速化を行うライブラリ …

if001

1年前

OpenCALM-7Bをloraで学習して、quantizeするまで

cyberagent/open-calm-7b をLoraを用いて学習し、quantizeするまでやっていきます (とりあえず動作確認まで、検証はこれから) (間違ってそうなところはツッコミお願いしま…

if001

1年前

rinna 3Bをcppで動かす

rinnaをcppで動かせるように色々試して見ました。 instructionもあり、そのままlangchainなどに突っ込んでも動かせそうです。ローカルで色々試したいのでcppしようと試し…

if001

1年前

VicunaでReActっぽいことを試してみる

はじめにローカル環境でVicunaを動かしReActっぽいことを試してみる。正確には違うので注意 ReActは、Thought、Action、Observationをループさせ、LLMの出力の精度上げる…

if001

1年前

if001

2023年7月3日 19:32

xgenでJGLUEを試す

日本語ベンチマークとしてJGLUE(JP Language Model Evaluation Harness)が提案されている。

以下のリポジトリで簡単に試せそうだったので試してみる。

xgenをqloraさせたので、他の日本語モデルと比較してみる

xgen-7b-8k-baseをdolly-jaで学習 (https://huggingface.co/Salesforce/xgen-7b-8

もっとみる

if001

2023年6月21日 22:35

local llmでsentence embeddingどれ使えば良いんだっけ

最近の日本語喋れるLLMでそのままsentence embeddingしても良いんだっけ？そもそもどうやってsentence embeddingしてるんだっけ？と思っていたので調べてみた。

単語単位のembeding実装はsentence tranfomerが参考になる。

sentence transfomerでない場合やbertのclsトークンを持たない場合は、単語embeddingを足し合

もっとみる

if001

2023年6月12日 17:19

CTranslate2でrinna instructionをquantizeして動かす

これまでquantizeはllama.cppを使っていたが、GPUを使えなかったのでCTranslate2を使ってみた。

CTranslate2はtransfomer modelのメモリを削減、高速化を行うライブラリ

C++で実装されており、pythonからC++を呼び出している。document通りinstallすると、GPUも利用してくれる。

いろんなモデルが対応している

instal

もっとみる

if001

2023年5月24日 00:32

OpenCALM-7Bをloraで学習して、quantizeするまで

cyberagent/open-calm-7b をLoraを用いて学習し、quantizeするまでやっていきます
(とりあえず動作確認まで、検証はこれから)
(間違ってそうなところはツッコミお願いします)

gpt-neoxのlora weight mergeの記事が見つからなかったのでメモとして

動作環境はcolab T4 ハイメモリ

lora学習rinnaと同様に、gpt-neoxベース

もっとみる

if001

2023年5月19日 23:41

rinna 3Bをcppで動かす

rinnaをcppで動かせるように色々試して見ました。
instructionもあり、そのままlangchainなどに突っ込んでも動かせそうです。
ローカルで色々試したいのでcppしようと試してみました。

実行環境は、colab T4 ハイメモリ

コード的な動作をさせただけです。
量子化はあまり追いつけてないので、色々と間違っていればツッコミお願いします。

調査以下で中身を確認

from

もっとみる

if001

2023年5月4日 21:22

VicunaでReActっぽいことを試してみる

はじめにローカル環境でVicunaを動かしReActっぽいことを試してみる。正確には違うので注意

ReActは、Thought、Action、Observationをループさせ、LLMの出力の精度上げる手法

ReActの処理の流れは以下のような形。

与えられた質問(Question)に対し、

Thoughtで質問をどのように解決するかの思考を行い、

Actionでツールを選択する

選択

もっとみる

記事一覧

xgenでJGLUEを試す

local llmでsentence embeddingどれ使えば良いんだっけ

CTranslate2でrinna instructionをquantizeして動かす

OpenCALM-7Bをloraで学習して、quantizeするまで

rinna 3Bをcppで動かす

VicunaでReActっぽいことを試してみる

xgenでJGLUEを試す

local llmでsentence embeddingどれ使えば良いんだっけ

CTranslate2でrinna instructionをquantizeして動かす

OpenCALM-7Bをloraで学習して、quantizeするまで

rinna 3Bをcppで動かす

VicunaでReActっぽいことを試してみる