記事一覧
初めて自分の記事にスキしてくださった方が現れました。とてもうれしいです。以外とみてくださっているんだなと感じました。これからはちゃんと記事書いていければなと思います。
ちょっと疲れた。。。AI面白いけど理解するのがきびい
OpenAI+Llama2Elyza+LlamaIndex+LangChainでPDF読み込みQAボットを組んでみた
ソースは下記より閲覧可能
何の記事か?LlamaIndex+Elyza, OpenAI+Langchainの構成で、日本語に特化した外部ドキュメント回答AIを作りました。プログラムの詳細はすべてコメントとして記載しているので基本はコードを見てください。この記事上では全体構成と所感をお伝えします。
システム構成外部ドキュメント参照はLlamaIndexで、ベクトル化したドキュメントを読み取る際に
AIが答えを出す仕組みを知りたい
AIはどのようにして答えを出しているのだろうか。
あらかじめ学習した後のパラーメータはLlama2なら7億~130億とバージョンによってばらつきはあるが、そのくらい。データ量は最小値で7gb程度に低く抑えられてる。ただし、別に情報を追加したからと言って必ずしもその容量が増えるわけではないかもしれない。内部的には類似性の高い関連情報のベクトルの方向を変えているだけでかもしれない。ベクトルを変えてより
Llama2をwindows環境で動かしてみた
苦労した点pythonのモジュールエラーが頻発して苦労した。モジュールエラーは原因特定が難しいので、ネットに頼るくらいしかできない。
現時点で注意が必要な点llmモデルについて、ggml形式は最新のLlamaCppが読み込めなくなっている。gguf形式に変換して読み込ませる必要がある。
Codeimport osimport loggingimport sysimport fitzfrom l