見出し画像

LangChainのv0.0.179からv0.0.191までの差分を整理(もくもく会向け)

本日は第6回目のLangChainもくもく会です!
前回5月24日に実施した回から本日までのLangChainの差分について整理しました。ドタ参OKですので、ぜひお気軽にご参加くださいー。

v0.0.179 (2023.05.24)

新しい機能の追加:
・Elasticsearchを使ったモデルでのembeddings生成用のElasticsearchEmbeddingsクラスの追加
・Weather Loaderの追加
・MosaicML 推論エンドポイントの追加
・非同期版の predict() と predict_messages() の追加
・Typesenseベクターストアの追加
・Vectara の追加
・Beam の追加

既存機能の変更:
・PlanningOutputParserの空白処理を改善
・空チェックの前にpop
・get_text_length関数への参照の明確化
・見落とされたdocument_loadersの例の追加
・rellm_experimental.ipynbの更新
・example usageの追加
・DocArrayのdocstringsの調整

バグ修正:
・TimeWeightedRetrieverのaadd_documentsでのcurrent_time=Nowバグを修正

https://github.com/hwchase17/langchain/releases/tag/v0.0.179

v0.0.180 (2023.05.25)

新しい機能の追加:
・Harrison/modelscope (@hwchase17)
・length_funcの再利用(MapReduceDocumentsChain) (@zachschillaci27)
・Cypher QAプロンプトの更新 (@tomasonjo)
・Weaviate vectorstoreドキュメントの改善 (@hsm207)
・TFIDFリトリーバー (@dev2049)
・JSON解析の標準化 (@hwchase17)
・総コスト微調整モデルがゼロを出力してしまう問題の修正 (@tommasodelorenzo)
・ReadthedocローダーでカスタムHTMLタグを渡すように修正 (@ByronHsu)
・Iuguローダーの追加 (@rasiqueira)
・Joplinドキュメントローダーの追加 (@alondmnt)
・OpenAIキーをLangchain Plusコマンドに渡すオプション追加 (@agola11)
・サーバーステータス取得の'ステータス'コマンド追加 (@vowelparrot)
・Harrison/vertex (@hwchase17)
・GoogleDriveLoaderのデフォルト動作で、ゴミ箱に入っているファイルを読み込まないように変更 (#5104) (@NickL77)
・FAISS vectorstoreにIDを指定して追加する機能追加 (@atisharma)
・文献ローダーおよびリトリーバーへのBibtexの統合 (@eyurtsev)
・MiniMaxのエンベディング追加 (@archongum)

既存機能の変更:
・PGVectorのqueryセッションのスコープ修正 (@ninjapenguin)
・出力解析のバリエーション許容度変更 (@dibrale)
・ログ警告の追加 (@vowelparrot)
・セッション削除メソッドの追加 (@vowelparrot)
・concepts.mdの誤記修正 (@leo-gan)
・GraphIndexCreator内のfrom_text()の非同期コピー作成 (@maspotts)
・APIキーのドキュメント削除 (@kbressem)

バグ修正:
・RetryWithErrorOutputParserのdocstringのtypo修正 (@mwinterde)

https://github.com/hwchase17/langchain/releases/tag/v0.0.180

v0.0.181 (2023.05.27)

新機能の追加
・OpenAI API用のプロキシ指定オプションを追加 by @ymaurer
・C Transformers for GGML Modelsを追加 by @marella
・ClickToolにvisible_onlyオプションとstrict_modeオプションを追加 by @cancan101
・CSVとDataFrame ToolkitsにマルチCSV/DFサポートを追加 by @NickL77
・bigqueryダイアレクト- SQLサポートを追加 by @HassanOuda
・Momentoを標準のキャッシュおよびチャットメッセージ履歴プロバイダとして追加 by @malandis

既存機能の変更
・StructuredOutputParserドキュメントのエラー解決 by @mwinterde
・OpenSearchのtop kパラメータの修正 by @dev2049
・JoplinLoaderのノートURL取得でのリグレッション修正 by @alondmnt
・Docsでgetting startedにカスタムエージェントページのリンク追加 by @JanilsWoerst
・Zep SDKバージョン更新 by @dev2049
・OpenAI lint更新 by @dev2049
・`HuggingFacePipeline.from_model_id`にpipeline argsを追加 by @solomspd
・プロンプトをより堅牢にするための例を追加 by @pengqu123
・適切な認証情報をVertexAI LLMに渡すよう修正 by @lkuligin

バグ修正
・すべてのドキュメント内の 'ouput' と 'output' の誤字を修正 by @deepblue
・Twilio toolの修正 by @tedma4
・Databricks用のLLMラッパーを修正 by @mengxr

https://github.com/hwchase17/langchain/releases/tag/v0.0.181

v0.0.182 (2023.05.29)

新機能の追加:
・LangChainハンドブックへのリンク追加 (by @leo-gan)
・enum出力パーサの追加 (by @hwchase17)
・Chainlitをデプロイメントオプションに追加 (by @constantinidan)
・DynamoDBチャットメッセージ履歴用のサンプルノートブック追加 (by @KBB99)
・cosmos kwargsオプション追加 (by @eavanvalkenburg)
・SerpApiでのショッピング検索サポート (by @aymenfurter)
・SKLearnVectorStoreの追加 (by @mrtj)

既存機能の変更:
・weaviate hybrid searchのドキュメント改善 (by @hsm207)
・pyproject.tomlへの手順追加 (by @eyurtsev)
・llmキャッシングノートブックのフロー改善 (by @malandis)
・タイポ修正 (by @russellpwirtz)

バグ修正:
・"_Exception"アクションのverboseで空思考を修正 (by @svdeepak99)
・InvalidRequestErrorを引き起こす空行を削除 (by @mbchang)

https://github.com/hwchase17/langchain/releases/tag/v0.0.182

v0.0.183 (2023.05.29)

バグ修正:
・FAISS add_embeddings呼び出しでのiterエラーを修正 by @ninjapenguin
・不正なjsonを元に戻す by @hwchase17

https://github.com/hwchase17/langchain/releases/tag/v0.0.183

v0.0.184 (2023.05.29)

新しい機能の追加:
・パス検証をDirectoryLoaderに追加
・非同期対応のルーティングチェーンを追加
・任意のメッセージ追加機能を実装

既存機能の変更:
・ファクトリーのデフォルト設定を利用
・PRテンプレートにTwitterハンドルリクエストを追加
・llamacppのデモノートブックを更新
・load_chainの廃止されたllm属性を削除
・バーテックスAIの埋め込みにページネーションを追加
・openaiプロキシ設定をコード形式に再フォーマット
・エコシステム/インテグレーションのドキュメントを更新

バグ修正:
・空のドキュメントを扱うContextualCompressionRetrieverの修正(Issue #5304)
・JSONパースエラーの対応
・Blob.from_dataでmimetypeが失われる問題を修正
・update_document関数を修正し、テストとドキュメントを追加
・ディープインフラの修正
・プレディクションガードのアップデート
・日付時刻パーサーの修正

https://github.com/hwchase17/langchain/releases/tag/v0.0.184

v0.0.185 (2023.05.31)

新しい機能の追加:
・ツールがスローできるToolExceptionを追加 (@xming521)
・テキストスプリッターの追加 (@hwchase17)
・新しいTrelloドキュメントローダー (@GDrupal)
・GitHub用のDocumentLoader (@UmerHA)
・Sparkリーダーの追加 (@hwchase17)
・MongoDBAtlasVectorSearchの追加 (@P-E-B)
・より多くのコードスプリッターの追加 (go, rst, js, java, cpp, scala, ruby, php, swift, rust) (@ByronHsu)

既存機能の変更:
・古いLCTracerをデフォルトでポート8000に設定 (@vowelparrot)
・lancedbの名前変更とタイプミスの修正 (@eddyxu)
・q llmの凝縮 (@hwchase17)

https://github.com/hwchase17/langchain/releases/tag/v0.0.185

v0.0.186 (2023.05.31)

バグ修正:
・fix by @dev2049 (https://github.com/hwchase17/langchain/pull/5457)

https://github.com/hwchase17/langchain/releases/tag/v0.0.186

v0.0.187 (2023.05.31)

新しい機能の追加:
・InstructEmbeddings用の`encoding_kwargs`を追加 (@Xmaster6y) #5450
・FakeListLLMにasync _acallを追加 (@camille-vanhoffelen) #5439
・Qdrantにバッチ処理を追加 (@kacperlukawski) #5443
・SKLearnVectorStoreに最大関連性検索を追加 (@mrtj) #5430
・Google BigQueryをデータローダーとして使用する際に、資格情報を指定できるようにする (@nsheils) #5466
・ElasticsearchEmbeddingsでESクライアントオブジェクトとの接続を作成できるようにする (@jeffvestal) #5321
・SQLiteをバックエンドとしたEntity Memoryを追加 (@JoseHervas) #5129
・Qdrantフィルターのサポートを追加 (@kacperlukawski) #5446
・Bedrock LLMとエンベディングを追加 (@3coins) #5464

既存機能の変更:
・faiss.py内のload_local関数のdocstringを修正 (@luckyduck) #5440
・langchain/client/langchain.pyから重複した呼び出しを削除 (@patrickkeane) #5449
・BooleanOutputParserクラスの'parse'関数で、パラメータ'text'を大文字に変換 (@ARSblithe212) #5397
・gpt4allにn_threads機能を追加(@Vokturz) #5427
・SelfAskWithSearchChainの非同期使用を許可 (@pors) #5394
・pyトレーサーの修正 (@agola11) #5377
・text splitterにもっとvarsを追加 (@hwchase17) #5503

バグ修正:
・MRKL出力パーサーが正しく形成されたクエリを壊さなくなりました (@ninjapenguin) #5432
・インポート用の簡単なテストを追加 (@hwchase17) #5461

https://github.com/hwchase17/langchain/releases/tag/v0.0.187

v0.0.188 (2023.06.02)

新しい機能の追加
・フィードバックメソッドと評価例を追加(@vowelparrot)
・GPT4Allのクラス属性としてallow_downloadを追加(@Vokturz)
・DeepLearning.AIのコースリンクを追加(@leo-gan)
・Managed Motorheadを追加(@softboyjimbo)
・WebBaseLoader用のパラメータrequests_kwargsを追加(@sevendark)
・PGVectorラッパーに埋め込みを持つテキストを追加(@shenghann)
・WandbTracerを追加(@parambharat)
・Maxcomputeを追加(@dev2049)
・Brave Search Utilを追加(@hwchase17)

既存機能の変更
・コンストラクタで渡された場合、Bedrock用のbotoクライアントの作成をスキップ(@3coins)
・enumerateをzipに置き換え(@ttsugriy)
・リスト内包表記をジェネレータに置き換え(@ttsugriy)
・ループの追加をリスト内包表記に置き換え(@ttsugriy)
・ループの追加をリスト内包表記に置き換え(@ttsugriy)

バグ修正
・PySpark Document Loader Docsの軽微な修正を追加(@rithwik-db)
・unstructuredがdetectron2をソースからインストールする必要がないことを示すドキュメントの修正(@MthwRobinson)
・ドキュメントのMMR例でのクラスインスタンス化の誤りを修正(@tobiasvanderwerff)
・BaseEntityStoreをBaseModelから継承するように変更(@aditivin)
・ecosystem/integrationsドキュメントのアップデート3(@leo-gan)
・矛盾した綴りの変数名を修正(@patrickkeane)
・Qdrantの自己クエリを修正(@dev2049)

https://github.com/hwchase17/langchain/releases/tag/v0.0.188

v0.0.189 (2023.06.03)

新機能の追加
・Elasticsearch APIが8.x未満のバージョンをサポートするように変更

既存機能の変更
・docugami.ipynbのタイプミスを修正
・conv chat agent prompt jsonの不足しているカンマを追加
・Bedrock認証バリデーションの修正
・リンティングとリンク切れの修正を含むドキュメントの修正
・Es knn index search 5346の修正
・Qdrant IDの修正

バグ修正
・SQLAlchemyがテキストが大きすぎる場合に切り捨てる問題を修正

https://github.com/hwchase17/langchain/releases/tag/v0.0.189

v0.0.190 (2023.06.05)

新しい機能の追加:
・UnstructuredExcelLoaderの追加: .xlsxと.xlsファイルに対応 (@MthwRobinson)

既存機能の変更:
・Chromaのupdate_documentを修正し、完全なドキュメントを埋め込むように変更 (@cnellington)
・bedrock llmのboto3クライアントのインスタンス化を修正 (@seanpmorgan)
・Tracer Authの更新 / コール数を減らす (@vowelparrot)
・MapReduceChainの複数入力プロンプトを修正 (@imeckr)
・構成を変更して要素間にスペースを返すように更新 (@gardner)
・ConfluenceLoaderでPersonal Access Token認証のサポートを実装 (@felipeff)
・PlanAndExecuteエージェント用のAgentExecutorにオリジナルプロンプトのオプションを追加 (@nathan-az)
・FinalStreamingStdOutCallbackHandlerのQuickFix:改行と空白を無視する (@UmerHA)
・vertexaiチャットモデル(PaLM2)用のsend_message()コールにパラメータを追加 (@khallbobo)
・and/or の単一引数の処理 (@dev2049)
・pgvector python example notebookの変数参照を修正 (@cjcjameson)
・Pubmedインテグレーションの追加 (@hwchase17)
・client+namespaceをcollectionに置き換える (@P-E-B)
・Enabling Promptパラメータにgoogle_placesツールを追加 (@georgelroberts)
・SQLエージェント:プロンプトエンジニアリングの改善により、データベースのカラム名を推測するエージェントが減る (@willsmithorg)
・Neo4jGraphのAPOCプロシージャの失敗によるエラーメッセージの改善 (@guangchen811)
・Chromaでsimilarity_score_thresholdの取得をサポート (@jiayao)

バグ修正:
・importの問題を修正 (@leo-gan)
・GenerativeAgentMemoryの軽微なリファクタリング (@mbchang)
・データベースのクエリエラー率を削減するリファクタリング (@Undertone0809)
・momentoチャット履歴ノートブックのタイポとタイトルを修正 (@malandis)
・ファイルコールバックハンドラの作成 (@mbchang)
・YoutubeLoaderのmetadata検証エラーの修正 (@ricardoreis)
・GPT4Allラッパーのロード問題の修正 (issue #5651) (@bwv988)
・agentも end_problem エージェントの実行とチャット出力パーサでアクションと最終回答が含まれるテキストを解析する場合は例外をスローする (@nathan-az)
・トークンテキストスプリッター機能の抽出 (@JensMadsen)
・SQLAlchemy MovedIn20Warning declarative_base DEPRICATION修正 (@kaahila)
・vertexaiのtop_kとtop_pが入れ替わっていたバグを修正 (@mheguy-stingray)

https://github.com/hwchase17/langchain/releases/tag/v0.0.190

v0.0.191 (2023.06.06)

新しい機能の追加:
・GPT4Allラッパーのmodel_type属性の問題を解決 #5720
・LLMsの本番環境へのデプロイと新しいエコシステムのドキュメント追加
・複数のメモリを一度に保存するためのサポートを追加
・生成されたCypherがバッククオートで提供されているかどうかを確認するCypher検索機能
・Zep Hybrid検索の追加

既存機能の変更:
・Pythonのバッククオートの不要なバックスラッシュエスケープを削除
・Slackドキュメントローダーのドキュメント内のタイポを修正
・Chromaコンストラクタのドキュメントのエラーを修正
・ClickhouseをVector Storeとして統合
・音声ファイルからドキュメントを生成するためのOpenAIWhisperParserの作成
・ecosystem/integrationsとecosystem/dependentsのドキュメント更新
・BaseConversationalRetrievalChainクラスにreturn_generated_question属性を追加
・aviaryサポートの追加
・cohereリトライ機能の追加
・sitemapからのURLフィルタリング前にlocから空白と改行を削除
・YouTubeにおけるマルチ言語対応の追加
・マークダウンテキストスプリッタの水平線の修正
・Tracing Groupの変更
・チュートリアルの更新
・Tigrisベクターデータベースのベクター検索へのサポートを追加

バグ修正:
・vectorestoreドキュメントでスコアが説明されているように修正

https://github.com/hwchase17/langchain/releases/tag/v0.0.191

最新のバージョンで追加された「Deploying LLMs in Production」が興味深いですね。

本当にLangChainはドキュメントが充実しているなぁ・・・(guidanceとの対比で…)。

というわけで今夜も楽しんでいきましょう。

現場からは以上です。

この記事が気に入ったらサポートをしてみませんか?