見出し画像

LangChainのv0.0.226からv0.0.249までの差分を整理(もくもく会向け)

久しぶりのもくもく会開催のため、見ていく差分がめちゃめちゃ多くなりました。どうしたものか。時間いっぱい、やれるところまでやっていきましょう〜。

LangChain Core

v0.0.228 (2023.07.08)

新しい機能の追加
・client_settingsから提供されたディレクトリを持続させるchroma.pyの更新 
・新たなEmbeddingsフィルタを使用したクラスタリングによるThe Fellowship of the Vectorsの追加
・Pydanticスキーマの出力解析エラーにコンテキストを追加し、例外処理を改善
・Pineconeの類似性スコア閾値にフィルタとネームスペースのサポートを追加
・OpenAIWhisperParserにapiキーを渡すことを可能に
・llamacppの冗長パラメータを追加
・Context(https://getcontext.ai)のコールバックハンドラを追加
・DataberryをChaindeskに改名
・Run Evaluatorの読み込み機能の追加
・AwaDBのバージョンアップ (0.3.5から0.3.6に)
・String DistanceとEmbedding Evaluatorsの追加
・GraphIndexCreatorにカスタムプロンプトを渡すことを可能に
・単一のrun eval loaderの追加
・JinaChatの統合
・get_format_instructionsメソッドからのみ構造化されたjsonを返すためのパラメータの追加

既存機能の変更
・embeddingをNoneに変更
・function内でrequires_referenceを明示的にリスト化
・拡張子名の更新
・APIリファレンスのリンクをStreamlit統合ドキュメントで更新
・databerry-chaindeskリダイレクトの更新
・pinecone.ipynbの更新
・jinaの修正

バグ修正
・MlflowCallbackHandlerにおけるKeyErrorの修正
・GraphQAChainからの不具合出力の修正
・MosaicMLの入力と出力の更新
・Ref Exampleをスレッドセーフにする修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.228

v0.0.229 (2023.07.10)

新しい機能の追加
・ZepMemoryの追加、ZepChatMessageHistoryのメタデータ処理の改善
・ElasticVectorSearch.from_textsメソッドにparam idsの追加
・spacy sentencizerの追加
・`UnstructuredTSVLoader`の追加
・max_marginal_relevance_searchメソッドをMongoDBAtlasVectorSearchに追加
・ctransformersが非同期チェーンをサポート
・Xorbits Dataframeをドキュメントローダーとして追加
・Datadog logs loaderの追加

既存機能の変更
・JinaChatの説明の改善

バグ修正
・state_of_the_union.txtリンクの修正
・document_comparison_toolkit.ipynbのエラー修正
・ドキュメンテーションの文法エラーの修正
・タイポの修正
・YouTubeに関する情報の修正
・BaseConversationalRetrievalChainのget_chat_historyの型ヒント修正
・AmazonKendraRetriever初期化時のKeyError修正
・larkのインポートエラー修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.229

v0.0.230 (2023.07.12)

新しい機能の追加
・新機能の使用例としてdeeplake use caseを追加
・PineconeにV4サポートを追加
・OpenAIFunctionsAgentの早期停止手法としてgenerateをサポート
・CPALを追加

既存機能の変更
・"質問応答のドキュメント"のランディングページを更新
・map-reduce custom prompt使用の明確化

バグ修正
・vector storageのRefactorが実施され、relevancy scoresの正しい扱いが行えるよう修正
・HF endpointがテキスト生成の際にブランクを返す問題を修正
・CPALのドキュメント修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.230

v0.0.231 (2023.07.12)

新しい機能の追加
・env setup の追加
・Lemon AI NLP Workflow Automation のノートブック例の追加
・chat_historyのためのサポートの追加
・Pinecone Upsertメソッド使用法の更新
・チャットのOpen AIのジェネレーション情報に終了理由を追加
・Kobold AI のための LLM ラッパーの追加
・notiondbドキュメントローダーのメタデータの有効なプロパティの追加

既存機能の変更
・Qdrant.from_textsで適切に設定されている場合、既存のコレクションを再使用
・spacy sentencizerからtaggerの削除
・ハードコードされた文字列の代わりに他のsqlツールに関する参照の微細な更新
・Pinecone v4 サポートの取り消し
・'format_diff' オプションと改善された可読性を持つMakefileの強化
・Harrison/pg vector moveの更新
・新しい場合にのみハンドラーを追加

バグ修正
・Marqo Ecosystemからのリンクの修正
・MulitRouteChain の AsyncRunManager's methodの呼び出しを適切に待機するバグ修正
・`make docs_build` と関連スクリプトの修正
・チャットエージェントの出力パーサーをregexでアクションを抽出するように更新
・faiss.pyのincorrect docstore作成の修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.231

v0.0.232 (2023.07.13)

新しい機能の追加
・Function Callback tracerの実装
・model architectureがwandb tracerに追加
・sympyを用いた記号計算のためのchainを追加
・新しい種類のdocument transformersを追加
・OpenAI functionsによるdocument metadata taggerを追加
・OpenAIエンドポイントを埋め込みに使用

既存機能の変更
・Tracingが実験段階であるという警告の削除
・親ランIDが存在しないときに警告が出ないように変更
・資格プロファイル名やリージョン名が渡されなかった場合の検証エラーの修正
・最後のNステップに中間ステップをトリムすることを許可
・エンティティ抽出の改良
・内部chainsがメモリを使用できるように修正
・ListStepContainerの基底クラスをBaseStepContainerに更新
・評価機能の更新

バグ修正
・markdownのレンダリング問題の修正
・openai structured chainの修正
・pinecone_hybrid_search.ipynb内のタイプミスの修正
・credential_profile_name、region_nameが渡されない場合の検証エラーの修正
・渡された閾値を用いたドキュメントの類似度チェックの修正
・不要な変数kの削除
・chroma initバグの修正
・map_rerankのパーサーレギュラーエクスプレッションの更新
・apify.ipynbへの必要な依存関係の追加
・StdOutCallbackHandler.on_chain_start内でのchain classnameの欠落の修正
・chromaのアップデートしたupsertインターフェースの修正
・SQLAlchemy LLMキャッシュクリアの修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.232

v0.0.233 (2023.07.14)

新しい機能の追加
・Azure Active Directoryトークンベースの認証アクセスをOpenAI完成物に有効化
・ブラウザレスローダーの追加
・PlaywrightURLLoaderへのマッチング非同期ロード関数の追加
・Alibaba's Damo AcademyのTongyi Qwen APIのためのLLMの追加
・VertexAIチャットモデルの例に対するサポート追加
・チェーングループの入れ子有効化
・ElasticsearchDatabaseChainの追加 - 分析データベースと対話

既存機能の変更
・Trajectory Eval Scoreの正規化
・GraphQLツール初期化ドキュメンテーションの簡略化 - 'llm'引数の削除
・Tracer Workersの設定
・TextRequestsWrapperでauthオブジェクトを渡せるよう修正

バグ修正
・`RecursiveUrlLoader`の絶対URL処理の修正
・FileCallbackHandlerの同一問題(#7524)の修正
・AzureCognitiveSearchRetrieverでのドキュメント制限の許可修正
・Recursive loaderがクローリング中にyieldするよう修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.233

v0.0.234 (2023.07.15)

新しい機能の追加
・Rocksetをドキュメントローダとして統合
・既存のテキスト分割ページへのリダイレクトの実装
・Tiktokenの確認機能を追加
・HuggingFaceTextGenInferenceクラスのtruncate引数のサポートを追加
・Qdrantベクトルストア用の非同期APIを実装
・Google Images検索のサポートを追加
・GPT4All埋め込みを追加
・MediaWiki docloaderの改善とユニットテストを追加

既存機能の変更
・SQLDatabaseにセキュリティ免責事項を追加

バグ修正
・deeplake.ipynbのタイポを修正
・欠落していたインポートを追加

https://github.com/langchain-ai/langchain/releases/tag/v0.0.234

v0.0.235 (2023.07.18)

新しい機能の追加
・OpenAIWhisperParserにtry exceptブロックを追加
・Xorbits agentを追加
・Redis Sentinelデータベース接続をサポート
・ChatGLM(2)-6B API向けのLLMを追加
・bm25モジュールを追加
・Anthropicのclaude-v2への更新

既存機能の変更
・引数のオーバーライド時にevalローダーを修正
・docs内のntbkリンクを修正
・langsmithバージョンを更新
・LangSmithのノートブックを更新
・LLMをコンストラクターで受け入れるように
・docstringsに例を追加
・チャットの例の出力マッパーを修正
・評価コールバックでクライアントを共有
・callbacksからTracerをエクスポート
・登録された比較子を明確に

バグ修正
・評価ローダーの修正
・チャットの例の出力マッパーの修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.235

v0.0.236 (2023.07.19)

新しい機能の追加
・「Unstructured loaders」にオプションの後処理機能を追加
・「BrowserlessLoader」にtext_contentキーワード引数を追加
・AwaDBのドキュメントにmetadataとpage_contentフィルタを追加
・「PromptLayerCallbackHandler」のドキュメント追加
・「WeaviateHybridSearchRetriever」でスコアを有効にするオプションを追加
・Faissのテストを追加
・azure OpenAI APIバージョンを最新の2023-05-15に移行
・SVN Retrieverに対するテストを追加
・KNN retrieverに対するテストを追加
・OpenAIEmbeddingsに追加のパラメータを許可
・vector store onboarding expの改善
・Chromaのバージョンを0.4.0にアップグレード
・トークン使用状況を返さないチャットモデルを許可
・Google Cloud Enterprise Search retrieverを追加
・Azure 2023-07-01-previewとの互換性を持つopenai.pyのアップデート
・MLflow AIゲートウェイの統合を追加

既存機能の変更
・ドキュメントの順序が間違っていた問題の修正
・Azure APIバージョンを最新に更新
・Redisインデックス取得の再試行の試み
・追加のパラメータをOpenAIEmbeddingsで許可
・Llama-v2をLlama.cppノートブックに追加

バグ修正
・nbの修正
・RCEに対する一部の緩和策をPALチェーンに適用
・pgvectorのsearch_typeに関するsimilarity_score_thresholdが機能しないバグの修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.236

v0.0.237 (2023.07.20)

既存機能の変更
・add_textsからkwargsを削除

https://github.com/langchain-ai/langchain/releases/tag/v0.0.237

v0.0.238 (2023.07.21)

新しい機能の追加
・llama-v2をローカル文書QAに追加
・Geopandas.GeoDataFrame Document Loaderの追加
・デバッグガイドの追加
・NLP Cloud embeddingsエンドポイントの統合
・非同期Qdrantをasync_agent.ipynbに追加
・datadog-langchain統合のドキュメント追加
・Verboseサポートの追加
・Qdrant Vectorstoreの追加
・Amadeus FlightとTravel Search Toolの追加
・pandasが全てのカラムを表示するように変更
・Golden Query Toolの追加
・VectorStoreRetrieverMemoryの追加機能:余分な入力キーや特徴を追加できるようにする
・embeddings/bedrock.pyにendpoint_urlの追加とドキュメントの更新
・Doctranモデルにopenai_api_model属性を追加
・Bagatur/apifyの追加
・google place IDをgoogle places toolレスポンスに追加
・Portkey LLMOpsの統合の追加

既存機能の変更
・nbの修正
・LSバージョンのアップデート
・callbacksをbaby aiに適用
・chromaノートブックの更新
・docstringsの`LLMs`と`embeddings`の更新
・デフォルトパラメータをhf-text-genから取得できるようにする

バグ修正
・weaviate hybrid retriever initでのキーエラーの修正
・MLflow AI Gateway config例の不正確なフィールド名の修正
・huggingface TGI LLMでテキストアウトプットが欠けているバグの修正
・vectstore memoryバグの修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.238

v0.0.239 (2023.07.21)

新機能の追加
・Metaphorの新フィールド追加とドキュメンテーションのリフォーマット
・NeptuneグラフとopenCypher QA Chainの追加
・Replicateへのストリーミングサポートの追加
・Qdrantのローカルモードへの非同期サポートの実装
・chatglm用のwith_historyオプションの追加
・非同期HTMLローダーとHTML2Textトランスフォーマーの追加
・SQLDatabase Chainから直接SQLコマンドを取得する機能の追加
・埋め込みとvectorstoreプロバイダ情報をタグとして追加

既存機能の変更
・エラーストリングの変更
・Modal.com統合ドキュメンテーションの更新
・Golden統合ドキュメンテーションの更新
・mongodb_atlas.pyドックストリングの更新
・メソッドの重複排除

バグ修正
・URIと文字列からrdflibの警告無しでスキーマ説明を作成するバグの修正
・redisキャッシュチャットモデルの修正
・HuggingFaceTextGenInferenceのバグ修正:キーワード引数に対する複数の値
・不良なドキュメンテーションサイドバーエラーの修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.239

v0.0.240 (2023.07.23)

新しい機能の追加
・「(WIP) set up experimental」の追加
・「add experimental release action」の追加
・「add kwargs support for Baseten models」の追加
・「MultiOn client toolkit」の追加

既存機能の変更
・「Fix `allowed_search_types` in `VectorStoreRetriever`」の変更
・「Harrison/move experimental」の変更
・「use top nav docs」の変更
・「Harrison/official pre release」の変更
・「Harrison/add back in experimental」の変更

バグ修正:
・「fix api ref」の修正
・「remove CVEs」の修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.240

v0.0.242 (2023.07.26)

新機能の追加
・AgentExecutorIteratorの実装
・補完Cube Semantic Loaderの機能
・LocalAIのための埋め込みの追加
・欠落しているメタデータを記述文字列に設定するようにWebBaseLoaderのメタデータ解析を変更
・SageMaker Endpoint Embeddingsのドキュメントを現在の要件に合わせて更新
・deeplakeのためのSelfQueryのサポート
・Graph QA ChainのためのArangoDB/AQLのサポート
・ChatGLMのwith_historyオプションをデフォルトでFalseに変更
・NLP Cloudを使用する際のGPUと言語設定の変更をユーザーが行えるように
・etherscan document loaderの追加
・replicateへのstop sequenceのサポートの追加
・transform chainの非同期サポートの追加
・無効な外部サービスが必要ないHybrid retrieverの追加

既存機能の変更
・nmspaceの簡略化
・実際に入力キーの使用
・faissテストのスコア閾値の追加
・mlflow-ai-gatewayへの変更 in llms/init.py
・example_generatorのリファクタリング
・ユーザーがGPUと言語設定を変更できるようにする
・supabase.pyの更新、フィルタリングの追加(最新のsupabaseドキュメント & jsと一致)
・基本チェーンの型ヒントの更新

バグ修正
・機能呼び出しのログ修正
・devcontainerの修正
・スコア閾値に関するfaissテストの追加
・Entity Summary Memoryドキュメントのタイプ修正
・ビルドが不能になったことへの修正方法
・GitHubツールキットの適用
・MSSQL接続問題の修正
・sparql SELECTとUPDATEクエリ関数の修正
・LLMモデルのドキュメンテーション内の文法における修正
・LLMの出力をパースできない問題の、一時的な修正
・loggingの代わりにloggerを使用

https://github.com/langchain-ai/langchain/releases/tag/v0.0.242

v0.0.243 (2023.07.26)

新しい機能の追加
・LLMChainのメモリとチャットモデルの例を追加
・新しいエンタープライズサポートフォームを追加
・lxmlをpip installの例に追加
・DatabricksへのサポートをMLflow Callbackに追加
・Webリサーチリトリーバを追加
・OpenSearchにAOSSサポートを追加

既存機能の変更
・BaseMessageのオペレーターのオーバーロードを削除
・golden-queryノートブックを更新し、golden docsのタイプミスを修正
・Github Importを削除

バグ修正
・バグ#6462を修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.243

v0.0.244 (2023.07.27)

新しい機能の追加
・他の名前空間からオブジェクトをロードする機能を追加
・DuckDuckGoSearch Newsツールを追加

既存機能の改善
・いくつかのVectorStores子クラスにおける名前変更問題を修正
・クエリを検索する前にクリーニングする機を追加

バグ修正
・AzureChatOpenAIストリーミングのバグを修正
・ElasticVectorSearch.from_documentsのバグ#8293を修正

その他
・*.toml ファイルへの copy コマンドのパス指定を追加
・テスト追加:エンベディング距離評価のテスト

https://github.com/langchain-ai/langchain/releases/tag/v0.0.244

v0.0.245 (2023.07.27)

新しい機能の追加
・Dropboxからのファイル読み込みをサポート

バグ修正
・`make`のターゲット`format_diff`と`lint_diff`が壊れる問題を修正
・Etherscan.ipynbのタイプミスを修正
・バグ#8343を修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.245

v0.0.247 (2023.07.29)

新機能の追加
・RunnableMapを直接使用するサポートを追加
・Runnable.bind メソッドを追加
・Retry Eventsを追加
・機能メッセージを _message_from_dictに追加
・AwaEmbedding用のEmbeddingsを追加
・azure ml managed feature storeの例を追加
・Xinference LLMsとEmbeddingsの統合を追加
・Minimax llmモデルを追加
・RoPE Scaling paramsをllamacppから追加
・meilisearch vectorstoreのサポートを追加

既存機能の変更
・チュートリアルからのユースケースへのリンクを変更
・既存のチェーンをユースケースに移動
・全てのランタイプでのRetry eventsを変更
・str出力パーサーの名前を変更
・sqlデータベースエージェントの例を更新
・unitテストをmrkl output_parser.pyに追加
・辞書からメッセージへの変換関数を公開
・get_num_tokens_from_messagesモデルを更新

バグ修正
・OWLの制限によって引き起こされる例外を修正
・_VertexAICommonの_identifying_params()が欠落していたバグを修正
・AwaDBをv0.3.7からv0.3.9にアップグレードし、デフォルトの埋め込みを変更
・openapiチェーンが説明/要約なしでも動作するように修正
・Bloom以外のモデルを実行できるように修正(LLamaと新しいモデルのサポート)
・ChatOpenAIクライアントのデフォルト値を追加
・metadatasが提供されている場合の空のidを修正
・ElasticKnnSearchのリライト - bug fix - ドキュメントを返すように修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.247

v0.0.248 (2023.07.31)

新しい機能の追加
・sqlクエリ用のノートブックの追加
・ガイドノートブックの追加
・ツールにRunnableを実装
・人間関係の関数ラッパーの追加
・初回の人間エージェントの追加

既存機能の変更
・supabaseドックストリングの更新
・チャットメッセージの一部フォーマット
・ガイドインポートの更新
・ログ出力パーサ
・ノートブックの改善
・runnable.bind().bind()はkwargsを結合するべきで、ラッパーをネストするのではない
・リンク生成の修正
・プロンプトのクリーンアップ
・時間加重リトリーバーの値が更新されることを確認するテストの追加
・NeptuneOpenCypherQAChainのエクスポートの修正

バグ修正
・ドキュメンテーションのfrom_documents シグネチャの修正
・ChromaDBインテグレーション -> Dockerコンテナ指示の修正
・GitLoaderが繰り返しロードを処理できるように修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.248

v0.0.249 (2023.08.01)

新しい機能の追加
・rockset vectorstoreの改善
・router runnableの追加
・vector storeの非同期メソッド呼び出し時の位置引数の順序の依存度を減らす機能
・LLaMa FormatterとAzureML Chat Endpointの追加
・SQL Query Promptの更新と、SQLDatabaseに対する_executeメソッドの追加
・lcel内の会話取り出しチェーン機能の追加
・redis vectorstoreに対するテストの追加
・ConcurrentLoaderの追加
・メモリーの例の追加

既存機能の変更
・AzureSearch Vector Storeの修正:additional_fieldsの使用をその定義の文脈内に移動(Pythonエラーからのバグ修正)
・RunTypeEnumの除去

バグ修正
・web loaderの修正
・chroma docker指示書のエラー修正
・jsonのバックティックの正規表現を貪欲にし、issue#8357を修正
・fix: openapiのコントローラープロンプトの修正、API解決不能時のBot
・バグ7445の修正、重複したrestuld_idがvectorstoreに追加される問題
・既存のサマリーからのconversation summarymemoryの高速ロードの修正
・combined.pyの更新
・Runnable sequencesの結合改修

https://github.com/langchain-ai/langchain/releases/tag/v0.0.249

LangChain Experimental

v0.0.1 (2023.7.23)

新しい機能の追加
・実験的リリースアクションを追加
・Basetenモデルのkwargsサポートを追加
・MultiOnクライアントツールキットを追加

既存機能の変更
・VectorStoreRetrieverのallowed_search_typesを修正
・トップナビゲーションドキュメントを使用
・実験的な機能を移動
・バージョンを更新

バグ修正
・apiリファレンスを修正
・CVEを削除

https://github.com/langchain-ai/langchain/releases/tag/v0.0.1

v0.0.2 (2023.7.24)

新しい機能の追加
・llamaapiを追加

既存機能の変更
・jsonbカラムの説明が利用不可の際にビューを使用
・プロンプトのエルゴノミクスを修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.2

v0.0.3 (タグなし)

※タグなし

v0.0.4 (2023.7.26)

新しい機能の追加
・LLMChainメモリのチャットモデルの例を追加
・エンタープライズサポートフォームを追加
・DatabricksサポートをMLflow Callbackに追加
・Webリサーチリトリーバーを追加
・OpenSearchへのAOSSサポートを追加

既存機能の変更
・BaseMessageのオペレータオーバーロードを削除
・golden-queryノートブックを更新し、golden docsのタイポを修正
・pip installの例に必要なlxmlを追加

https://github.com/langchain-ai/langchain/releases/tag/v0.0.4

v0.0.5 (2023.7.27)

新しい機能の追加
・apiクロス参照リンクを追加
・markdown形式のオプションをconfluenceに追加
・PlanAndExecute Chainへの非同期サポートを追加
・Cohereの非同期サポートを実装
・Azure Cognitive Searchにカスタムインデックスとスコアリングプロファイルサポートを追加
・新しいToTChainとしてTree of Thoughtを導入

既存機能の変更
・ChatPromptTemplateのdoc-stringsとfrom_role_stringsの挙動を更新
・weaviateの類似性検索での埋め込みの再計算を回避
・api参照のスタイルを更新
・名前空間のタイトルを削除
・cosine_similarity_top_k関数のパフォーマンスを最適化

バグ修正
・"missing key op"のRDFGraph OWLシリアライズを修正
・最大再帰深度を超えたエラーを修正
・nbdoc_build経由で'変換できない'ノートブックを修正

https://github.com/langchain-ai/langchain/releases/tag/v0.0.5

そんなわけで今夜もよろしくお願いしますー。

現場からは以上です。

この記事が気に入ったらサポートをしてみませんか?