見出し画像

LangChainでPDFを要約してかんたんな日本語に変換するWebアプリを作ってみた感想

LangChain入門ついでに何かシンプルなアプリケーションを作れないかと思い、PDFを要約してかんたんな日本語に変換するWebアプリを作ってみました。

上記は令和4年版情報通信白書の第4章第7節「ICT技術政策の推進」を要約したものです。
難しい言い回しもある程度やさしく変換されるので、内容が堅くとっつきにくい文章をざっくり把握したいときに使えそうです。

具体的な実装についてはQiitaの記事としてまとめています。

本当はこれを改良してWebサービスとして世に出したかったのですが、ChatPDFという優れたサービスが既に存在し、かつ私が認識していないだけで類似サービスがあるであろうことと、バックエンドの処理が長くFaaSでのホストが難しい(=インスタンス費用がそこそこかかる)ことから断念しました。

具体的にはPDF1枚あたり30~60秒ほどかかってしまうのが現状です。
たいていのFaaSにはタイムアウトが設定されているので、VMやコンテナなどにホストして常時起動しておく必要が出てしまいます。
仮に低スペックなインスタンスで運用するにしても、定常的に費用が発生してしまうのは個人としてはつらいものがあります。OpenAI APIの費用くらいであれば許容できるかなと思っていましたが、、

今後、Webサービスとして提供するのではなく個人が利用しやすい形で(例えばGoogle Colabなどで)実行できるようノウハウを提供する方向に舵を切ることも選択肢に入れようと思います。

GWも残り少ないですが、引き続きLangChainやSemantic KernelなどLLMを使用したアプリケーション構築の情報を追っていきます。

この記事が気に入ったらサポートをしてみませんか?