領収書の写真をGoogle Driveに入れて、その日付、店名、支払合計金額をGoogle Spreadsheetにまとめていく方法
文字情報を読み取るOCR APIや、文字パターンを推測できるAI APIを取り入れることで、統一されていない書式の領収書から欲しい情報だけを読み取ることはかなりの精度でできるようになっています。マネーフォワードや会計会社の一部はそのようなサービスを提供してくれています。そういった、AIを使った領収書処理サービスの料金は、提供される機能やサービスの内容によって異なります。例えば、SBIビジネス・ソリューションズの「経費BANK」では、領収書AI-OCRの月額利用料は2,000円で、月100枚までの処理が可能です。また、「バクラク経費精算」や「ProActive」などもAI-OCR機能を搭載しており、手入力ゼロの次世代経費精算システムとして位置づけられています。一般的に、AI-OCR搭載の経費精算システムは初期費用が10万円から50万円程度で、月額料金は3,000円から5万円程度と幅広い価格帯があります。
サービスとして提供する場合、個人の領収書だと月に100枚程度で7000円くらいから提供されています。100枚の領収書ならおよそ20分ほどで撮影できるはずなので、そこから自動でデータ化して、少しのカスタマイズ情報を盛り込むことで短時間で処理できるようになるわけです。
領収書の撮影は黒い背景の紙や布、一番いいのは光を反射しないハイミロンという素材の布ですが、その上に領収書を並べて、さらに反射の少ないアクリル板で平らにして、スマホで一つ一つ撮影していくのが効率的です。
今回のプログラムではまず、そうやって撮影した写真のjpegをGoogle Driveの任意のフォルダーにまとめます。次にデータを入れるGoogle spreadsheetを用意します。そのSpreadsheetの拡張機能にあるApps Scriptに以下のコード(有料部分)を書き込んでいったらいいです。
Spreadsheetにはその作業をした日付と時間、ファイル名、OCRで読み取った文字情報すべて、領収書の日付、領収書の店名、金額を書き込んでいきます。
さらに読み取ったファイルは以下のような法則で名前を変更するので、終わったものは別のフォルダーに移しておけばいいです。
DC(Data Complete): ChatGPT APIを使用して必要な情報(日時、店舗名、金額)がすべて抽出できた場合。
DV(Data Vision): Google Cloud Vision APIを使用して必要な情報がすべて抽出できた場合。
DD(Data Deduction): 過去のデータから不足している情報を補完した場合。
UD(Unprocessed Data): データの抽出に失敗し、不足している情報を補完できなかった場合。
また、領収書やレシートはGoogle Cloud Vision APIを使って読み取ります。そのため、領収書の写真が上下逆や横向きでもかなり正確に読み取ることが出来ます。なので、スマホで写真を撮ったものの方向性は気にせずにフォルダーに入れておけばいいです。
OCRで文字情報にした後に欲しい情報を取り出すのはChatGPT 3.5のAPIを使います。3.5なので使用料金は抑えることができます。
それでは具体的にどうやるかを説明していきます。
ここから先は
この記事が気に入ったらサポートをしてみませんか?