見出し画像

【紙の伝票にNo!】スマホGPTsで写真から自動読み取りExcel記録もできる3つの事例

紙の伝票を手作業でパソコンに入力するのを面倒に感じる方も多いのではないでしょうか。毎月のように似たようなフォーマットの伝票が届き、日付やインボイス番号等を一つひとつ確認しながらデータ入力…。非常に煩わしいことがあります。

そこで、写真をスマートフォンで撮影し、ChatGPTのアプリからアップロードするだけで必要なデータを自動的に読み取り、表形式で出力、あるいはクラウド上のExcelやGoogleスプレッドシートに直接追加できるGPTを開発しました。
今回は、その3つの事例をご紹介します。

以下のVoicyの放送からAI文字起こしをベースに記事化しています。
詳細はVoicyにて本編をお聴きください


関連書籍やYouTube動画のお知らせ

私が執筆した「GPTs仕事術」という書籍では、今回ご紹介したGPTの作り方などを詳しく解説しています。興味を持っていただけた方は、ぜひこの書籍を手に取っていただければと思います。

また、「ChatGPT最強の仕事術」著者の池田智弘さんとのYouTubeコラボ動画では、スマホで撮影した写真からデータを抽出するChatGPTの活用術を解説した動画をアップロードしています。この動画は最近再生数を伸ばしており、ChatGPTを業務で活用したい方には参考になる内容となっています。ぜひご覧ください。

①請求書からデータ読み取り

例えば生活協同組合の食品宅配サービス「パルシステム」の請求書を毎月たくさん受け取っていますが、これをGPTsで読み取ることで日付や金額などのデータを簡単にデジタル化できます。

5枚などまとめて撮影すれば、ChatGPTがそれらの請求書から日付や金額、請求額などを読み取ってくれます。こうすることで、請求書をファイリングする手間が省け、データとして活用しやすくなります。

②燃費を自動記録しスプレッドシートに転送

※以下の例では金額に間違いがありました。実際にデータを記録させる前に、金額の訂正を命じることが重要です。

ガソリンを給油する際にもらうレシートから、日付や給油量、金額などの情報をGPTsに読み取らせます。さらに車のメーターを同時に撮影することで、累積の走行距離も取得できます。

これらの情報をGoogleスプレッドシートなどのクラウド上の表計算ソフトに自動的に送信し記録することが可能です。こうすることで手動で入力する手間を省き、燃費の記録を自動化できます。

情報をGoogleスプレッドシートなどのクラウド上の表計算ソフトに自動的に送信し記録することが可能です。この際、「Zapier」というデータ連携サービスを利用しています。Zapierを使うことで、GPsTとスプレッドシートを簡単に接続できます。

以前はスマートフォンのアプリを利用していましたが、アプリに手入力するのが面倒で、CSVデータなどの取り出しができず不便だったため、今回GPTsを使って自分でシステムを構築しました。

③伝票から読み取りExcelに自動追加

ガスや水道の請求書は紙で配達され、手動でパソコンに入力するのが大変です。しかしGPTを使えば、スマートフォンで請求書の写真を撮るだけで必要なデータを読み取り、OneDriveに保存されたExcelファイルに自動追加できます。

読み取らせるデータは、ガスか水道かの種別、日付、使用量、金額です。毎月の請求額の推移をExcelで集計・グラフ化することが可能です。

ただし、日本の請求書は「和暦」を使うことが多いので注意が必要です。例えば「令和6年」と書かれている場合、GPTはこれを正しく解釈できません。そこで、GPTに「令和6年は2024年である」のように指示しておく必要があります。このように、日付データを扱う際には、和暦と西暦の対応づけを命令文に含めることが大切です。

注意点

画像からデータを読み取るChatGPTの活用における注意点を整理しています。

まず、処理速度は決して速くありません。数十枚以上の伝票を一度に読み込ませることは難しく、一度に5~10枚程度が限度だと考えた方がよいでしょう。

また、読み取り精度も完璧とは言えません。日付や金額などの限られたデータであれば 読み取り精度は高いですが、品目や単価など細かい内訳まで取得することは困難です。ハルシネーション(うその情報)が含まれる場合もあります。

したがって、請求書の場合は日付や合計金額、タイトル程度に絞ってデータを読み取ることをおすすめします。

さらに、請求書のレイアウトやフォーマットが一定している必要があります。フォーマットが異なる複数の請求書に全て対応するGPTsを構築することは難しいでしょう。

画像からの文字起こしの限界と、Google  Bardの優位性

ChatGPTは画像内の物体や人の表情といった視覚的な情報の解釈に長けています。しかし、文字や数字などのテキスト情報を正確に読み取る点ではまだ発展途上で、改善の余地が大きいです。

一方、ChatGPTのライバルとして注目されるGoogle Bardは、画像内のテキスト情報を非常に精度高く読み取れることが特徴です。これはGoogleレンズの技術がベースになっているためだと考えられます。

例えば表計算ソフトのデータをプリントアウトしたものなど、文字量の多い画像からでも的確に文字起こしできるのです。ChatGPTの場合はハルシネーションが多く正確さに欠けるでしょう。

以上の点から、大量のテキスト情報を画像から取得したい場合には、今のところGoogle Bardを使うことをおすすめします。

インボイス番号も取得できる?

当社の決算期は11月末で、2ヶ月後の1月末が税金の申告・納付期限です。インボイス制度開始に伴い、取引先企業の適格請求書発行事業者番号を集める必要が出てきました。こ

れは手間な作業ですが、GPTを使えばレシートから適格請求書発行事業者番号を読み取ることも可能かもしれません。

例えばコンビニなどで購入した際のレシートに、その店舗の番号が印字されているはずです。GPTにこれをOCRで読み取らせ、Excelなどに自動転記できれば業務効率化につながると考えました。


この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?