GASで行政データの使いやすさを向上する
今回はGoogle Apps Scriptで入札データをJSONにした話を書きたいと思います。
1.なぜJSONなのか?
そもそもなぜJSONにしたいのかについて紹介します。
JSON(JavaScript Object Notation)は、データ交換のための軽量なテキストベースのフォーマットです。人間にとって読み書きが容易で、マシンにとっても簡単に解析・生成が可能な構造を持っています。
1-1.JSONの概要
形式: JSONは属性-値ペアの集合を使用します。これらのペアはオブジェクト、配列、文字列、数値、真偽値、nullなどで構成されます。
言語の独立性: JSONはJavaScriptから派生していますが、多くのプログラミング言語で利用できます。
構文: シンプルで視覚的に理解しやすい。例: `{"name": "John", "age": 30}`
1-2.JSONがデータ活用に便利な理由
軽量: XMLなどの他のデータ交換フォーマットに比べて、JSONは非常に軽量です。これにより、データの送受信が迅速になります。
言語サポート: ほとんどの現代プログラミング言語は、JSONの解析および生成をサポートしています。これにより、異なるシステム間でのデータ交換が容易になります。
人間が読みやすい: JSONの形式は視覚的に直感的であり、デバッグと保守が容易です。
柔軟性: JSONは階層的なデータ構造を持つため、複雑なデータも表現することができます。
Webとの親和性: Webのデータ交換においては、JSONがデファクトスタンダードとなっており、多くのWeb APIがJSON形式を使用しています。
データベースとの連携: NoSQLデータベースなど、JSON形式のデータを直接扱うことができるデータベースも増えています。
スキーマの不要性: XMLとは異なり、JSONにはスキーマが必要ないため、構造の変更が柔軟に行えます。
以上のような特性により、JSONはデータ交換、設定ファイル、API応答など、様々なシナリオで広く利用されています。シンプルで効率的な構造により、開発の迅速化と効率化が可能になります。
JSON化したデータがこちら↓
2.データ変換の流れ
今回対象データは千代田区の入札経過調書です。
ステップ①PDFファイルの収集
最初のデータ形式はPDFファイルでした。
ステップ②PDFからスプレッドシートに転記
PDFファイルをスプレッドシートに転記します。
※こちらは手打ちで行いました。
ステップ③GASでスプレッドシートからJSONに変換
PDFからJSONに変わりました!
こういう地道なデータの使いやすさ向上も大事だと実感しています。
3.お礼
今回のJSON化にあたって、Discordコミュニティの参加者の方にご協力いただきました。この場でお礼申し上げます。
オープンデータを活用した報道や政策立案の研究するコミュニティをやっています。興味がある方は覗いてください↓
この記事が気に入ったらサポートをしてみませんか?