見出し画像

そもそも、NDLサーチで何を取得できるのか(FileMakerで蔵書アプリ8)

前回までで、FileMakerデータベースでの蔵書管理の基本的なところをほぼ網羅できたと思います。これから必要な機能を補い、アプリとしての完成度を上げていく工程に入っていきますが、それでは一旦ここで、国立国会図書館サーチで取得できるデータについてフォローしてみようと思います。

国立国会図書館(NDL)データベースに格納されてるデータの仕様は、NDLサーチのサイトに全て掲載されております。ざっとスクロールして眺めてみるだけでも、とても細かく属性分けされていて、あらゆるタイプの資料に対応して、膨大な量のデータを格納できるようになっているのがわかります。

抽出できるデータの主用部分についてはこの連載の記事「その3」を2024年2月に改訂した際に、後半部分に関数付きで掲載しましたので、ここではそれ以外のことを掘り下げることとします。

この記事で取り上げたのは以下の8項目です
・タイトル
・タイトルの読み
・著者名
・著者名の読み
・発行元
・シリーズ名
・NDC分類記号

どう格納されているのか

NDLサーチで返されるXMLは、テキストの羅列ですのように見えますが、記述のロジックがあることがわかります。
ここでは毎度の「バカの壁」の検索結果を例に解読してみます。リンク先はこちら。

https://ndlsearch.ndl.go.jp/api/sru?operation=searchRetrieve&recordSchema=dcndl&query=isbn=9784106100031&maximumRecords=1

返ってくるXMLがこちら。見やすいように、ヘッダ部分を折りたたんでいます。

記述方式やデータベースそのものに関するヘッダの記述を除いた、<recordData>タグで囲まれているブルーの部分が本体になります。

全体では3段構成になっている

本文にあたる<recordData>部分の構成は3段になっています。
1段目は国会図書館の管理情報で、<dcndl:BibAdminResource>タグで記述されていいます。こちらは特に必要ありません。

2段目は書誌情報。<dcndl:BibResource>タグで囲まれた部分に今回取得しようとするデータが格納されています。ブルーでハイライトしてみます。

この部分はあらゆる形態の資料に対応できるよう、全部で81項目が定義されています。資料によって該当する項目のみを格納していますので、実際に格納されてる項目は少ないです。

3段目は個体情報で、所蔵されている図書館にまつわる情報が記述されています。この段も今回は必要ありません。

格納形式は3種類ある

タグで囲われた各項目にデータが格納されていますが、その格納形式も3種類あります。URI形式で参照されたデータ、タイトルと読みのように複数の属性をセットにした構造化、文字列をタグで囲ったシンプルな形式の3種類です。

DC-NDL(RDF)フォーマット仕様 Ver2.11より抜粋

見たところ、一つの属性について2種類の形式で並列に格納されていることもあるようです。FileMakerに取り込むにあたっては、格納形式によって関数を調整する必要がありますが、タイトルによって格納形式が違うために対応し切れないこともありそうです。作り込んでもうまく取り込めないケースも起こりうるということは、含みおいた方が良いかもしれません。

何か格納されているのか

ここからが本題。書誌情報の81項目は何が格納されているのか、個人の読書記録に必要そうなものをピックアップして見てみます。一般流通書籍以外の形態(研究論文とか楽譜とか)にも対応するための項目や、細かい注釈などもあるので81項目のうちの大半は零細需要には必要ないものと言えそうです。
しかしながら、そういった注釈のようなものも含めて細かく格納しているからこそ、曖昧なキーワードで検索しても「何かが」引っかかるのかもしれません。

ここから先は

2,902字
この記事のみ ¥ 100
期間限定 PayPay支払いすると抽選でお得に!

この記事が気に入ったらサポートをしてみませんか?