見出し画像

【人文情報学散歩(2)】「歴史情報学の教科書」(2019) ‐ 8章 歴史データのさまざまな応用 − Text Encoding Initiative の現在− 

著者: 永崎研宣(人文情報学研究所

TEIとは?


TEIは主にテキスト文書をエンコードして記録するための標準です。TEI は XMLベースのマークアップ言語を使用して、テキスト文書の構造、形式、文法、言語的機能などを詳細に記述します。TEIは文学作品、歴史文書、新聞、学術論文、エッセイなど様々なテキスト形式を扱うことができます。TEIは主に学術研究者、図書館、博物館、文化遺産機関などでデジタルアーカイブ、デジタル図書館、学術研究などのために使用されます。

TEI登場の脈絡


各自が異なるルールで記述を行うことになると、共通のツールを使用したり、それぞれの成果を共有したりすることが非常に難しくなる可能性があります。1987年の冬、ニューヨーク州ポキプシーで集まった人々は、長い議論の末に共通の原則を共有することに合意しました。このガイドラインは、人文学研究におけるデータ交換のための標準的な形式を提供することを目指しています。

この動きは、人文学者、情報工学者、図書館司書などによって支えられており、TEI(Text Encoding Initiative)と呼ばれています。その後、TEIガイドラインを策定し、TEIコンソーシアムを設立し、参加者による自律的でガイドラインを改善し続けることとなりました。


TEIガイドラインの活用事例


イギリスでは、シェイクスピアの戯曲について、さまざまなバージョンに対応したTEIに基づくテキストデータが、各地で公開されています。

これはTEI ガイドラインに沿って記述した人物情報と幕の情報を組 み合わせて視覚化したものです。


TEIとIIIFとの関係


 私が一番興味を持って読んだ部分は「TEIとIIIFとの関係」です。IIIF (International Image Interoperability Framework)とは、画像へのアクセスを標準化し相互運用性を確保するための国際的なコミュニティ活動です。画像へのアノテーションは Open Annotation というWeb 上のオブジェクトに自由に注釈を付けようとする流れに淵源を持つIIIFが 2011年から欧米の有力な文化機関のIT エンジニアを中心に開始され、主に文化機関がデジタルコレクションを公開する際に採用するようになりました。


 すでに欧米の人文系研究者や文化機関はTEI に準拠した書誌情報やテクストデータを大量に蓄積してきています。そこで、IIIF で公開される画像にTEI での蓄積をどのようにリンクさせるかという課題への取り組みが行われました。
 著者によると、現時点では IIIF はどちらかといえば公開されたデータを共有・活用する仕組みという志向が強く、専門に特化したデータを作成するにはあまり向いていないそうです。人文学向けの基礎的なデータを作成する場合には、TEI に準拠したデータを保存用として作成し、それをIIIF に変換するというのがデータの継承性という点では安全な方法だそうです。


感想

実際にiiif.ioというサイトにアクセスしてAPIドキュメントを確認してみると、本当に詳しく書かれていて驚きました。 例えば、リソースタイプ、リソース属性、JSON-LDの考慮事項、HTTPリクエストと応答方式、認証方式まで非常に具体的に書かれています。

iiif.ioのAPIドキュメント

新しく知った概念が一つあります。 JSON-LDという形で、JSONを使ってリンクドデータをエンコードする方法です。 JSON-LDを使うと、既存のJSONと同様の方法でデータをシリアル化することができるという。

{
  "name": "John Doe",
  "age": 30,
  "city": "New York"
}
{
  "@context": {
    "name": "http://schema.org/name",
    "age": "http://schema.org/age",
    "city": "http://schema.org/city"
  },
  "@type": "http://schema.org/Person",
  "name": "John Doe",
  "age": 30,
  "city": "New York"
}

JSON-LDはJSONと同じデータを表しますが、@contextフィールドを使用して各フィールドの意味と関係を説明するコンテキストを提供します。また、@typeフィールドを使用してデータのタイプを指定しています。JSON-LDはデータの意味と構造を明確に説明し、データの相互接続性を強化します。JSON-LDは、ウェブサイトのスキーマ、マークアップ、ソーシャルメディア共有、ウェブ検索エンジン最適化など、様々なアプリケーション分野で活用されているそうです。
  このように新しい形を学習できて、本当に楽しかってですね。

参考資料

歴史情報学の教科書(2019)
http://codh.rois.ac.jp/iiif/
https://iiif.io/
https://iiif.io/api/presentation/3.0/#4-json-ld-considerations


この記事が気に入ったらサポートをしてみませんか?