見出し画像

【人文情報学散歩(3)】「歴史情報学の教科書」(2019) ‐ 10章 歴史情報学の未来


私はITエンジニアになる前は日露戦争の時期ロシアに移民した韓国人の移住問題を勉強した歴史研究者でした。(興味がある方はGoogleで翻訳して面白半分でよんでみてもいいでしょう。)結構、頑張って論文を書きましたけど、移民って一体何なんだろうと思って、実際に移民してみました。 約8年間、過去の資料を見て解釈し、文章を書くことに没頭しました。 本当に面白かったのですが、そのように発見した興味深い事実を他の人にどう知らせて共有するか、その方法について悩み始めました。

最も簡単に考えられる方法はウェブサイトです。 私が研究するためによく利用したのは、歴史データを持っているウェブサイトでした。 韓国には「韓国史データベース」、日本には「アジア歴史資料センター」というものがあります。 どちらのサイトも、研究者と市民社会全般に歴史データへのアクセスを提供するために作られたという共通点があります。 

韓国史データベース
アジア歴史資料センター


生まれ育ったところが韓国なので、韓国でどんな脈絡の中で、そして現在大まかにどんな状況の中で歴史学と情報学が結びついていくのかは大体分かりますが、日本ではどう進んでいるのかよく分からないので、調べてみたくなりました。 そこで「歴史情報学の教科書」という本を読んでみました。 厚さも薄く、比較的最近の2019年に出版された本なので、すぐに現在の日本での歴史情報学の状況を調べることができました。 日本の大学、博物館、研究所で活躍する歴史情報学の専門家たちの文章を集めました。

無料で公開しているので、興味があればクリックして、ダウンロードしてください。


 私はせっかちなので、普段本を読む時に結論から見る癖があります。 今回の読書も同じでした。 著者は、歴史情報学はどこに進むべきかを説明しています。 いろいろありますが、文章で印象的だった2つのポイントだけ紹介して、私の感想を簡単に書いてみたいと思います。

 一つ目、著者は歴史情報学でディープラーニング活用において優先的に考えるべきことは古文書OCR作業だと主張しています。 なぜなら一応古文書OCRはある程度正解が決まっているからです。 ただし著者はディープラーニング技術の限界にも言及しているが、ディープラーニング自体は「要求されたある種の答えを出す」ことは上手だが、その過程が必ずしも明確なわけではなく、「なぜその答えになるのか」は分かりにくいのが特徴だと指摘します。  

 調査を別にしてみたら、OCRで活用されるディープラーニング学習モデルとしてCNN(コンボリューション神経網)、RNN(循環神経網)、CRNN(コンボリューション循環神経網)などがあるそうです。 CRNNはCNNとRNNを組み合わせたものです。 画像内でシーケンス データ(例:テキスト)を認識するために空間的特徴抽出およびシーケンスモデリングを行うニューラルネットワークと呼ばれます。  CNNのようなモデルはイメージの特徴を抽出する過程が複雑で解釈が難しい場合があるそうです。 


 私は技術的な進歩は止めるのが難しいと思います。 私の好きなある歴史学者は本人のインスタグラムで、「自分は現在この途方もない技術的進歩に追いついていない」ことを残念がっていますが、結局、社会諸分野は技術進歩に制約をかけて防ぐのではなく適応しなければならない問題だと所感を明らかにしています。  本書の著者も技術的な進歩は止まりにくいとしており、それを防ぐなら、まるで 将棋のソフトに対して「人間に勝たないように開発するな」というのが無意味なことと同様だそうです。

第二に、どれに注目すべきかという問題を超えて、現在活用されているフレームワークや規約についてもわかりました。TEI(Text Encoding Initiative)IIIF(International Image Interoperability Framework)。 TEIは人文学的コンテンツをデジタル形式で表現しエンコードする標準化された方法論と指針を提供する国際的なプロジェクトです。 TEIガイドラインはXMLベースで作成され、テキスト文書の構造、レイアウト、言語的特徴などを詳細に記述できるようにするそうです。 一方、IIIFはデジタルイメージとビデオリソースを標準化された方法で表現し共有するための国際標準フレームワークです。 画像とビデオ リソースの標準メタデータおよび画像サービスのためのAPIを提供するそうです。

このように研究者だった時代にはプラットフォームが提供する情報を利用してみただけで、それがどのような技術的土台の上に情報が提供されているのかは全く知りませんでした。 今回の読書をきっかけに、現在歴史情報学で使われている技術に関心を傾け、過去に学んだ歴史学の知識を情報技術を通じて表現してみたいと思います。
 

IT人文エンジニア
ソンさん



この記事が気に入ったらサポートをしてみませんか?