見出し画像

LOD(Linked Open Data)ってご存じですか?「Linked Jazz」が示すデジタルアーカイブとオープンデータの可能性

はい、ビッグバンドファンです。今日はLOD、Linked Open Dataを用いたデジタル・アーカイブの可能性について「Linked Jazz」というプロジェクトを紹介しながら、ビッグバンドのデジタル・アーカイブについて考えを深めていこうと思います。

Open Dataとは?

LODはLinked Open Dataの略です。なので、まずはOpen Dataの話からいきます。端的に言えば言葉通り「公開データ」ということですが、現在主に話題になるのは「自治体が保持しているデータを公開する」という形です。

そもそもアメリカを中心に進んでいる話になりますが、アメリカ初めとした欧米各国では日本以上にデータや情報の帰属(この情報・データはどこに帰属しているものか?)という議論が進んでいます。それこそ先日も紹介しましたが、Maria Schneiderさんが見事グラミー賞を受賞した最新作「Data Lords」に関しても、この議論(彼女は音楽家に対し「自分達が本来保持すべきデータを明け渡してはいけない」と警告を発している)の延長上にあります。

こうした「データの帰属」に関する議論の中で「自治体が保持しているデータってそもそも市民のものじゃないの?」という考えが出てきて、その考えに基づき自治体が情報公開を進める、これが世間的に言われる「オープン・データ」という話になります。

日本でもこうした欧米各国の動きを受けて、平成28年に「官民データ活用推進基本法」という法律が制定され、国及び地方公共団体はオープンデータに取り組むことが義務付けられています。

こうした動きの一つの成果とみられるのが、昨年コロナ禍の中でCode for Japanという団体が進めた東京都の新型コロナ対策サイトの開発になります。

このサイトを開発したCode for Japanという組織は企業でも何でもなく、単なる有志が集まった集団なのですが、これが東京都と連携し上記のようなサイトを作り上げる。当然上記サイトを作るには自治体がデータを公開しないことには作り上げることが出来ない。自治体のオープンデータの取組とそれをキャッチアップする市民有志の協働によって出来上がった好例となります。

ただ、そもそもの「データの帰属」に関する議論は自治体データに限らず広く行われている話であり、音楽の分野で言えば先程のMaria Schneider氏もそうですし、広く捉えれば現在裁判中のJASRACの話(=音楽教室から著作権料を徴収する)等も含まれてくると思います。

余談ですが、ここは本当に保守的な考え方も出来れば革新的な考え方も出来る領域なので、何が正しいという話ではなく、ただひたすら議論を深めていく、これが求められているわけです。ところが、こういうのがどうも苦手な人が多いようで、議論がすぐに喧嘩になってしまったり、意固地に自分の主張をするだけになってしまうケースがそこかしこで見られます。喧嘩や炎上のように分かりやすいものだったらまだいいのですが、たまに見かけるのが「あなたはあなた、私は私。あなたの意見を変える必要はないが、代わりに私も意見は変えない」というスタイル。一見相手を尊重しつつ自分の意見を言っているように見え、正論のようにも見えますが、これだと決して議論が深まらない。この辺は「自分の主張の場」と「議論・コミュニケーションの場」という場の性格でもだいぶ変わる部分でありますが、とかく日本だと後者は敬遠されてしまったり、あるいは後者の場において前者の場のような態度を取ってしまう人もいます。

こうした行動を全体としてWeb上で積み重ねると今度は「ユーザーは議論には消極的で、どちらかというと自分の主張だけが出来ることを望む」とプラットフォームのAIが学習してしまう可能性が出てきます。この結果「自分の主張が強い」コンテンツや場ばかりがレコメンドされてしまう。これがプラットフォームレベルで行われると、深まるのは議論ではなく分断だけということになってしまう。この辺はいかんともしがたいというのが現状です。

LOD(Linked Open Data)とは?

さて話を戻します。Open Dataに関しては上記の通りですが、これにLinkedがついたら、どうなるのか?ということです。とりあえずググってみるとこんな感じで解説も出てきます。

何となく技術情報が多くて「ふ~~~ん・・・で?」となりそうですが、@ITさんのタイトルに出ている「Webの全てをデータベースにする」というのがとても端的に特徴を表していると思います。

データベースについて

現在我々が使っているWebのサービス、それこそAmazonやFacebook、楽天やYahoo、Lineとか色々ありますが、これらのサービスが運用される為に必要なデータ(ユーザデータ、商品データ、認証データ等々)はその殆どが「データベース」というデータを管理する仕組みに集約されて管理されています。これは何かを調べたりデータを使いたい時にはそのデータベースにアクセスすることでデータを取り出すことが出来る、ということを意味します。

一方データベースは通常各サービス毎に管理されています。AmazonのデータはAmazonのデータベースで管理されますし、YahooのデータはYahooのデータベースで管理されます。仮に、YahooのデータがAmazonのデータベースで管理されている、なんて話があったら「マズイだろ?それは」ってことになりますよね?実際「Lineでやり取りした画像データやLine Payの決済データが韓国Naver社のデータベースに暗号化されずに管理されていた」という話が最近話題になっている通り、「マズイだろ?それは」という話になっていますので、そんな塩梅です。

非公開にすべき情報・データと公開すべき情報・データは議論が分かれる

ただ上記の話は非公開の情報・データに対しての話であり、Webに公開され誰でもアクセス出来る情報・データ(あるいは本来公開され誰でもアクセス出来るべきなのに非公開あるいはアクセス出来ない情報・データ)に関して言えばなるべく共有された方がいいし、アクセスが容易な状態の方が望ましいわけです。ところが実際にはWebに情報・データを公開したとしても、人目に触れることなく眠っているものというのは山ほどあり、そうした「探し出すことが難しい情報・データ」というのは、たとえそれ自体にとても価値があったとしてもデッドストック、つまり死んだも同然になります。更にそうした探索困難な情報・データを必死に探し出すことが出来たとして、その情報をどうやって管理するかという話になると、結局またどこかのデータベースに入れるということになるわけです。それって「あっちにある情報・データをちょっと人目に付きやすい別のところに移す」だけであり、Web全体で見ればあまり価値の無い行為と言えます。

そこで、そんなことをするぐらいなら最初から探し出しやすいように情報を公開するようにすれば、探し出して別のデータベースに登録する必要もなくなるし、且つ情報・データが死ぬことも無くなるよね?これがLOD、Linked Open Dataという考え方になります。つまりただ公開されただけでは探し出すことが難しい、探し出すことが難しければそもそも公開しても意味ないよね?であれば、ただ公開する(Openにする)だけでなく、公開する段階で探し出しやすいように公開する(Linked Openにする)ようにしよう、ということです。

ここまでの話を非常に分かりやすく段階的に説明してある図がありましたので、是非ご参照ください。

Linked Jazzの紹介

さて、ここまでOpen DataおよびLinked Open Dataという形で話を進めてきましたが、このLODの考え方に基づき「ジャズ・ミュージシャン同士のつながりをデータから可視化する」これを行ったのがLinked Jazzというプロジェクトになります。このプロジェクト最大の成果とも言えるものが以下のページで公開されています。

このツールは公開されているインタビュー記事等のデータを元にどのミュージシャンがどのように繋がっているかを可視化したものです。例えば「Toshiko Akiyoshi」のところをクリックすると以下のように穐吉さんを中心にした相関図に切り替わります。

画像1

そして、穐吉さんといえば当然「Bud Powell」が気になります。右上の方にいましたのでカーソルを合わせるとこのように「Toshiko AkiyoshiがBud Powellのことをどのように話しているか」という選択肢が出てきますのでクリックします。

画像2

するとこのようにインタビュー記録をみていくことが出来ます。

画像3

右上の「Transcript Source」をクリックするとデータソース元が表示されます。

画像4

当然ながらオープンにされたデータが無い限り、このような取り組みは進めることが出来ません。まず必要な情報・データが公開されていること、これが第一歩となります。

そして、このように情報・データが整理されると何が良いか。意外なつながりや今まで見えてこなかった関係や発見がすぐに見つかるということです。例えば、こんな感じ。

画像5

穐吉さんがメイナード・ファーガソンさんについて触れているデータがあると。こういうことがすぐに分かる、これがデータビジュアライゼーションの力です。早速見てみるとこんな感じ。

Interviwer
Okay, so that needs to be corrected ... the Grove lists a quintet, as well. And you had personnel, was Gene and Jake first, or no?

Toshiko AKiyoshi

No, the time when we had a quartet together, Jake Hanna was already, hed left school--I think he was playing with Woodys band--it could be, I think it was Woody Hermans band. It could be Maynard Fergusons (Ferguson), Im not quite sure about that part. But, so, Gene Cherico, always he had a knack for finding a drummer. We had a job in Hartford, a place called High Brein (sp?? ) Lounge--or Few Brein (sp?? ), I dont know how to pronounce it--it was a beer company or whatever. 

内容としては大したものではなく、ちょっと会話の中で触れているだけなのですが、そういう内容もこのようにデータになることで拾っていくことが出来るようになります。俗に「口伝」と言われるようなものも、このような形になっていればご本人が亡くなった後でもしっかり確認していくことが出来るようになるわけです。

こうした取り組みによって実際Zena Lattoという女性ジャズ・ミュージシャンの活躍を掘り起こすことが出来たそうです。彼女は実は1957年に女性だけのジャズショーという当時としては画期的な企画をカーネギーホールで開催していたのですが、長いことジャズの歴史の中で語られることはありませんでした。この原因が記録の整理にあったそうで、たまたまカーネギーホールの記録管理人が当時の企画のチラシを発見したことから、プラット大学のセマンティック・ラボが改めて資料収集を始めたそうです。そして、2016年にZena Lattoが亡くなってしまうのですが、その前に彼女自身がインタビューに応じ、記録と共にアーカイブもセマンティック・ラボに寄贈されました。この資料はその後デジタル化され、Internet Archiveを通じて一般に公開されたそうですし、またセマンティック・ラボのメンバーによってウィキペディアのページも作成されました。

記録が無ければ無かったものにされてしまう、これが人間の社会の実情であり、更に言えば記録や情報・データがあったとしてもそれが適切にアクセスできる形で整理されていなければ死んだも同然となってしまう、Zena Latto氏の話はこうした実情を改めて認識させる出来事であったわけです。

その他にも「Women of Jazz」「Local 496 Project」「Linking Lost Jazz Shrines」といった派生プロジェクトが生まれ、現在も取組が進んでいます。

日本のジャズ・ビッグバンドにおけるデジタル・アーカイブについて

こうした取り組み、以前も以下の記事で触れましたが日本でも行っていくべきではないかと考えています。

ただ、アメリカであれば国会図書館や歴史博物館、大学等がデータ収集を適切に進めていますが、日本ではこうした動きが殆どない。あっても範囲が狭く、それこそ音楽におけるデジタル・アーカイブといってもごく限られた範囲で実施されているのが実情で、ジャズやビッグバンドなんていうのは望むべくもないですし、仮に収集されていたとしてもオープンになっていない。

例えば、慶応義塾大学アート・センターでは油井正一さんのコレクションがアーカイブされているそうですが、オープンには程遠い状態です。

油井正一アーカイヴは、週1日開室、事前予約・利用者登録制です。資料に含まれる個人情報の問題や資料の保存状態などの事情により、 閲覧を制限せざるをえない場合があることを、予めご了承下さい。

従ってまずはデータを集め適切に公開する、これから始めないといけない。例えば上記のアーカイブには油井正一さんのレコード視聴時のノートやファイルがあるそうなのですが、これをオープンデータにするには、事前に予約をしたうえで週1日訪問しアーカイブを見て、その内容をまとめたうえで公開する、そういう話になります。しかもこれを行政や企業、大学等の力を期待せず好き者が愛と努力と根性で始める。誰かが先鞭つけるとそれに乗っかってくれるところは結構あるんですけどね、とにかく最初に始める人が圧倒的に少ない、これが日本のデジタル・アーカイブの現状です。辛いわぁ~。。。

というわけで、ここまでお読みいただいた方、まずはこのデジタル・アーカイブという話に関心を持って頂けたらと思います。多分このまま放っておいたら日本のジャズやビッグバンドの記録やノウハウは早晩デッドストック化し、結果先人達の優れた遺産を活かすことも出来なくなり、やがて忘れ去られ、最後は失われていく、そんな話になってしまうと思っています。私もどこかで動こうと思いますが、こればかりは私個人でどうにか出来る問題でもないので、皆さんがどれだけ関心を持っているかにかかっていると思います。まずは「あ、これはマズイぞ」と思ってもらえたらと思います。

以上、ビッグバンドファンでした~、ばいばい~

この記事が気に入ったらサポートをしてみませんか?