見出し画像

最終レポート出した

 共創工学でつくるBigHisoryの研究基盤
 還暦を過ぎたある日、突然思い立って、私はアプリ開発者になった。といっても、開発のなんたるかも、プログラミングも、何も知らなかった。ただ、「自分がほしいアプリを自分でつくろう」と思ったのだ。以来、独学の試行錯誤、七転八倒の悪戦苦闘を繰り返しながら、日々の小さな達成感や、ときおり垣間見る新しい景色に励まされつつ、なんとかプロジェクトの全体像が見えてきたところである。そんな中、「母校でもう一度学びませんか」という呼びかけを受けて、共創工学部で学ぶ機会を得た。
 今回は、この新しい学びを用い、自らのプロジェクトを省みることで、最終課題レポートとしたい。(聴講生なので、採点の対象にならないことは重々承知しています。単に自分自身のために書きましたが、せっかくなので提出いたします)

『四次元年表』とは

 Big Historyに対応した、横断的、網羅的、学際的データベース。いつ、どこで、何があった、という三つの基礎情報(構造データ)に特化し、テキスト、画像、動画、音声等(非構造データ)は含まない。その代わり、タグ付けによって、多様なクロス検索を可能にする。
 歴史の可視化、データベースの可視化、を目指しており。表示に特色がある。

1 Classic 従来の年表同様、事象が時系列で表示される。

2 Scalable   時間軸が設定されており、各事象はその「いつ」に固定され、時間的な遠近が正しく表示される(ただし対数軸で)。138億年を一覧で見ることも、21世紀だけをzoomで見ることもできる。

3 3D表示 二次元の世界地図の上に時間軸を立て、各事象を位置情報×時間でプロットする。縦方向に見れば地域史、横方向に見れば同時代史を見ることができる。時間と同時に位置的な遠近もある程度正しく表示される。また、ある事象の伝播を円錐状に見ることも、理屈としては可能である。

4 4D表示 『四次元年表』という名前の由来である。三次元の地球儀上に時間軸を立てて各事象をプロットする。地図の持っている「端と歪み」の問題を解消する。

5 宇宙表示 太陽系内の事象については、太陽を原点とする三次元空間表示、または太陽を原点とし、惑星公転面をx-y平面とし、そこに時間軸を立てる三次元時空表示を行う。

6 その他 AR、空間コンピューティングを利用した表示等も視野に入れている。

 これらの表示は事象の時空位置を特定するのみならず、データの存在しない「不在」を可視化する。そのことで「不在」の理由を探索し、新たな研究課題を発見することもできる。

プロジェクトの問題点

 冒頭でも述べたとおり、これは工学的教育を受けたことのない人間が還暦を過ぎて始めたプロジェクトである。じっくり計画を立てたり、学習を積んだりして始めたのではなく、できそうなことから始め、試行錯誤を繰り返しながら、強引に進んできている。とくにデータベースに関しては何度も設計を変更し、模索中というところだ。
 ここで一度立ち止まって、全体像をしっかり見直す必要があるだろう。

「データマイニング」の学びでプロジェクトを検証する

第十五回で提示された「データマイニングプロセス」にそって、プロジェクトを検証してみる。

データソース

ソースには以下のようなレイヤがある。
1, アナログで非公開のデータ
2, アナログで公開されているデータ
3, デジタルだが非公開のデータ
4, デジタルで公開されているがまとまっていないデータ
5, デジタルで少しまとまっているデータ(団体ごと)
6, デジタルで横断的にまとまっているデータ

6があればありがたいが、1や2にも代えがたい魅力があるし、3は垂涎の的である。本プロジェクトでは最終的に、1や2の所有者、あるいは、3の関係者などに情報提供してもらうシステムをつくりたいと思っている。が、まずは6を使いながら、地道に基礎を固めていく。
 最近では、NASAのデータベースから宇宙探査機の航跡データを取得した。ここはNASAのみでなく、JAXAの探査船についても共通の様式で格納、公開していてとてもありがたい。

一方、考古学資料、特に私が欲しいのは発掘現場の情報だが、横断的なデータベースは今のところ見つからない。盗掘を恐れて位置情報を秘匿する傾向があるので、3に該当するかもしれない。

前処理

NASAのデータは詳細で、全部取り込んではとても活用できないので、取捨選択を行った。利用するために取り込んだのは、太陽圏を離脱した、または離脱予定の5機の宇宙探査船の航跡データである。全て一日単位で公開されているが、打ち上げから一年は各月一日、それ以降は打ち上げ月の一日のデータだけを利用した。また、時間表示のためにユリウス日のデータも取得した。

データ統合

『四次元年表』は網羅的なデータベースであるから、ユーザーによる入力、また検索に際して、分野ごとに異なる操作が必要にならないよう、配慮しながらデータ統合を行う。「いつ」「どこで」「なにがあったか」と検索用のタグを設定するだけの構造データのみを扱うが、表記揺れ問題などに対処するため、統合にはそこそこ神経を使い、テーブル構成も再三見直すことになる。

マイニング

 そもそもなぜ『四次元年表』をつくっているのか。歴史が人文学の範疇に限られていたり、そのほかのさまざまな○○史にも、横断的、網羅的な情報がないなど、Big Historyとしての新たな視座を見つける基盤がなかった。そこでまず横断的、網羅的なデータベースをつくり、マイニングによって様々な事象の相関関係を見つけていきたい。

 例えば、気候変動と社会情勢、天文異変(日食、月蝕、超新星爆発、彗星、低緯度でのオーロラなど)と社会情勢、あるいは文学、芸術などへの影響、科学技術とSFの関係(卵と鶏のような)、海上貿易と海戦・海賊、沈没船の関係(水中考古学などを含め)、海底探査と生命の誕生やプレートテクニクスに関する研究、などなど、これまで細々と専門家が穿ってきた隘路を広げる可能性のあるマイニングに挑戦していきたい。

評価(可視化)

 可視化の技術は急速に発展している。一方でそれを活用するには、それなりの能力が必要だ。特に本プロジェクトでは、手持ちのデータを自分で解析する、のではなく、データベース内の情報をユーザーが解析する、というステージを目指しているので、可視化のプラットフォームをアプリ内にどう組み込んでいくか、が難しいところだ。しかし、いわゆる文字情報の羅列だけから相関を読み解くのは、ある意味さらに難しい。できるだけ直感的に操作できる可視化の方策を考えていきたい。

 直近では、NASAのデータを使って、宇宙探査船の航跡を三次元的に表示する可視化に取り組んでいる。使用したのはApacheEChartsのScatter3Dである。今後はプレートテクトニクスのデータをGISで表示する、海底地図を活用しながら海事情報を可視化するなどに挑戦していきたい。

Knowledge

BigHistoryはまだ新しい学問領域である。『四次元年表』が新しい視座の開拓に役立つ日がくれば幸いである。

検証のまとめ

 データマイニングで一番大変なのはどこですか、という質問に、先生が「データの前処理が九割」とおっしゃったのが印象的だった。このプロジェクトを始めたときは、「アプリってどうやってつくるのだろう」というところにばかり考えていて、気がつけば、アプリの基本形はでき、データベース(ほぼ空っぽ)のアップロードもできたが、そのデータベースにデータをどう入れていくのか、どうすれば扱いやすく、意味のあるものになるのか、私の前には、まだ九割以上の作業が山積みのままなのだとつくづく思い知った。

文理を越えたBigHistoryに共創工学の精神で挑む

 ほぼ半世紀ぶりの母校での学びは新鮮で楽しかった。文理の垣根を払い、視野を広げ、視角を変えて、これからも地道に一歩一歩、学びを深めていきたいと思う。

四次元年表

三次元・四次元表示

四次元年表の使い方

四次元年表for Mobile


この記事が気に入ったらサポートをしてみませんか?