見出し画像

ピュイが語る!COTEN世界史データベース | 開発チームが大切にしている4つのこと

こんにちは!株式会社COTENの千咲(Twitter: @seekmyffy)です。
世界史データベース開発チームにヒアリングした内容をすべて忘れてしまった千咲。
そこに現れたのは、COTENの「あの鳥」だったーー!?

前回の記事はこちら↓

ち:ここ数年、カスタム君っていう税関の犬のキャラクターにハマってるんだけど、ピュイにちょっとだけ似てると思うんだよね……色は違うけど、丸みとか、頭身の低さとか。

ピ:キャラクターっていうのはだいたい丸くて頭身が低い方向で似るものだよ。ちさきもまだまだメタ認知が足りないんじゃない?さて、今日も世界史データベースについて語っていくよ。

ち:(似てるって言われてちょっと怒ってるよな?)

Connecting the Dots, Simple, Authentic, Open

ピ:世界史データベース開発チームには、大切にしている4つの開発目標があり、それをProduct DNAと呼んでいるよ。Connecting the Dots, Simple, Authentic, Openだね。

ち:ふむふむ。それってどうやって作ったの?

ピ:作り方はチームメンバーの「こんなのあったら良いな」をまとめたもので、龍之介も含めてボトムアップで考えたよ。最初に世界史データベースの提供価値をコアメンバーで案出しして、それらをKJ法でマッピングし、Product DNAとDesign Principleに転換した。

提供価値を案出ししたときの深井メモ。

KJ法
文化人類学者の川喜田二郎氏が、著書『発想法』の中で、効果的な研究・研修方法であると紹介した方法。

ち:うーん、正直、外部の人間からするとすごい抽象的なものに思えるんだけど、これらが開発の指針に影響与えたりするの?

ピ:する。特に、AuthenticとSimpleにはこだわっている。Authenticを一時的にでも下げそうなことについては慎重に議論しているよ。

ち:じゃあ、その2つについて、もっと詳しく聞いてみたい!

Authenticってどういうこと?

ピ:Authenticという言葉で表現しようとしているのは、信頼度・確からしさ。世界史データベースを使ったら、信憑性のある情報が手に入るということ。思想的な偏りや、信憑性の有無がなるべく可視化されていたり、データに客観的な指標が存在するような状態をゆくゆくは目指していくよ。

ち:確からしさってどうやって担保するの?情報にレファレンスをつけるとか?

ピ:一つは歴史に対する観点を増やすことだね。歴史の情報って、えてして勝者の歴史でしかない。勝者の観点からだけではなく、別の観点から見た歴史のデータをどんどん増やしていきたいと思っている。

ち:確かに。同じ戦争についての本でも、勝った国と負けた国で言っていることが全然違う、というのは本当によくあるよね。

ピ:そう。あと、世界史データベース開発チームは、「信頼性は段階的に上げていくものである」と考えている。データ基盤に入力されている観点を徐々に増やしていくことで、データベース格納されているデータの品質をどんどん高め続けていく、というイメージ。
でも、何よりもCOTENのミッションはメタ認知のきっかけを提供することなんだ。それが一番大事だから、世界史データベースでは最初はwikipediaのようなウェブデータも使う。それを使って得られた体験がメタ認知に寄与するということがわかった段階で、一気に真正性を上げられるように構想しているよ。

ち:なるほどね。じゃあさ、今まで、「Authenticじゃないからやめよう」みたいな意思決定ってされたことあるの?例とかある?

ピ:分かりやすい例だと、重要度だね。歴史的事象の「重要度」って、世界史データベース上でどのように表現されると思う?

ち:これ、よく考えたらめちゃくちゃ難しいかも。例えば、Googleで頻繁に検索されているワードが重要と決めてしまったら、色々と大変なことに……。でも、どんな基準にせよ、COTENが決めることがそもそもあまりにも大それているような。いくら歴史調査チームが存在しているとはいえ、ねえ。

ピ:そうだよね。単に重要度がAuthenticじゃないというよりは、特定の個人・出版社・団体が、本を編むためにまとめた「世界史重要イベント100」みたいな重要度が、Authenticじゃないんだよね。これは完全に主観だから。 同じように、いくら公平性を保とうと配慮しても、COTENが歴史イベントを恣意的に選んでしまったら、同じことになる。

ち:誰が選んでもそうならざるを得ないよね。

ピ:チームで議論した結果、COTENは重要度を決めない、という方向にまとまった。正確には、直接個別のイベントの重要度を決めるのではなく、重要度を決めるアルゴリズムを今後決めていこう、という感じ。
最終的に目指しているのは、いろんなやり方でデータ群をランク付けして、並べて、ユーザーに提示できるようにすること。
例えば、「Aの書籍で目次になっていたデータ」「Bの書籍で重要とされていたデータ」みたいな感じでね。

ち:あーなるほど、自分たちで重要度を判定せずに、例えば資料集に準拠する、というスタイルをとるということね。そしたら、将来世界史データベース事業でもっと多くの国の人を巻き込んでいく時、公益性が保てそう。ナイスアイデアやねー。

ピ:ね。そして、いずれは学者に、入っているデータのverifyをしてもらいたいと思っている。
もちろん、一人の学者がいいと思っている基準だけを載せるのではなく、あらゆる学者の意見を載せたい。つまり、誰がどう言っているか/その情報にどんなバイアスがかかっているかをなるべく示そうとしているんだ。

抽象的な話が続くため、陽夏の笑顔を挟みます。2022.10.14@東京某所

Simpleってどういうこと?

ち:次はSimpleだね。これも、シンプルは日本語でもよく使う言葉なだけに、逆にイメージが掴みづらい…….。

ピ:Simpleで表現しようとしている理想の姿は、世界史データベースがSimpleな設計で、簡単に、素早く情報に辿り着けるものであるということ。
特に、まずはデータの設計自体をなるべくSimpleに保つことだね。

ち:これも、「Simpleじゃないからやめよう/Simpleだからそうしよう」となった意思決定の例を教えてほしい!

ピ:例えば、前の記事で説明したEntityがそうだね。Entityの概念の中に、人物も出来事も、時間の概念を持つものを全部入れ込んだのは、Simpleを担保するため

ち:そうだったねー。時系列を持つものは皆Entityとして、Relation, Category, Propertyを含めた4つの概念にまとめ上げたんだった。
確かにSimpleだ。

ピ:でもね、歴史的情報を過度に単純化するのも良くなくて。
個別具体の歴史情報は、これまで史料や本、論文という形で文字と言語で記述されてきたけど、このままだとコンピュータでうまく扱えない。そこで適度な抽象化を施して、複雑な歴史情報を、4つの概念でまとめようとしている。
この設計をなるべくシンプルに保つことで、柔軟な組み合わせによって、そもそもの歴史情報が持つ複雑さを表現しようとしているのが狙いなんだ。
少し反語的だけど、複雑なものを複雑なままで扱うために、データを整理する構造をSimpleにした、ともいえる。

ピ:いずれは世界史データベース事業を外部に公開し、もっとたくさんの人を巻き込んで進めていきたいから、扱いやすいデータ構造が望ましい、という事情もある。 例えば……家系図、技術ツリー、人物と王朝の関係は、今すべてEntityとRelationで説明できるようになっているよね。これをそれぞれ別ロジックで組むと、1つのデータベースで色々なロジックを組み直さないといけない。

ち:ただでさえ果てしないのに、想像しただけで、果てしない度が上がりそう。

Connecting the Dots, Openは?

ち:話を聞いたところ、おそらく、Connecting The Dots,とOpenの2つは、開発目標ではあるけど、まだそれを気にするフェーズには達していない、そんな感じだよね?

ピ:そうだね。まず、Connecting the Dotsは、これまで見逃されていた歴史情報の見えないつながりを発見できるようにしたいっていう思想。歴史を新しい角度から見ることができるようなUIを提供することで、こうした発見が起こりやすくなることを狙っている。これが、メタ認知のきっかけにもつながると考えてる。
でも今は、繋ぐべきDots=データの量が足りないからまだ、って感じ。

ピ:Openは、そもそも歴史とは人類の共有財産である、という思想から来ていて、世界史データベースも究極的にはCOTENの活動ではなく人類の活動にしたいと思っている。 ただ最初の火付け役として、今はCOTENが旗振り役を担って開発を牽引している。
リソースの許す限り、情報発信やコミュニティ化も少しずつ推し進めて、開かれた体制づくりをしていきたい。また、世界史データベースの積極的な情報発信や、データ入力をコミュニティ化するといったこともこの中に含んでいるけど、COTEN内でのリソースが足りず、まだ間に合っていない。だけど、このnoteでの情報発信もOpenの思想に則ってるよね。

ち:(noteの世界史データベースシリーズは私が知りたいから書き始めたんだけど、陽夏があんなに協力的だったのはこういう理由だったのか〜)

ピ:現在、チームとしては、世界史データベースを公開することに関して、デメリットが存在しないと考えている。一部開発内容以外は全部公開していいと思っているんだけど、とにかくリソースと準備が足りていない状態。
ち:今はピュイが語ってくれてるけど、もっといろんな人を巻き込んでいきたいよねー!

今日のまとめ

ち:今日はいつもよりさらに抽象的な話だったねー。

ピ:そうだね。開発でも、ルール決めにおいても、具体と抽象を行き来することが常に大事だよね。

ち:そろそろ、ShangYang(データベースの概念整理チーム)の話の方も聞いてみたいなー。


ここまでお読みいただきありがとうございました。
引き続きよろしくお願いいたします!

COTEN CREWに参加しませんか?
「個人CREW」として、COTENの活動を応援してくれる人を募集しています!ご参加はこちらから
・限定エピソードの配信
・COTEN RADIOをいち早く聞けるアーリーアクセス

「法人CREW」になって、企業のあり方を一緒に探求しませんか?ご参加はこちらから
・法人CREW限定のSlackコミュニティ
・COTENメンバーとの対談
・限定勉強会の開催

🌱 皆様へのお願い 🌱
現在、オウンドメディア試運転中です。
本格ローンチに向けて、ぜひ、皆様からの率直なフィードバックをいただければ幸いです。 ご意見・ご感想は
①「Twitterにてハッシュタグ #cotenmedia をつけてツイート」
https://coten.channel.io にチャットを送る
どちらかの方法でお願いいたします!