見出し画像

Starrydataプロジェクトへの思い

過去の研究者の歩みを、データに変えて未来に繋ぐ

世界のどこかの、私たちが名前も知らない研究者。

人類の役に立つ新材料を発見したいとの思いで、日々元素を混ぜては、条件を変えて日夜実験を行う。

そうして何年もかけて、ひとつの大切な試料が誕生した。測定してみると、今まで自分が作ってきたどの試料よりも特性が良い。他の誰かが作った試料の中には、もっと良い特性のものもあるだろう。それでも、こうして作れば特性は良くなるという自分だけのレシピは、報告しなければならない。

そうして大切な試料の実験データは、論文となって後世に伝えられた。

そんな無数の研究者たちの足跡が、論文データベース上の数十万本の論文に刻まれている。各国の国民から集められた、少なくない研究費で支えられてきた、大切な研究だ。ひとつひとつがキラキラ輝く星のような大切なデータだ。

そういう大切なデータの存在を、現代の私達は無視している。新しくやって来た研究者が、再びお金をかけて同じような研究を行って、同じような失敗を繰り返している。そしてどうしたらうまくいくんだろうと、途方に暮れたりしている。

でも夜空をちゃんと見上げれば、たくさんの星が輝いていて、行くべき道を示してくれている。過去の研究者が集めたデータを受け取って、世界の研究者やAIと力を合わせたら、今までわからなかったことがわかるはずだ。

そんな思いで始まったのが、私達のStarrydataプロジェクトである。

論文中のグラフ画像から手作業で実験データを抽出

「論文なんて誰も読みたくないからさ、AIで自動化した方がいいんじゃない?」

論文からのデータ収集プロジェクトを始めて、私が聞くようになった悲しい言葉だ。何も手作業で集めなくても、何万本もの論文を一括ダウンロードして、最新のAIプログラムで一括解析してデータを集めればいいのではないか。手作業で行おうとするあなたは効率が悪くて良くない、というご意見である。

自動プログラムによる一括データ収集が、どれほど冷たいものなのかわかっていないのだろうか?

専門知識なんて使わない。少数の教師データを参考に「なんとなくそれっぽければ」データを取ってしまう。どんな組成のどんな試料かも読もうとしない。勉強の嫌いな高校生が問題文をパッと見て、雰囲気だけで適当に数字を組み合わせながら解答するような失礼な態度だ。

その研究者がそのデータを得るために、どれだけの時間をかけて、どれだけ検証して、どれだけ頑張って論文を書いたのかなんて、全く見てあげようとしていない。

そうして生まれるのは、ただばらついているだけの、個性を奪われたデータの集合だ。それをAIと呼ばれるものに入れて、何かを予想させたことにして、すごいことをやっているんだと偉そうにアピールしたって、教えてあげていない情報はわかるはずがない。中身のない見せかけの研究だ。

そんなことをして何になるの?ちゃんと読んで、ちゃんと過去の研究者の声を拾ってあげようよ。過去のデータをつなぎ合わせて、本気で答えを出してみようよ。過去の膨大な実験データと、物理や化学の専門知識、最新のAIの能力もちゃんと使ってさ。

そこに宝物が眠ってるはずだから。

Starrydataチームが目指すもの

Starrydataは、そうして実験データを集める研究者、開発者とデータ収集者のチームだ。国の研究費と、企業との共同研究費、寄付金などによって支えられた、草の根のデータ収集活動である。

データ収集者たちのバックグラウンドはいろいろだ。それでもデータは人の手で集める。専門分野は違っても、ちゃんと論文を読んで、わかる範囲で丁寧にデータを記していく。その作業を毎日コツコツと続けていく。

そして幸いなことに、手作業によるデータ収集は十分に速かった。

世界の研究者が「論文から自動でデータを抽出するプログラム」を開発しようと試行錯誤している間に、4年間コツコツとデータを集め続けた。独自のWebシステムを作ってデータ収集者の作業をアシストした。そうして数千本の論文に掲載された数万枚のグラフから、数万個の試料の数百万点のデータ点を取り出すことができた。

それを1枚のグラフにして見せると、世界の研究者たちが驚いた。こんなデータは初めて見た、自分たちには真似できないと。ぜひ自分たちの研究に使わせてほしいと。

日本の片隅の小さな小さなチームだけど、世界最大のデータベースを作ることができた。誰も真似できないデータセットを作ることができた。

そしてその膨大なデータは、誰でも利用できるようにまとめてWebにアップして、引用するだけで誰でも無償で使えるようにしている。

過去の研究者たちの思いを受け取って、大切に使って正しい答えを導いてくれる世界の誰かに届くように。

人類の役に立つ新たな材料を見つけるための、宝の地図を作れる誰かに届くように。


この記事が気に入ったらサポートをしてみませんか?