データ可視化コンテンツのソースコードをGitHubで公開する理由

「なぜ東洋経済オンラインではデータ可視化コンテンツのソースコードをGitHubで公開するのか?」という質問を最近よく受けます。

ざっくり説明すると、GitHubとはウェブサイトやソフトウェアなどのプログラム(=ソースコード)を公開できるウェブサービスのことです。修正履歴の公開や、他のユーザーからの改修提案なども受け付けることができます。社会で広く使ってほしい、公共性のあるプロジェクトに使われることが多いと思います。

東洋経済オンラインでは、COVID-19のダッシュボード「新型コロナウイルス 国内感染の状況」のデータやソースコードをGitHubで公開しています。データもコードも「許諾不要で自由に使っていい、ただし出典表記は必要」としています。それ以前に作ったプロジェクトも、私(荻原)が作ったものであればほぼすべて公開しています。

他に新型コロナ関連では、東京都の新型コロナウイルス対策サイト厚生労働省の濃厚接触確認アプリ(COCOA)もGitHubで公開されています。

海外では米国New York Timesや英国Guardianなど、報道コンテンツやデータをGitHubで公開しているケースが少なくありませんが、日本で同様の試みをしているメディアは今のところ存在しないようです。そこで今回はGitHubでの公開にあたって考えていたことを書きます。

オープン性は個人開発者が大手メディアと戦える数少ない要素

東洋経済オンラインでは、基本的に私(荻原)がひとりでデータ可視化コンテンツの企画、プログラムからデザイン、記事執筆までを行っています。それに対して、日経新聞やNHKなど、早くからデータ可視化に取り組んでいた大手メディアではエンジニアやデザイナーの人材も豊富で、1つのコンテンツに5〜6人がクレジットされていることもあります。うらやましい。

彼我のマンパワーが圧倒的に違う状況で「持たざる者の戦略」を取るしかなかった、というのが理由の1つ目です。最初はマネタイズを度外視してフルオープンにする。それにより、学術論文でいうところの被引用回数を上げることで存在感を高める、というのが最初に考えたことでした。

コンテンツの速報性や技術は、やはりリソースがモノを言う分野であるため勝ち目がありませんが、オープン化なら1人でもできます。どのみちデータ可視化コンテンツは有料提供しているものではなく、自分ひとりで作っているので同僚に迷惑もかけない。失うものは特にないので、まず認知度を高めることを狙いました。

これが奏功して、今回の特設サイトは新型コロナウイルスに関連する日本語の報道で最もシェアされたコンテンツとなりました。ちなみに、政府のサイトなども含めたあらゆるウェブコンテンツの中では第2位です。

データソースや修正履歴を明示したほうが信頼される

一般的なメディアの書き方だと、データソースは「厚生労働省などから東洋経済がまとめた」といった表記になると思います。センシティブな取材において取材源を秘匿するのは必要不可欠ですが、公開データならどこから取得したか・どう加工したかを詳細にするほうが信頼されるのでは、と考えました。特に今回のコロナ禍のように、情報の信頼性が問題となる状況ではなおさらです。これが2つ目。

個人的にも、誠実なデータ可視化を作るときに「データソースにどれだけ簡便にアクセスできるか」は大事にしています。

今回のCOVID-19特設サイトでは、プロダクトそのものの評価に加え、データやソースコードをオープンにしていることもかなり寄与したように思います。

「マスコミは信用していないけど、このサイトは厚生労働省のデータを使っているから信用できる」という投稿もどこかで見ました。もちろん東洋経済を信用してくれるに越したことはありませんが、まあ結果オーライということで……。

ただし、GitHubやOSSが普及していない現段階では、たとえCommitログに丁寧に理由を書いた上で修正を行っても「サイトが改竄された」という批判は来ます。これはソフトウェア開発の手法で作る報道コンテンツがもっと一般に普及するまでの課題かなと思います。

データジャーナリズムが発展してくれないと自分が食いっぱぐれる

私は色々あってデータ可視化やデータジャーナリズムと呼ばれる分野で仕事をしています。前述したようにすべての工程をひとりで行っており、よく言えばデータジャーナリズムに特化したスキルセットを持っていますが、裏を返せば他の職種につぶしが効きません。ゲームで言うとステ全振りというやつです。

他方、データ可視化やデータジャーナリズムは日本ではまだまだ発展途上、というより芽が育ち初めたくらいの段階にあります。つまり、この業界が盛り上がってくれないと私は食い扶持に困るのです。もしこのまま業界が育つことなく枯れてしまったら、私は何とも中途半端なスキルを抱えて社内転職活動をしなければならない。

発展する業界へ最初に飛び込む人をファーストペンギンと呼ぶことがありますが、2匹目以降が出るからこそ「ファースト」たりえるのであって、後続が誰も出なかったら単に頭の足りないペンギンになってしまう。それは本当に困る。

業界が盛り上がるには、ひとえに新規参入がどんどん出ることが重要です。新規参入を増やすには、データやナレッジの共有を積極的に行う必要がある。というわけで、私は東洋経済オンラインに限らず自分の作品はできるだけGitHubで公開しています。

このnoteもナレッジ共有の一環です。また、お声がけいただいた講義や登壇、他のメディアからの協業依頼、あるいはインフォグラフィックやデータ可視化の制作依頼も都合がつけば引き受けるようにしているので、興味のある方はTwitterのDM、Facebook、あるいは会社に問い合わせをしていただければと思います。


この記事が気に入ったらサポートをしてみませんか?