荻原 和樹 / Kazuki OGIWARA

データ可視化とデータ報道の仕事をしています。Google News Lab ← スマー…

荻原 和樹 / Kazuki OGIWARA

データ可視化とデータ報道の仕事をしています。Google News Lab ← スマートニュース メディア研究所 ← 東洋経済新報社。データ報道コンテンツの制作でグッドデザイン賞など受賞。著書に『データ思考入門』(講談社現代新書)など。

最近の記事

  • 固定された記事

スマートニュースを退職してGoogleに移ります

スマートニュースを退職して、10月からGoogle News LabのTeaching Fellowとして仕事をします。ここでは自己紹介を兼ねてスマートニュースでの仕事を振り返りつつ、今後の仕事について書きます。 自己紹介データ可視化やデータ報道の分野で仕事をしています。新卒で東洋経済新報社に入り、最初はデータベースの開発などをしていました。その後イギリスの大学院でデジタルデザインを勉強し、帰国してからは編集部でデータ可視化を活用した報道コンテンツの制作をしました。夏の気温

    • Google PinpointでスキャンPDFの文章を読み込む

      PDFは文書を扱う際によく使われるファイル形式ですが、現実には印刷された文書をスキャンした「画像」としてPDFを扱うことも少なくありません。FAX、郵送、またはメールに添付されたPDFが何故か画像だったり……。こうしたPDFは「画像」として扱われるため文字や数字をコピーすることはできません。便宜上ここではスキャンPDFと呼びます。 スキャンPDFの読み込みに便利なGoogle Pinpointというツールがあります。一言で表現すれば大量のドキュメントを探索・分析するためのツ

      • 「エモい記事」批判とジャーナリズムの意義

        このところ報道メディア関連のタイムラインで「エモい記事は是か否か」的な議論?が起こっている。 たとえばこちらの論考。 この論考では「実例を挙げるのははばかられるので控える」としつつ「データや根拠を前面に出すことなく、なにかを明確に批判するのでも賛同するわけでもない、(中略)ナラティブ重視の記事」を「エモい記事」と定義し、「すこぶるタチが悪い」と批判している。 Twitter(現X)での反応を見る限り、他の業界関係者(と見られるアカウント)もおおむね「エモい記事」には批判

        • 現代的データ報道の最大の特徴と、それを取り巻くさらに大きな流れ

          現代のデータ報道が普及した要因や、Immersive Contents / Visual Investigationといった似た概念との関連をX(Twitter)に連投しました。ここでは改めて流れを整理して書いています。 そもそも、データ報道はPCやスマートフォンが普及する前から存在していました。世界で最初の事例を断定するのは難しいですが、一般的には1821年に英国マンチェスター・ガーディアン(現在のガーディアン)が掲載した子どもの貧困に関する記事だとされています。 同様

        • 固定された記事

        スマートニュースを退職してGoogleに移ります

          Flourishでヒートマップを作る方法

          ヒートマップ(Heatmap)とは ヒートマップ(Heatmap)とは、データの値を色の濃淡や異なる色で表現するデータ可視化手法の一種です。地図上に人口密度を色で重ねたり、ウェブサイトでよくクリックされている領域を色で示すものがよく使われます。 より汎用的なデータの可視化手法として、画面上を二次元(縦と横)のセルに分け、各セルを塗り分けることによって縦×横×色(値)と三次元のデータを表現することができます。今回は例として、夏の気温のヒートマップの作り方を解説します。 元

          Flourishでヒートマップを作る方法

          Flourishでバーチャート・レースを作る方法

          バーチャート・レース(Bar chart race)とは バーチャート・レースとはデータの変化を時間経過とともに動的に示すデータ可視化(Data visualization)手法のひとつです。棒グラフが一定の時間ごとに更新され、バーの長さが変化するとともにランキングが上下します。 通常、棒グラフでランキングの結果を単年度のみ示すことができますが、アニメーションにすることで時系列の変化を表現することが可能です。 なおFlourishの基本的な使い方は以下の記事で解説してい

          Flourishでバーチャート・レースを作る方法

          Flourishの基本的な使い方:棒グラフを作る

          Flourishとは Flourishとは、インタラクティブな=ボタンやスイッチで動くデータ可視化(Data visualization)を作るためのツールです。作成したプロジェクトは個別のURLを発行して公開でき、ウェブサイトへの埋め込みも可能です。ソフトウェアのダウンロードは必要なく、ウェブブラウザ(Google Chromeなど)で動作します。 データ可視化を作るツールは複数ありますが、日本ではメディアの記者・編集者が自分でビジュアルを作成する際に使われることが多い

          Flourishの基本的な使い方:棒グラフを作る

          順序で配色を分けてみる - データ可視化ミニ講座(9)

          地図やグラフなど、データを可視化する際は数値の大小を色に変換することが頻繁に行われます。一見して数値の大小が視覚的にわかりやすくなり、地図ならば地理的な傾向もわかるため、よく使われるテクニックのひとつです。 ただ「数値の大小を色に変換」といっても、その方法はひとつではありません。一般的によく使われるのは、最小値と最大値から計算して均等に色を分ける方法です。たとえば10刻みに10・20・30・40・……・90という9つの値からなるデータを色分けしたいとします。最小値は10、最

          順序で配色を分けてみる - データ可視化ミニ講座(9)

          移動平均を使ってデータの傾向を見やすくする - データ可視化ミニ講座(8)

          ランダムな変動や周期的な傾向があるデータの場合、実数だけでなく移動平均を同時に可視化することによってデータの中長期的な傾向を見やすくすることができます。 移動平均とは、時系列データにおいて一定期間におけるデータを平均し、時点が動くごとに古い時点を外して新しい時点を含めて、……という計算を繰り返し、数値の変動を平滑化するものです(厳密に言うと時系列でなくとも使われる場合があります)。 言葉だとわかりにくいので具体例を出します。たとえば、新型コロナの感染者数(検査陽性者数)は

          移動平均を使ってデータの傾向を見やすくする - データ可視化ミニ講座(8)

          気温には棒グラフを使わない - データ可視化ミニ講座(7)

          棒グラフと折れ線グラフは似た表現方法です。しばしば交換可能なものとして使われる両者ですが、使うべきポイントには違いもあります。 代表的な例が気温です。気温は棒グラフではなく、折れ線グラフで表現するのが正しいです。 そもそも棒グラフは、棒の長さ(≒ 棒部分の面積)の比率と数値の比率を対応させることで視覚的に数値を比較するものです。したがって、数値が2倍なら棒グラフの長さも2倍になります。棒グラフにおいて、縦軸を省略してはいけないのはそのためです。 しかし、気温において「X

          気温には棒グラフを使わない - データ可視化ミニ講座(7)

          データ可視化・データ報道の最新情報を入手する方法

          先月末の報道実務家フォーラムにて登壇した際、「データ可視化やデータ報道に関する情報収集はどうしているか」という質問がありました。その場でもお答えしましたが、改めて考えると色々や手段があるなと思ったので目的や形態別に分けて整理したいと思います。 Data Visualization Society 会場でも答えたのがData Visualization Societyというデータ可視化のコミュニティです。非営利団体が運営しており、Slack channelや各種の調査などを

          データ可視化・データ報道の最新情報を入手する方法

          表の数字は等幅フォントになっているか - データ可視化ミニ講座(6)

          データを表形式で表すときは、数字のフォントがモノスペース(等幅)になっているか確認するとよいでしょう。 モノスペースとは、数字や英字の幅が文字によらず一定である種類のフォントを指します。たとえば細長い「1」でも比較的幅の広い「8」でも同じ字幅となるのがモノスペースフォントです。表の数字をモノスペースで表すことによって、上下の行と桁数を比較するときに「桁数」と「見た目の幅」が視覚的に一致します。 逆に、文字によって幅が異なるフォントをプロポーショナルフォントといいます。可変

          表の数字は等幅フォントになっているか - データ可視化ミニ講座(6)

          「その他」要素は最後に配置する - データ可視化ミニ講座(5)

          円グラフや棒グラフなどで「その他」要素を表示しなければいけないケースがあります。たとえばある業界の市場シェアをグラフに表すとき、シェア20%や10%のトップ数社は問題なくグラフに表示できるでしょうが、シェアの少ない会社は小さすぎてグラフにすると見づらくなります。シェアの小さな会社を表示したいのであれば別ですが、通常そのような会社は「その他」としてまとめて表示します。 円グラフでを使う場合、「その他」は省略してはいけません。円グラフは円の1周=100%となる場合がほとんどであ

          「その他」要素は最後に配置する - データ可視化ミニ講座(5)

          必要のない色分けをしない - データ可視化ミニ講座(4)

          時系列でないグラフ、たとえば国別の人口やレストラン店舗の売り上げなどを棒グラフに表すときには、ついつい色を分けたくなります。その方がカラフルで見栄えがよいし、棒グラフを見分けるのにも役立ちそうな気がする……のですが、実際には棒グラフは色分けしなくても十分に識別可能です。 むしろ必要のない色分けを行うと目がチカチカしてかえって見づらかったり、「過剰な装飾」と思われることがあります。以下の例では国別の棒グラフを色分けしていますが、別に色分けをしなくても国の見分けはつきます。単色

          必要のない色分けをしない - データ可視化ミニ講座(4)

          数字や文字を縦向きに揃える - データ可視化ミニ講座(3)

          一部のグラフ作成ソフトでは、軸の数値や項目の名前といった数字・文字の向きが自動で横に倒れたり斜めになるときがあります。 数字や文字が斜めや横向きになっていると視認性が下がり、読みづらくなります。慣れてないと誤読の可能性も高まります。せっかく視覚的にわかりやすいグラフを作っているのに、これでは本末転倒です。 このような場合、数字や文字を縦向きに直します。英語は横向きにしかできないので限界がありますが、日本語は横書きも縦書きもできる便利な言語ですので、最大限に活用しましょう。

          数字や文字を縦向きに揃える - データ可視化ミニ講座(3)

          円グラフの要素に順序がある場合 - データ可視化ミニ講座(2)

          割合を表現するときには円グラフが使われます。円グラフでは割合の最も大きな要素から反時計回りに表示するのが通常です。 しかし、表示したい各要素(以下の例では調査への各回答)そのものに順序や高低がある場合、かつその順序が必ずしも数値の大小と合わない場合、「数値の大きな順」「要素の順」どちらに沿って並べても混乱を招きます。 このような場合、円グラフではなく棒グラフにすることで各回答の順序を表現しつつ、要素の差も簡単に比較することができます。また棒グラフであれば、各回答を色で分け

          円グラフの要素に順序がある場合 - データ可視化ミニ講座(2)