荻原 和樹 / Kazuki OGIWARA

データ可視化とデータ報道の仕事をしています。Google News Lab ← スマー…

荻原 和樹 / Kazuki OGIWARA

データ可視化とデータ報道の仕事をしています。Google News Lab ← スマートニュース メディア研究所 ← 東洋経済新報社。データ報道コンテンツの制作でグッドデザイン賞など受賞。著書に『データ思考入門』(講談社現代新書)など。

記事一覧

固定された記事

スマートニュースを退職してGoogleに移ります

スマートニュースを退職して、10月からGoogle News LabのTeaching Fellowとして仕事をします。ここでは自己紹介を兼ねてスマートニュースでの仕事を振り返りつつ、今後の仕…

Google PinpointでスキャンPDFの「表」をCSVに変換する

前回の記事ではGoogle Pinpointを使ってスキャンPDFの文章を読み込み、単語や日付で絞り込む方法を解説しました。 Google Pinpointでは文章だけでなく、表や箇条書きなど…

Google PinpointでスキャンPDFの文章を読み込む

PDFは文書を扱う際によく使われるファイル形式ですが、現実には印刷された文書をスキャンした「画像」としてPDFを扱うことも少なくありません。FAX、郵送、またはメールに…

「エモい記事」批判とジャーナリズムの意義

このところ報道メディア関連のタイムラインで「エモい記事は是か否か」的な議論?が起こっている。 たとえばこちらの論考。 この論考では「実例を挙げるのははばかられる…

現代的データ報道の最大の特徴と、それを取り巻くさらに大きな流れ

現代のデータ報道が普及した要因や、Immersive Contents / Visual Investigationといった似た概念との関連をX(Twitter)に連投しました。ここでは改めて流れを整理して書…

Flourishでヒートマップを作る方法

ヒートマップ(Heatmap)とは ヒートマップ(Heatmap)とは、データの値を色の濃淡や異なる色で表現するデータ可視化手法の一種です。地図上に人口密度を色で重ねたり、ウ…

Flourishでバーチャート・レースを作る方法

バーチャート・レース(Bar chart race)とは バーチャート・レースとはデータの変化を時間経過とともに動的に示すデータ可視化(Data visualization)手法のひとつです。…

Flourishの基本的な使い方:棒グラフを作る

Flourishとは Flourishとは、インタラクティブな=ボタンやスイッチで動くデータ可視化(Data visualization)を作るためのツールです。作成したプロジェクトは個別のURL…

順序で配色を分けてみる - データ可視化ミニ講座(9)

地図やグラフなど、データを可視化する際は数値の大小を色に変換することが頻繁に行われます。一見して数値の大小が視覚的にわかりやすくなり、地図ならば地理的な傾向もわ…

移動平均を使ってデータの傾向を見やすくする - データ可視化ミニ講座(8)

ランダムな変動や周期的な傾向があるデータの場合、実数だけでなく移動平均を同時に可視化することによってデータの中長期的な傾向を見やすくすることができます。 移動平…

気温には棒グラフを使わない - データ可視化ミニ講座(7)

棒グラフと折れ線グラフは似た表現方法です。しばしば交換可能なものとして使われる両者ですが、使うべきポイントには違いもあります。 代表的な例が気温です。気温は棒グ…

データ可視化・データ報道の最新情報を入手する方法

先月末の報道実務家フォーラムにて登壇した際、「データ可視化やデータ報道に関する情報収集はどうしているか」という質問がありました。その場でもお答えしましたが、改め…

表の数字は等幅フォントになっているか - データ可視化ミニ講座(6)

データを表形式で表すときは、数字のフォントがモノスペース(等幅)になっているか確認するとよいでしょう。 モノスペースとは、数字や英字の幅が文字によらず一定である…

「その他」要素は最後に配置する - データ可視化ミニ講座(5)

円グラフや棒グラフなどで「その他」要素を表示しなければいけないケースがあります。たとえばある業界の市場シェアをグラフに表すとき、シェア20%や10%のトップ数社は問…

必要のない色分けをしない - データ可視化ミニ講座(4)

時系列でないグラフ、たとえば国別の人口やレストラン店舗の売り上げなどを棒グラフに表すときには、ついつい色を分けたくなります。その方がカラフルで見栄えがよいし、棒…

数字や文字を縦向きに揃える - データ可視化ミニ講座(3)

一部のグラフ作成ソフトでは、軸の数値や項目の名前といった数字・文字の向きが自動で横に倒れたり斜めになるときがあります。 数字や文字が斜めや横向きになっていると視…

スマートニュースを退職してGoogleに移ります

スマートニュースを退職してGoogleに移ります

スマートニュースを退職して、10月からGoogle News LabのTeaching Fellowとして仕事をします。ここでは自己紹介を兼ねてスマートニュースでの仕事を振り返りつつ、今後の仕事について書きます。

自己紹介データ可視化やデータ報道の分野で仕事をしています。新卒で東洋経済新報社に入り、最初はデータベースの開発などをしていました。その後イギリスの大学院でデジタルデザインを勉強し、帰国

もっとみる
Google PinpointでスキャンPDFの「表」をCSVに変換する

Google PinpointでスキャンPDFの「表」をCSVに変換する

前回の記事ではGoogle Pinpointを使ってスキャンPDFの文章を読み込み、単語や日付で絞り込む方法を解説しました。

Google Pinpointでは文章だけでなく、表や箇条書きなど何らかの構造を持つ文書を表形式で取得する「構造化データの抽出(Extract Structured Data)」と呼ばれる機能があります。この記事では、前回と同じく日本銀行のスキャンPDF資料から表をCSV

もっとみる
Google PinpointでスキャンPDFの文章を読み込む

Google PinpointでスキャンPDFの文章を読み込む

PDFは文書を扱う際によく使われるファイル形式ですが、現実には印刷された文書をスキャンした「画像」としてPDFを扱うことも少なくありません。FAX、郵送、またはメールに添付されたPDFが何故か画像だったり……。こうしたPDFは「画像」として扱われるため文字や数字をコピーすることはできません。便宜上ここではスキャンPDFと呼びます。

スキャンPDFの読み込みに便利なGoogle Pinpointと

もっとみる
「エモい記事」批判とジャーナリズムの意義

「エモい記事」批判とジャーナリズムの意義

このところ報道メディア関連のタイムラインで「エモい記事は是か否か」的な議論?が起こっている。

たとえばこちらの論考。

この論考では「実例を挙げるのははばかられるので控える」としつつ「データや根拠を前面に出すことなく、なにかを明確に批判するのでも賛同するわけでもない、(中略)ナラティブ重視の記事」を「エモい記事」と定義し、「すこぶるタチが悪い」と批判している。

Twitter(現X)での反応を

もっとみる
現代的データ報道の最大の特徴と、それを取り巻くさらに大きな流れ

現代的データ報道の最大の特徴と、それを取り巻くさらに大きな流れ

現代のデータ報道が普及した要因や、Immersive Contents / Visual Investigationといった似た概念との関連をX(Twitter)に連投しました。ここでは改めて流れを整理して書いています。

そもそも、データ報道はPCやスマートフォンが普及する前から存在していました。世界で最初の事例を断定するのは難しいですが、一般的には1821年に英国マンチェスター・ガーディアン(

もっとみる
Flourishでヒートマップを作る方法

Flourishでヒートマップを作る方法

ヒートマップ(Heatmap)とは

ヒートマップ(Heatmap)とは、データの値を色の濃淡や異なる色で表現するデータ可視化手法の一種です。地図上に人口密度を色で重ねたり、ウェブサイトでよくクリックされている領域を色で示すものがよく使われます。

より汎用的なデータの可視化手法として、画面上を二次元(縦と横)のセルに分け、各セルを塗り分けることによって縦×横×色(値)と三次元のデータを表現するこ

もっとみる
Flourishでバーチャート・レースを作る方法

Flourishでバーチャート・レースを作る方法

バーチャート・レース(Bar chart race)とは

バーチャート・レースとはデータの変化を時間経過とともに動的に示すデータ可視化(Data visualization)手法のひとつです。棒グラフが一定の時間ごとに更新され、バーの長さが変化するとともにランキングが上下します。

通常、棒グラフでランキングの結果を単年度のみ示すことができますが、アニメーションにすることで時系列の変化を表現する

もっとみる
Flourishの基本的な使い方:棒グラフを作る

Flourishの基本的な使い方:棒グラフを作る

Flourishとは

Flourishとは、インタラクティブな=ボタンやスイッチで動くデータ可視化(Data visualization)を作るためのツールです。作成したプロジェクトは個別のURLを発行して公開でき、ウェブサイトへの埋め込みも可能です。ソフトウェアのダウンロードは必要なく、ウェブブラウザ(Google Chromeなど)で動作します。

データ可視化を作るツールは複数ありますが、

もっとみる
順序で配色を分けてみる - データ可視化ミニ講座(9)

順序で配色を分けてみる - データ可視化ミニ講座(9)

地図やグラフなど、データを可視化する際は数値の大小を色に変換することが頻繁に行われます。一見して数値の大小が視覚的にわかりやすくなり、地図ならば地理的な傾向もわかるため、よく使われるテクニックのひとつです。

ただ「数値の大小を色に変換」といっても、その方法はひとつではありません。一般的によく使われるのは、最小値と最大値から計算して均等に色を分ける方法です。たとえば10刻みに10・20・30・40

もっとみる
移動平均を使ってデータの傾向を見やすくする - データ可視化ミニ講座(8)

移動平均を使ってデータの傾向を見やすくする - データ可視化ミニ講座(8)

ランダムな変動や周期的な傾向があるデータの場合、実数だけでなく移動平均を同時に可視化することによってデータの中長期的な傾向を見やすくすることができます。

移動平均とは、時系列データにおいて一定期間におけるデータを平均し、時点が動くごとに古い時点を外して新しい時点を含めて、……という計算を繰り返し、数値の変動を平滑化するものです(厳密に言うと時系列でなくとも使われる場合があります)。

言葉だとわ

もっとみる
気温には棒グラフを使わない - データ可視化ミニ講座(7)

気温には棒グラフを使わない - データ可視化ミニ講座(7)

棒グラフと折れ線グラフは似た表現方法です。しばしば交換可能なものとして使われる両者ですが、使うべきポイントには違いもあります。

代表的な例が気温です。気温は棒グラフではなく、折れ線グラフで表現するのが正しいです。

そもそも棒グラフは、棒の長さ(≒ 棒部分の面積)の比率と数値の比率を対応させることで視覚的に数値を比較するものです。したがって、数値が2倍なら棒グラフの長さも2倍になります。棒グラフ

もっとみる
データ可視化・データ報道の最新情報を入手する方法

データ可視化・データ報道の最新情報を入手する方法

先月末の報道実務家フォーラムにて登壇した際、「データ可視化やデータ報道に関する情報収集はどうしているか」という質問がありました。その場でもお答えしましたが、改めて考えると色々や手段があるなと思ったので目的や形態別に分けて整理したいと思います。

Data Visualization Society

会場でも答えたのがData Visualization Societyというデータ可視化のコミュニ

もっとみる
表の数字は等幅フォントになっているか - データ可視化ミニ講座(6)

表の数字は等幅フォントになっているか - データ可視化ミニ講座(6)

データを表形式で表すときは、数字のフォントがモノスペース(等幅)になっているか確認するとよいでしょう。

モノスペースとは、数字や英字の幅が文字によらず一定である種類のフォントを指します。たとえば細長い「1」でも比較的幅の広い「8」でも同じ字幅となるのがモノスペースフォントです。表の数字をモノスペースで表すことによって、上下の行と桁数を比較するときに「桁数」と「見た目の幅」が視覚的に一致します。

もっとみる
「その他」要素は最後に配置する - データ可視化ミニ講座(5)

「その他」要素は最後に配置する - データ可視化ミニ講座(5)

円グラフや棒グラフなどで「その他」要素を表示しなければいけないケースがあります。たとえばある業界の市場シェアをグラフに表すとき、シェア20%や10%のトップ数社は問題なくグラフに表示できるでしょうが、シェアの少ない会社は小さすぎてグラフにすると見づらくなります。シェアの小さな会社を表示したいのであれば別ですが、通常そのような会社は「その他」としてまとめて表示します。

円グラフでを使う場合、「その

もっとみる
必要のない色分けをしない - データ可視化ミニ講座(4)

必要のない色分けをしない - データ可視化ミニ講座(4)

時系列でないグラフ、たとえば国別の人口やレストラン店舗の売り上げなどを棒グラフに表すときには、ついつい色を分けたくなります。その方がカラフルで見栄えがよいし、棒グラフを見分けるのにも役立ちそうな気がする……のですが、実際には棒グラフは色分けしなくても十分に識別可能です。

むしろ必要のない色分けを行うと目がチカチカしてかえって見づらかったり、「過剰な装飾」と思われることがあります。以下の例では国別

もっとみる
数字や文字を縦向きに揃える - データ可視化ミニ講座(3)

数字や文字を縦向きに揃える - データ可視化ミニ講座(3)

一部のグラフ作成ソフトでは、軸の数値や項目の名前といった数字・文字の向きが自動で横に倒れたり斜めになるときがあります。

数字や文字が斜めや横向きになっていると視認性が下がり、読みづらくなります。慣れてないと誤読の可能性も高まります。せっかく視覚的にわかりやすいグラフを作っているのに、これでは本末転倒です。

このような場合、数字や文字を縦向きに直します。英語は横向きにしかできないので限界がありま

もっとみる