見出し画像

”データを自在に可視化する極意”を、『データ可視化の基本が全部わかる本』著者の矢崎裕一さんに学ぶ: 「データビジュアライゼーション講習」レポート

こんにちは!MIERUNEのソフトウェア・エンジニア、久本(@sorami)です。11月も近づき、北海道の私が住んでいるところでは最低気温が氷点下になり始めました。そろそろ本格的な冬ですね ❄️

MIERUNE(ミエルネ) は、オープンソースのコミュニティから2016年に生まれた、位置情報に特化したエンジニア集団です。北海道の札幌に本社があり、全国各地のフルリモートメンバーをあわせて計32名が在籍しています。

そんなMIERUNEでは、メンバーのスキルアップを支援するために、会社がイベントや研修への参加費用を負担する制度を設けています。

今回その制度を使って、「データ可視化」に関するオンライン講習を受講しました。その様子をレポートします!

受講したのは、先日『データ可視化の基本が全部わかる本』(翔泳社, 2024)という本を上梓された矢崎裕一さん(@yuichy02)による講座です:


可視化と私

データ可視化とは、一言でいうと「データに基づく知的活動や説得を支援するための技術と方法論」です。

データ可視化の基本が全部わかる本』(翔泳社, 2024), p.2

本題の前に、今回の演習と関わるに至った、私の来歴についてお話しさせてください。

もともと私は、コンピューターで人間のことばを扱う”自然言語処理”という分野が専門でした。しかし、より抽象的には「思考のための道具」というものに関心を抱いていました。その流れで、「言語表現」にとどまらず「可視化表現」にも興味を持ち、趣味として個人的に取り組んでいました。

そんな折に日本でのデータ可視化の第一人者である矢崎裕一さんがオンラインコミュニティを立ち上げられると知り、参加してみました。そこで偶然、MIERUNEの方と出会い、そのご縁をもとに入社して今に至ります。きっかけをいただいた矢崎さんに感謝しております🙏 その顛末は、先日の「MIERUNE JCT - Tokyo 2024」というイベントでもお話ししました:

また昨年には、矢崎さんが長年開催されている Data Visualization Japan Meetup というイベントにもお招きいただき、トークさせていただきました:

『データ可視化の基本が全部わかる本』

さてそんな矢崎さんが今年(2024)、『データ可視化の基本が全部わかる本』という一冊を出版されました:

「執筆までに10年かかった」というご本人の言葉通りの力作であり、表層的な制作方法やツールの使い方にとどまらず、データ可視化のモチベーションや理論を丁寧に整理・解説している点が、非常に貴重で有益だと感じます。

『データ可視化の基本が全部わかる本』書影

余談ですが、本書の帯に推薦文を寄せられている樫田光氏は、私の元上司です。当時、私たちはデータ分析に取り組んでおり、「可視化」そのものがメインではありませんでしたが、年月を経てこのような想像しなかった形で再びご縁があることに驚きと感慨を覚えます。樫田氏は現在、デジタル庁のCAO(Chief Analytics Officer; 最高分析責任者)としてご活躍されています:

データビジュアライゼーション講習「データを自在に可視化する極意」

さて、その大著を出版された矢崎さんが、講習を開催されているのを見かけたので、先に述べたような流れもあり、この機会にぜひ受講してみようと思いました:

データを自在に可視化する極意 – データビジュアライゼーション講習

講習は丸1日かけてオンラインで開催され、300ページにおよぶ講義資料をもとに進められました。その資料や講義の録画データも後日共有され、大変充実した内容でした。

書籍の紹介でも触れましたが、この講習ではチャートの成り立ちそのものが解説されており、小手先のテクニックではなく本質的な理解を深められる内容です。そのため、個別のツールに依存せず、より汎用性の高い知識をもとにデータ可視化へ取り組めるようになると感じました。

さらに、矢崎さんが長年にわたり蓄積してきた数多くの事例をふんだんに紹介しながら解説していただけたことも、理解を深める助けになりました。また、「この二つは同じチャート?別なチャート?」というクイズ形式のパートも楽しいものでした。

ちなみに今回の講習は、私ひとりのみの参加で、矢崎さんと1対1で丸一日を過ごせるという非常に贅沢な機会でした。私の理解度や関心に合わせて、講義内容を柔軟に調整していただきました。

講習の最終セクションは「Flourish」や「RawGraph」、「Colab」といったツールを使うハンズオンが予定されていましたが、1対1という特別な機会だったため、矢崎さんから「どのように進めたいですか?」とご提案いただきました。そこでハンズオンはスキップし、講義と質疑応答をさらに深める形で進めていただきました。理論や技術にとどまらず、社会におけるデータ可視化の受容や業界動向といった、より踏み込んだお話を伺うことができ、大変刺激的で学びの多い時間となりました。

『The Grammar of Graphics』

書籍でいう第4章「チャートの文法」(p.62-)の内容が、講習でも詳細に解説されました。「ビジュアル変換」「スペース変換」「ノンデータグラフィック」の3レイヤー、およびスケールという4つの要素で構成されているという考え方です:

チャートの文法を構成する3つのレイヤーと4つの要素(講習資料より引用)
データ変数のスケールとビジュアル・スペース変換の例(講習資料より引用)

これは、Leland Wilkinson の著書『The Grammar of Graphics』(初版1999年、第二版2005年)で提唱された考え方をシンプルにしたものです。この理論は、R言語の ggplot2 や Pythonの Vega-Altair といったライブラリの基礎にもなっています。

ただ見た目だけでチャートを作成するのではなく、理論を体得することで、データや目的に合わせて独自のチャート形式を発案できるようになるでしょう。

とはいえ、この書籍は私も未読なのですが、非常に難解だと評されています。そのため、この理論を多くの人々に届きやすい形でシンプルに解説していただけることは大変有益だと思いました。

グラフを描くという事について深い理解を与えてくれる。 グラフを描く人はたぶん学ぶべき本なんだろうな、とは思える。 本来はすべての大学の一年生が学ぶべき内容に思う。 コンピュータリテラシ的な授業で。

一方でこの不要な学びにくさがあまりにも酷いので、大学一年生に勧める気は全く起こらない。 集合論の訓練を積んだ経験が無いと読むのは辛いだろうし、 またdataframeとかSQLをある程度触った経験が無いと必要な想像が出来ず読み解け無いと思う。 これらの条件を満たす大学一年生は居ないだろうし、 平均的なプロフェッショナルのプログラマもたぶんこの条件は満たしていないだろう。 少なくとも自分は2回挫折した訳で。

という事で、この本は「読んだ方が良い人々」と「読み解く事が出来る人々」の間にものすごいギャップがある。 ただ「グラフを描く、人の描いたグラフを見る」という機会の多さを思うと、 人生のどこかで時間をかけてこの本を理解しておく意義はあるのでは無いか、と思った。

The Grammar of Graphics を読み終わっての感想 - なーんだ、ただの水たまりじゃないか

コミュニケーションとしてのデータ可視化: 課題探索と表現伝達

それらチャートの文法といった内容に加えて、「データを可視化する理由」という話題も講習では大きく取り上げられいました。技法だけでなく、そのモチベーションを考えることは非常に重要でしょう。

矢崎さんは、「視覚優位な特性と外的表象の力を活かすため」と述べ、データ可視化を「コミュニケーションとして捉える」視点を示されます。これを踏まえると、次の二つの種類が浮かび上がってきます:

  • 知的活動の支援 → 課題探索(Explore)

  • ストーリーを伝達し説得 → 表現伝達(Explain)

それぞれにおいて求められる表現方法は異なるでしょう。

ちなみにこの「Explore Explain」という言い方は、『データビジュアライゼーション ―データ駆動型デザインガイド』を執筆した Andy Kirk のポッドキャストのタイトルにもなっていて、その類似も興味深いと個人的に感じました:

この記事ではここまでの内容に留めますが、興味を持たれた方はぜひ書籍を手に取ったり、講習に参加してみてください。

おわりに

可視化に関心のある私にとって、非常に満足したとても楽しく学びのある時間でした。

「資料作成などで使えるテクニックをすぐ知りたい!」という方には、少しまどろっこしく感じる内容かもしれません。

しかし、チャートやグラフの制作は、計算のようになにか明示的なエラーが出るわけではないため、見た目がそれっぽく整っていても、意図せずミスリードを生むものとなるリスクがあります。

だからこそ、このように本質を理解することは、一見遠回りに見えても、正確で意味のある表現を行うためには欠かせないプロセスでしょう。

また、その原理を掴むことで、テンプレにはまらない独自の新たな表現を生み出すことができるようになっていくと思います。

まずは書籍を手に取ってみて、その世界の雰囲気を感じてみてはいかがでしょうか。

なお、今回の講習以外にも、いくつかの異なるテーマや期間のものが用意されているようです:

このような機会を通じて、日本でもデータ可視化の界隈がさらに盛り上がっていくとよいなと思います!🥳

いいなと思ったら応援しよう!