見出し画像

2024年版:データエンジニア向け推薦本リスト

世間ではデータエンジニアリングが流行しており、エンジニアからは人気が出て、企業からはその能力が求められています。
データエンジニアは、データの収集、蓄積、分析、活用に必要なデータ基盤を構築・運用する職種です。データエンジニアとして活躍するためには、非常に幅広い知識と能力が求められます。

  • データベース

  • プログラミング

  • システム開発

  • クラウドサービス

  • データ分析

  • etc…….

私は多少データエンジニアとして経験を積んできており、業務を行う上で読んで良かったと心から思える本があったのでこちらで紹介します。どなたかの一助になれば幸いです。

初級向け

データエンジニアリング

本ではありませんが、データエンジニアリングに必要な知識がスライドやPDFに綺麗にまとまっています。初めて学ぶ方には適しています。前半のデータエンジニアリングの箇所だけ参考にして下さい。(後半はAzure製品について記載されています)
注意点として、資料を手に入れるには名前等の個人情報を入力する必要があります

データマネジメント

データマネジメントに初めて関わる方におすすめです。DMBOKというデータマネジメントの体系本(後述します)がありますが、その体系本を噛み砕いて書いてくれています。データマネジメントがどんなものなのかを理解するのに良い本です。

中級向け

データ基盤の概要

こちらは業務をしていく中で具体的にどのように解決していくかが書かれており、タイトル通り実践的な書籍になっています。
データ基盤の構築・運用を自社だけで行う企業を対象とした実践的な入門書です。データ基盤の設計、データの収集・蓄積、データの処理・分析、データの可視化など、データ基盤を構築・運用する上で必要な知識とスキルを、豊富な図解と具体的な事例を用いてわかりやすく解説しています。

SQL

アナリストやエンジニアといった幅広い職種から人気の本です。やはりデータエンジニアはSQLを触る機会が多いと思いますので、この本の知識は必須です。パーティションやパフォーマンスは勿論、テーブル設計についても記載されています。

データエンジニアリング全体像を俯瞰

データエンジニアには必ず知っておいてほしい知識が詰まっている本です。データアーキテクチャの設計やETLパイプライン、データモデリングについての記載があります。この本の内容を理解できれば、データエンジニアリング業務で必要な単語や概念は一通り浚うことができるはず。

データマネジメントの実行方法

データマネジメント業務に携わることになった方にはオススメの1冊です。
データ活用を実務で推進する現場の担当者にとって、具体的な問題解決プロセスやデータマネジメント手法を学ぶ上で大変有益です。
施策策定や組織設計、ガイドライン策定といった実践的な知見が満載です。

テーマ別

技術の深掘りや理論習得をしたい方へ

データ処理システムの設計に関する書籍です。こちらは、大規模な分散型データシステムを設計するための原則とパターンを解説しています。
以下のような内容が書かれています。

  • データ処理システムの設計原則

  • データ処理システムのパターン

  • データ処理システムのアーキテクチャ

  • データ処理システムのケーススタディ

データ処理システムの設計に必要な知識とスキルを身につけることができる書籍です。データ処理システムの設計に携わるエンジニアや、データ処理システムに関する知識を深めたい人にとって必読の書籍です。「データエンジニアリングの基礎」を読み終えた人には刺さる内容だと思います。

また、IT国家資格のDBスペシャリストに出題されるような知識も習得できます。もし受験される方は、試験問題を解きながら何故その解答になるのかをこちらの本で確認することもできます。

データマネジメント業務遂行のバイブル

データマネジメント専門家やその領域を担当するデータエンジニアにとって、データマネジメントに関する知識を体系的に理解するための必読の書籍です。「データマネジメント 本」と検索すると上位に表示されるバイブルです。
データマネジメントの知識を体系的にまとめた書籍です。

読み進めていくには非常に労力と気力が必要になるくらい分厚い辞書のような本になります。ただし、さすがによくまとまっており、業務で困ったときに都度読み返す本になります。

補足

上記で紹介した本のようにデータエンジニア全員に読んでほしいとまでは言えませんが、一部の方には刺さる本を紹介します。

データモデリング

最近は様々なDWH・ETL製品が登場していますが、パフォーマンスを出すには結局データモデリングが必須になります。また、最近データエンジニア界隈では狭い領域(分析基盤)でのデータモデリングについて言及されているケースがあります。
分析基盤だけでなく、基幹系システムで数十年間、不変な技術として存在し続けています。データモデリングを学ぶ1冊目には丁度良い本です。
また、この本の著者がUdemyでも講義動画「ビジネス推進のためのデータモデリング入門」を公開しています。

データ基盤・アーキテクチャ

リストに入れるか非常に迷いましたが、エンタープライズアーキテクチャのベストプラクティスについて述べられており、他書にはあまり無いRDS(Read-Only Data Store)、ストリーミングアーキテクチャについて解説されているので、読んでおいても損は無いです。

MLOps

機械学習で繰り返し登場する課題についてベストプラクティスを解説するデザインパターン集になります。個人的な観測になってしまいますが、私が手掛けてきたプロジェクトは基本的にこのパターンに集約されました。機械学習プロジェクトに携わる方にはオススメの1冊です。

まとめ

昨今では、様々なツールが登場し、臨機応変に対応していくことが求められています。また、データモデリングのような不変な知識も必要になってきます。データエンジニアはデータの扱い方だけではなく、MLOpsやマネジメントなど非常に幅広い知識が求められます。
今後も可能な範囲でリストを更新できるように読破していこうと思います。

要約記事

実践的データ基盤への処方箋を現場で活かすために

紹介した本の1つ、「実践的データ基盤への処方箋」を読んだ感想を書いています。実務で活かすにはどういう考え方・行動をした方が良いのかを綴っています。

データ志向アプリケーションデザインを活かすために

紹介した本の1つ、「データ志向アプリケーションデザイン」を各章まとめています。
データ処理に関する技術を余すことなく解説されているので、非常に膨大な量となっています。また、参照している論文も多数あるため、理解するのに困難な部分もあります。

DMBOKを現場で活かすために

紹介した本の1つ、「DMBOK」を各章まとめています。
データマネジメントの体系本なこともあって、非常に膨大な量となっています。DMBOKを要約するだけで無く、実務で活かす方法を綴っています。


この記事が気に入ったらサポートをしてみませんか?