見出し画像

SRE を探求するための情報源まとめ

Google社 が Site Reliability Engineering: How Google Runs Production Systems を 2016年に出版してから 7年 ほどが経過し、 SRE ( Site Reliablitiy Engineering ) という言葉は驚くほどのスピードで世界の System Engineering 、 Software Engineering 、プロダクト開発 に携わる人々に浸透しています。

日本では 2022年 に みずほ銀行 や 東証 が SRE への取り組みを発表し、一部のWeb系企業だけでなく大手企業までも、 SRE の方法論を本腰を入れて取り入れようとしていることがわかります。

また、2023年1月1日から14日で Site Reliability Engineering を検索すると、世界中の企業の Site Reliability Engineering を担当するエンジニアの求人情報がヒットします。

このように、現在進行形で広がりを見せ続ける SRE について、元ネタとなるような Webサイト や書籍をまとめてみました。
Google社の公開しているものを中心に、派生する領域の書籍も掲載しています。

SRE とは何か?

Fundamentally, it's what happens when you ask a software engineer to design an operations function. When I came to Google, I was fortunate enough to be part of a team that was partially composed of folks who were software engineers, and who were inclined to use software as a way of solving problems that had historically been solved by hand. So when it was time to create a formal team to do this operational work, it was natural to take the "everything can be treated as a software problem" approach and run with it.
cf. What is Site Reliability Engineering?

SRE を表現する説明として、「SREとは、ソフトウェアエンジニアに運用業務の設計を依頼したときに出来上がるものです。」という言葉があります。このように、 SRE は 「運用」をソフトウェアエンジニアリング の知識を用いて設計・実装していきます。

つまり、SREの根底には設計対象の「運用」という領域があり、1990年代以降の ソフトウェアエンジニア が積み上げてきた技術や価値観がもとに作られています。

このページに掲載するものは主に「SRE」に直接関連するものですが、実際の業務で効果的に SRE を実践するためには、背景にある関連領域の情報も理解した上で実践していく必要があります。

SREに対して理解を深めながら、そういった部分にも思いを馳せていただけると良いと思います。


Google

Books by Google

Classroom by Google

Resources

Events

Books

Online Learning

Others

Monitoring & Observability

Chaos Engineering

Infrastructure as Code

DevOps

組織論

Service Management

Twitter

Etc

Curated Site


よろしければサポートお願いいたします!いただいたサポートはクリエイターとしての活動費に使わせていただきます!