マガジンのカバー画像

CAMPFIRE SRE

21
CAMPFIREで行なっているSREの取り組みについてご紹介します
運営しているクリエイター

#SRE

CAMPFIREのこれからのSREは面白い

こんにちは、CAMPFIRE SREテックリードの榊原です。 現在、CAMPFIREのSREチームでは新メンバー…

CAMPFIREとDatadogとオブザーバビリティの1年

この記事は Datadog Advent Calendar 2021 15日目の記事です。 こんにちは。SREチームのオブ…

プロダクションミーティングをやってみた

これは CAMPFIRE Advent Calendar 2021 2日目の記事です。 お久しぶりです、CAMPFIRE VPoE兼S…

SREチームのマネージャーを引退します!

こんにちは、岩崎です。いつの間にか桜の季節ですね🌸東京は今週が見頃のようです。 これまで…

SREの採用で意識していること

お久しぶりです、岩崎です。年が変わってもコロナはまだまだ収まる気配がありませんが、2021年…

SREチームとオンボーディングのちょっといい話

これは CAMPFIRE Advent Calendar 2020 の18日目の記事です。 こんにちは。SREチームの加我で…

Datadog APMの活用で爆速改善の巻

これはCAMPFIRE Advent Calendar 2020の6日目の記事です。 はじめまして。SREチームの加我です。 CAMPFIREのモニタリング周りを12月に刷新しました。 刷新に至った経緯や感じていた課題、導入して良かった事を書きます。 これまでのCAMPFIRECAMPFIREは Mackerel というモニタリングサービスを利用していました。 (余談ですが別のサービスでは今でもMackerelをバリバリ使っています) Mackerelは導入のハードルの

SREチームのアラート対応について

はじめまして!SREチームの高山です。 2020年5月にJOINし、ちょうど3ヶ月が経とうとしている…

SREチームのインシデント対応について

こんにちは!SREチームの岩崎です。コロナでドタバタしてる間にすっかり夏になってしまいまし…

一ヶ月でアクセスが4倍になった話

こんにちは!SREの岩崎です。今回は「一ヶ月でアクセスが4倍になった話」と題して、最近の急激…

SREチームのミッションについて

こんにちは、SREの岩崎です。最近はコロナウィルスの影響でリモート勤務になっている会社さん…

SRE本の輪読会が終わりました!

明けましておめでとうございます!SREの岩崎です。去年の終わりに約一年続けてきたSRE本の輪読…

ポストモーテムとは

ポストモーテム(Postmortem)とは想定外のインシデントが発生した後に書かれる内部向けの報告…

エラーバジェットとは

エラーバジェット(Error Budgets)とはエラーに対する予算であり、SLOに基づき算出される損失可能な信頼性である。サービスの計測された稼働時間がSLOを超えている、換言すればエラーバジェットがまだ残っている状態であれば、チームは新しいリリースをプッシュ(デプロイ)できる。エラーバジェットはプロダクトマネージャーによって規定される客観的なメトリクスであり、SREとプロダクト開発者の緊張を取り除くものである。 SREにおけるエラーバジェット一般的にプロダクト開発チーム