SRE NEXT 2020 IN TOKYO 参加してSRE部署の必要性に救われた

SRE NEXT 2020 IN TOKYO 参加させていただきました!!

日本ではこんなに大きなSREイベントらしく、スタッフや主催者には頭が上がりません

資料に関しましては、【SRE Next 2020】発表資料まとめ に素晴らしくまとめてあります(オンラインで編集されててすごかった)

試聴したものを備忘録と感想でまとめていきます パネルディスカッションが素晴らしかったです

個人的に、ノウハウやテクニックを惜しげもなく披露できる凄いと驚きました!!SREは失敗を前提として信頼性を制御するアプローチというのは響きました

相変わらずの大人気で、立ち見だった。メルペイさんの方は、SRE1人から、チームそして今までのフェーズの記載があって必見。

広告配信の外形監視とサーバーメトリックス、などのモニタリングツールの今と昔が書かれています(とても参考になる)

[外形監視] SmokePing →New Relic Synthetics
[サーバーメトリックス] PandoraFMS Munin → Telegraf influxdb

苦労(SLI /SLOの設定からの逃避)と日経電子版の構造、各チームの連携など色々聞けました

写真を撮らないでください、という話を聞けたところがお金出して観に行って意味がとてもありました。スライドからもしっかりなくなってました。

ZOZO MLOps のチームリーディングとSRE (Engineering)

チームリーディングとかはweb系の会社から余り聞いたことなかったので新鮮でした。技術力でぶん殴れ ╭( ・ㅂ・)و ってカッコいい

1分も待ち時間があったら、その間でTwitterをいじってしまう。1分以内にデプロイしないといけない!というのは正直衝撃的だった

SRE NEXT パネルディスカッション

※聞き間違いがあったらすみません あと聞き取れてないところもあります
→矢印は感想です

Q1. SREに必要な知識は?
RettyはSREチームはないけど、SLI SLOはある
自分の組織の中に使えそうなのをはめ込む
理想ではなく組織設定とは異なる

課題がなくなった後、色々なバックグラウンドがあると良い チームを作るには
チームとして色々なスキルセットがあると良い

→組織設定や課題によって異なる

Q2. 改めて0からSRE 組織を作ることを考えたときに、改善したいところ

たまたま遊びに行っているときに負荷の大きいDBを見つけて Nginxを前に入れて負荷を下げた。もう少し前で、無くしておけばよかったなと

アプリとウェブで組織で分かれている、でもシステムはつながっているので
チーム間のコミュニケーションがとりにくい
組織のコンディションが悪くなる

エンジニアだけでなく、経営層を巻き込んで信頼性について考えた方が良い

→システムが大きくなると、身動きが取れなくなる ソフトウェアと同じだなと

Q3. SREというエンジニアはいるべきなのか?

大きな組織、小さな組織、組織ごとに合うものを反映した方が良い

SREチームは、プロダクトチームから雇われている感じ
専門のエンジニアを雇ってる感じ ソフトウェアエンジニアが期待しているものを出す感じ 専門職として

生産性、信頼性のバランスをとる、プラクティスの集合体
信頼性を上げるとプロダクティが下がる
生産性を上げると信頼性が下がる

組織に合わせて!! ある場合は専門職としての意識を!

Q4. プロダクトとしてSRE SREというチーム どちらが良い?

プロダクトチームにあった方が良いある
ユーザーさんに見える画面のサービスもSREとしてやっていたことがあった

→インフラだけでないんだ!

Q5. 採用評価・育成・やっている取り組み

SREとしてやっていることはない、ソフトウェアエンジニアとして雇っている
SREもソースはかける、専門の人はいない SREのリクルーターが勝手にアサインする

Q6. 評価

OKRという取り組みを行っている それに向かってどれだけ貢献できたか
SLI SLO プロセス を改善するとか

Q7. SREの組織への取り組みを浸透させる

失敗した人じゃないと、分からない
自分ごとにならないと分からない

Q8. SRE本ってどういう人に読んでもらえると良いか?

単調な作業をしている 運用の人に呼んでほしい

Q9. 今後のSRE SREが不要になる時代

短期的に、クラウドも伸びてい オンプレもまだまだある 
        理想と現実がある 現状の技術基盤を賢く活用して運用してく
長期的には
       永遠のテーマ 人間は、寝て暮らせますか?ってなる
       技術の進歩による

クラウドによって、減るかな

クラウドスペシャリストが増えるかな

専門職はなくなる方法かな →SRE

SLI SLO 原理は残るが・・・・

→SREはテクニックや組織の一部であるので考え方は残るが、それを他の何かで
補ってくれればSREエンジニアはいらないのかなと(将来的に)

Q10. SREやっててよかったな

消したソースの件数10万件!!!!
→カッコ良すぎる

人の活動、作ったもが使われているのが見れるところがすごい

感想

SREの部署を作らねければという気持ちで、このイベントに来て、SREぽい活動をしていれば自ずとできる形で良いなと思えたので肩の荷がかなり降りた

懇親会ではサービスレベルの感覚とか、SREの部署のコミュ力の大切さ、社内政治など色々皆さん大変なんだと身に染みました

エンジニア用のTwitterやってなくて申し訳ない、断ってしまった皆様すみません


この記事が気に入ったらサポートをしてみませんか?