インフラ改善を専任エンジニア0人で実現する方法━「インフラ部」座談会
AppBrewで運営する美容プラットフォーム「LIPS」は累計DL数900万、web,app含むMAU1000万を突破し、国内最大級の規模へと成長しています。
そんなLIPSの開発チームには現時点でインフラ専任エンジニアはまだ0人!インフラ開発・整備は複数人のエンジニアにより構成される「インフラ部」により支えられています。
専任なしでどうやって運営してきたのか、4名の「インフラ部」メンバーに話していただきました。
また、今回AppBrew1人目SREの募集も開始しています!最後に募集ページも掲載しているのでぜひ最後まで読んでくださいね。
▼座談会参加者
oreo(@reo11_ds):アルゴリズムエンジニア。現在はtoB SaaS事業開発を担当。
Pin(@spinute):取締役CTO。LIPSショッピングのPdMを兼務。
komaba(@r_plus):マルチスタックエンジニア。LIPSのメディアグロースを担当。
fukatsu (@fukatsu1993):マルチスタックエンジニア。LIPSのバックエンド、クライアントサイドやインフラを担当。
━ 早速ですが......インフラ部ってなんですか?
Pin:歴史的経緯で部と言う名前がついてますけど(笑)業務の中でインフラ的なエンジニアリングをやりたい人の集まりを指しています。
一般的な会社だったらインフラエンジニアやSREがやっているような仕事を、開発チームでそれぞれのチームに所属しているエンジニア複数名が横断的に集まって、例えば日々20%くらいの労力で取り組んでいます。
━ インフラ部では、具体的にはどんな活動がされていますか?
Pin:今は、月1回くらいの定例ベースで活動しています。定例でインフラの技術基盤改善だったり運用改善についてやりたいことをディスカッションしたり、インパクトを見積もってネクストアクションを決めたり......。あとは気になったことを各々日々issueに溜めたりしてます。
今はやっていないですが、大きな課題があった時はインフラ部としてOKRを作って定量的に目標を追っていました。参加者一人一人がKRを担当して、それをQ内に倒します。
━ 今まで取り組んだことや、具体的な成果を教えてください!
Pin:全社の通信費を見て(社員に全公開されてます!)各部署で使っているSaaSやAWSの費用内訳など一通り見てみて減らせるところを洗い出し、作業分担したり実際に削減作業の実施をしたりしました。実際に削減したのはざっくり200万/月です。具体的にやったことはテックブログで紹介しています。
oreo:クエリの詰まりをなくしたり成功率が低いジョブ・重いジョブを網羅的に対処することで、システムの稼働効率を上げ、ジョブキューが安定して稼働するようにしました。
fukatsu:エラー数を削減し、サービスの安定稼働に繋げました。エラー発生件数をモニタリングし、効率的なエラー数削減のための改善を企画・実施し、1ヶ月のエラー数を93%削減し、DAUの0.07%に抑えることができました。
━ 大きい成果ですね!これをサイドプロジェクト的に達成できているのはすごい。課題の取り組みの優先度決めやアサインはどうやっていましたか?
fukatsu:Qの一番最初に、インフラ部でやった方がいいものを各自ひたすら洗い出してリスト化したあと、重要そうなものをピックアップし、各自が思う優先度を定量的に見積もってメンバー内でお互いすり合わせて優先度を決めていました。
oreo:アサインは、モチベーションの高さが全てですね!「やりたい人ー?」と聞いて、モチベーションだったり挑戦意欲が高いタスクをアサインしています。月一の定例で「モチベ下がったから他の人に渡したい」と申告して他の人にパスすることもあります。
━ モチベの有無を申告できる環境がすばらしい。通常業務に加えて、インフラ部としての業務もあるとなると形骸化するのがあるあるだと思います。運用上意識していたことはありますか?
Pin:やっぱりOKR等定量目標を作って公開することですね。インフラ部以外の通常業務との優先度の判断がしやすかったですし、完了したら成果として明確に出せるので評価もされやすいと思います。
oreo:部長というロールも継続運営に必須でした。ここで言う部長は、インフラ的エンジニアリングが一番できる人ではなく、あくまでロールです。定例を開催したり、場を作ったり、浮いてそうなタスクがあれば突いたり。
fukatsu:AppBrew開発チームではQごとに業務棚卸し会があるんですが、インフラ部の部長ロールはその時の通常業務の忙しさ具合を見て引き継ぐことも多く現在5代目です。この棚卸し会のおかげで負担が分散して継続的に・健全に運用できていると思います!
━ ところで、komabaさんはインフラ部エースと呼ばれているらしいですがその理由は......?
komaba:いやなんでだろう.....こうしたいなと思ったことを勝手にissue立てて勝手にやってるだけで特に思い当たる節はないかな......(笑)
fukatsu:これなんとかしたいな〜と思ったことは気がついたらkomabaさんが大体倒してくれてるんですよね。それで僕が勝手にエースと呼んでいました(笑)
━ 「インフラ部」として、インフラタスクを全社的に取り組んだことで何かプラスになったことはありますか?
fukatsu:自分はインフラ専門ではないので、インフラに触れる機会ができたのは良かったです!インフラ部はできる人だけではなく「やりたい人集まれ」で集まっているので、継続的に経験浅いけど興味ある人が入ってキャッチアップの機会になっていることは全社的にいいことなのかなと。
oreo:誰かに頼ってしまって知識の一極集中が分散できたのは大きいかなと思います。障害が起こったときに特定の誰かしか頼れない状況を回避できたので。
komaba:僕は気分転換的にやってます!個人の通常業務をやりつつのインフラ部タスクはリフレッシュになっています。
━ 気分転換でできてしまうのは強すぎる......。今回、1人目SREの募集が出ましたね!募集することになった経緯はなんでしょう?
Pin:今はインフラ部メンバーで分担してSRE相当の業務をこなしていますが、「LIPSショッピング」や新規事業開発など事業拡大する中でSRE業務に一人分のジョブサイズが安定的にある状態になっており、専門性のある方がレバレッジ効く仕事ができる状況で、インフラ部メンバーとしてもプロの仕事を見て学びたい気持ちがあり、今回の募集を開始しました。
━ 弊社で1人目で入社される人へのアピールポイントはありますか?
Pin:累計900万DLのサービスとある程度の規模感があるのに1人目SREとして裁量を持って働ける点ですね。
無からの1人目募集......ではく、SRE やインフラ的な業務に多くのメンバーの理解があるからこそ今までインフラ部で業務分担できていて、既にそれなりにモダンな基盤と多くのユーザーに価値を届けている事業がある状態で、かつ1人目SREとしてジョインできる会社はなかなかないと思います。
━ 最後に、どんな人に応募いただきたいか教えてください!
komaba:クラウドインフラの進化をキャッチアップしてくれる知識、好奇心強めの方や、それが今の構成に使えそうかどうか調べるな能動的に動いてくれる方とぜひ一緒に働けたら嬉しいです。事業会社経験はあると嬉しいけどマストではないので、いろいろな方の応募をお待ちしています!
━ ありがとうございました!
美容特化領域では国内最大級のサービスで、1人目SREとしてのジョインに興味がある方はぜひ下記の募集要項をご覧ください。まずはカジュアルにお話できれば幸いです!
この記事が気に入ったらサポートをしてみませんか?