見出し画像

AWS・GCP・オンプレを使いこなす。数千億円規模のサービスを支える、monotaro.com のインフラエンジニアとは?

※本記事の内容は取材時のものであり、組織名や役職等は取材時点のものを掲載しております。

モノタロウの年間売上(単体)は2021年度が1800億円超。今後も更なる成長を目指すECサービスですが、そのサービス全体の屋台骨を支えるインフラエンジニアはどういった仕事をしているのかを、サービスインフラAグループの落合さん、井上さんにお伺いしました。
(写真左)IT部門 サ―ビスインフラAグループ 落合さん
(写真右)IT部門 サービスインフラAグループ 井上さん


技術にこだわりある元同僚が「良い会社だ」と言ったモノタロウ

ーこれまでのご経歴をお教えください。

落合
モノタロウへの入社は2018年です。それまではずっとインフラ畑で働いてきました。そのうち13年程はマネージャーでした。初期のキャリアではSystemVを使っており、その後オープンソースへシフト、さらにはクラウド関係にも関わるようになりました。オープンソースもクラウドも時代の流れなので、同じような経歴を持っているインフラエンジニアはいらっしゃると思います。
特に、クラウドの台頭によってAPIを使っての制御や自動化を行うことが増えまして、インフラエンジニアもプログラミングの知識や技術を習得する必要が出てきたのですよね。そういった転換期を経験したため、インフラエンジニアとしての自分の市場価値を意識しつつ自己研鑽してきたように思います。

モノタロウについては、インフラエンジニアが活躍できる関西最大規模の場所だと認識していました。転職先を探しているときに前職の同僚が働いているのを知り、さらに「良い会社だ」と言っていたので、興味を持つようになったのです。そういった理由があってモノタロウへの転職を決めました。
現在は、マネージャーとして働いています。

ーありがとうございます。井上さんのご経歴もお教えください

井上
私がモノタロウに入社したのは2012年の3月なので、今年でちょうど10年目になります。
それまでは10年間、東京にて情報通信系のエンジニアをしていました。そのうち7年間はアプリケーションエンジニア、3年間はインフラエンジニアです。
もともと関西育ちなのですが、大学進学で上京して以降ずっと東京住まいでした。ただ、関西に戻りたい気持ちが大きくなったのでUターン転職しました。
経験としてはアプリエンジニアのほうが長かったのですが、転職前の最後3年間でインフラのほうを触らせていただき、そこでの経験がとても衝撃的で、インフラについてしっかりと学びたいなと思うようになりました。

たとえば、これまで長い処理時間がかかっていたものが、サーバーのほうをちょっといじったらすぐ終わるようになりまして。モノタロウにもインフラエンジニアとして入り、MySQL4から5.5へのマイグレーション、ECサイトのオンプレミスからAWSへのマイグレーション、またそれらのネットワーク周りの構築などをこれまでに行いました。現在はMySQL周りの管理を行っています。
入社当時はまだエンジニアは30名程度。現在はその5倍程度ですから、本当に大きくなっているなと実感しますね。


モノタロウで「インフラ」といった時に何を意味するのか?

ーモノタロウにおいては一口にインフラといった時に、どういった内容を指すのでしょうか。

落合
当社はその点、少々特殊です。金融系だったりWeb系だったり、業種によって特徴が異なってきますが、当社は複数の業種が合わさったような状態です。そもそも当社の業種がITやWeb系等ではなく、小売だということに起因するかもしれません。

モノタロウのインフラはざっくりと3つに分けられると考えます。1つは、monotaro.com を始めとする、サービスとしてのインフラ。これは更に受発注・顧客管理を担う基幹システムと、ECサイト側に分かれます。(ビジネスIT)
2つ目は全国に複数ある巨大な倉庫のシステムに必要なインフラです。最後に、いわゆる情シスとよばれるような社内のインフラです。(コーポレートIT)

ー落合さん・井上さんが所属するサービスインフラAグループの役割は、そのうちどういったものなのでしょうか。

落合
我々の担当は、主にサービス側のインフラです(ビジネスIT)。ただ、それしか担当しないということではなく、作業依頼という形で、情シスや倉庫側のシステムの構築も支援的に担当しています。


分業ではなく、サービス全体を見据えた仕事

ーその中で、仕事はどのように進めるのでしょうか。


落合
現在15名程度で、プロジェクトマネージメント、設計、実装、運用(監視を含む)を実施しています。レイヤーはそれこそ、オンプレ、クラウドで、ネットワーク、OS、ミドルウェア、DB、ハイパーバイザ等がありますが、業務を細かく分けずメンバーの誰もがこれらに関わることができるのが特徴です。

一般的な話をしますと、規模が大きいほど、つまりシステムの規模が大きいほど細かく分けられるケースが殆どです。
しかし、モノタロウは東証1部上場(インタビュー当時:現在は東証プライム)しているほどの規模ですが分けていません。「まるっとやっている」状態です。

井上
もちろん、昔は本当に人員が足りていなくて、現実問題として分業できませんでしたが(笑)

落合
この体制が今でも維持されているというのは、ベンチャー的な文化が息づいているからだろうと思っています。じゃあこれから分業化していくかと問われたら、単純にそうはならないでしょうね。
これは「丁度イイ」という感覚があって、モノタロウにとっての「丁度イイ」と大企業によくあるそれとはイコールではないのですよね。分業化すると、一部分だけが手薄になったり、逆に重厚になりすぎたり、ということが起こり得ると考えています。

井上
業務が偏りすぎてしまうと、それこそ業務が進まなくなってしまうでしょうね。アプリケーション系の人たちと話が合わなくなり、全体もわからなくなってしまいます。
monotaro.comをユーザーに提供するためには、インフラとアプリケーションが合わさってシステムを構築する必要があります。そうなるとモノタロウ式はとても都合が良いです。


グループのありたい姿

ーインフラ全体・システム全体を意識されながら開発を行う中で、グループとして目指すことはどういったものですか?

落合
インフラ現場としてはよく言われることかもしれませんが、守りと攻めの両輪を同時に進めていくということです。売上の伸びと担当ノード数が圧倒的に大きい中、如何に少人数で運営していくかを考えなければいけません。

何らかの形で私たちが関与するインフラのノード数は1500を超えているとおもいます。オートスケールや、マネージド化されており正確な数の把握は難しいですが。

そうすると仮に新しいことをしなくても、これらのサービスの健康状態を維持するだけでも日々仕事がある状況になります。たとえば、EOL(End Of Life)を迎えた機器やOSをリプレースする、リソース監視からのアラートや予防対応などです。これらは、守りの仕事と言えます。

同時に前年比約20%成長を続けていると、成長と比例して管理するノードは増える傾向にあります。ただし、人も同じように増やすということを単純には考えていません。そこで、自動化がテーマとなります。また、競合他社に負けないような、新たなシステムの実装もあり、これらは設計から新たに考えていきます。これらは攻めの仕事です。

こうした攻めと守りの仕事は、いずれも重要なテーマだと感じています。

ーそうした仕事を進めるうえで、マネージャーとしては、どういった組織作りを意識されていますか?

落合
筋肉質な組織にしていきたいと考えています。具体的にお伝えすると、 統制よりも、各メンバーが自律することを大切にします。裁量と権限は現場にあり、そうすることで、現場には責任感や達成感が生まれます。
現場の管理職としては、そっと背中を押すのみに留め、「任せる」といった覚悟をしています。何かあったときは責任をとるということです。

こうした状況で、楽しめる人、動ける人を増やしていきたいと思います。メンバー一人一人が、指示を待つのではなく、アイデアを創出・発信し、何事も「自分だったらどうするか」を考えることができる組織にしていきたい、ということが私の考えていることです。

実際の取り組みとは?

ー実際にどういったことに挑んでいらっしゃいますか?

落合
CI/CD(継続的インテグレーション/継続的デリバリー)に取り組んでいて、一部プロダクトではかなり進んでいます。ただし、システム内にはレガシーなものも実際数多く残っているので、引き続き導入を進めていく予定です。また、IaC(Infrastructure as Code)については全システムをほぼ網羅できている状態です。

ー当社のデータベースはMySQLを使っていますがどんなところに特徴がありますか?

井上
現在、200台ほどのMySQLを私一人で運用しています。環境はAWSのRDSやオンプレミスで、クラウドでもVM、またマネージドサービスも入っていて、非常に分かれた感じで作られています。それがモノタロウの特徴と言っても良いでしょう。
後、パッケージ系のシステムだとオラクルをはじめ複数種類使っているので、データベース系のシステムを触りたい人にとっては合っている環境だと思います。私自身、この仕事に携わること自体がとても勉強になっています。

ーどういった経緯でそのように分かれたのでしょうか

井上
MySQLにはslaveというものがあり、アプリ参照はslaveのほうが適していまして、そういったシステムの適性によって構成を変えていったからですね。
本来ならすべてマネージドサービスに移行して運用効率を上げていきたいのですが、それは私一人ではさすがにできないので、基幹システムはじめ別グループの方々と協力して少しずつ進めていきたいなと考えているところです。
実際、過去にはECサイトをオンプレミスからAWSへ移行しましたが、周囲のグループの方々の力添えがあったから成し得たことです。

ーいまですとGCPもありますよね。

井上
AWSやGCPをそれぞれの特性に合わせて使い分けている、マルチクラウド環境がモノタロウの特徴ですね。現在は基幹部分はオンプレミスで動いていますが、システムモダナイゼーションが進めばクラウドへ移行していくかもしれません。


将来のあるべきシステムの姿を議論するタイミングが、まさに今

ー周囲のグループの方々との連携のお話をいただきましたが、実際にどのように進めているのでしょうか。

落合
モノタロウのシステムは、ECサイトと基幹側で大きく分けられます。
昔より人数が増え、また組織として分かれたが故に、技術や手法の共有を意識して進める必要がでてきています。それを受け、現在、基幹側とECサイト側が意識的に関わりあって、3年後、5年後、10年後先のシステムをどうすべきかを協議しています。

そのようなタイミングでプロジェクトに携われるということはなかなかないので、エンジニアとしては非常に刺激的です。システムインテグレーションを行うSIerだとお客様のご要望に合わせてシステムを構築しますが、モノタロウでは自社の未来を支えるシステムをいま協議できるわけです。なにせ、年間売上が近い将来2,000億円を超えるシステムについて協議できるってすごいでしょう。

検討しているものの一つとして「コンテナ」という技術が挙げられます。「コンテナ」はすでに一部システムで使ってはいますが、全体としてはまだまだこれからで、お客様のサービス影響から遠い箇所から順次試しているところです。それを今後大々的に行っていくのか、というところを部門を超えて皆で考えています。


インフラエンジニア視点で見るモノタロウの良さとは

ーインフラエンジニアとしてモノタロウを見た時の面白さとはどういった点なのでしょうか。

落合
やはりmonotaro.comという、非常に大きなシステムに触れられることですね。それこそ、多い月で200億円近い売上があるサービスの根幹をなすシステムに触れるのは、エンジニアとして貴重な経験です。

これまで私が携わってきたものには、金融系や大手メーカーのシステムで規模自体はモノタロウよりも大きいものもありました。しかし、そういったシステムは大きすぎるがゆえに分業されていて、自分の担当分がどこまでなのか、影響範囲が見えづらい環境でした。
一方でモノタロウは、先ほどお伝えした通り分業化されていませんから、会社の規模に対して自分が及ぼし得る影響とその範囲がとても判りやすく大きいのです。

またAWS・GCP・オンプレミスとプラットフォームが多様な環境ですので、何でもやりたい、やってきたという私のような者にはとても魅力的な現場です。

井上
影響を及ぼす範囲が大きいからこそ、責任感がある仕事とも言えます。その分、自身の提案がよりサイトレスポンスに係る平均所要時間を下げることに繋がり、ダイレクトにモノタロウの売上や利益に貢献できているということが実感できます。
トラブル対応時に、自身の提案で解決かつシステムとして最適化された事もあります。1h掛かっていたバッチがSQLの改善により数秒で終わるようになった、というようなことでした。
ーインフラのことだけを考えるのではなく、サービスを全体を意識して仕事されるからこそ感じられる実感ですね。

落合
はい。また面白いとはまた異なるのですが、「モノタロウはこういう会社だ」と説明しやすいのは良いですね。というのは、自分の子どもに説明できるわけです。CMもやっていますし、何をやっているかわかりやすい会社ですので、自分の子どもにとりあえず?(良くわかってなくても)すごいって言ってもらえます(笑)
インフラエンジニアという特性上なのかもしれませんが、サラリーマンをやっていてもそういう家族に説明できる機会はなかなかないので、これは率直にとても嬉しいです。

井上
リモートワークで、子どもと仕事についてコミュニケーションする機会も増えましたね。家で私がメンテナンスを作業して更新した瞬間に、子どもにmonotaro.comを見てもらう、といったような。更新する瞬間を子どもに生で見せられるのって、自分の仕事を知ってもらえますし、少し以前では考えられなかった機会で、すごいなあと思っています。

ー得られるスキルはどういったことがあると思われますか?

落合
幅広いインフラ領域の技術スキルの向上でしょうね。例えば、元ネットワークエンジニアという方は入社後1年程度で、ミドルウェアや、クラウド、CI/CDをかなり触ってますという感じになります。また大小規模のプロジェクトが複数走っているのでPM/PLスキルを獲得できる機会も多いです。

自社サービスを持つ会社での、仕事へ向き合うスタンスも身につけていただけるのではないかと思います。言われたことや決まったことをただやるのではなく、自分で考えるということを大切にしていただきたいと思っていますから、先ほど申し上げた、自己組織化の実践をしていただくことになります。

その中で、『「丁度イイ」 を知る』ということを掴んでいただきます。もう少し補足すると、価値ドリブンで仕事を進めていくことを意識してほしいと思っています。例えば、ドキュメントはもちろん大切ですが、そのドキュメント作成にかけているリソースの割合は “丁度イイですか?” ということ。物作りの現場としての人数と全体案件とを考えたときの、バランス感覚のようなものです。

井上
monotaro.comは、最大約20万req / minという日本有数のサイトアクセス数があります。それをモニタリングし、リソース追加提案等でも多くの経験を積むことができます。
意思決定が早いので、合理的かつ効率がよければすぐ新しいものを採用でき、多くのトライ&エラーの経験を積むことができます。同時に変化も多く、多様な属性のエンジニアがいる環境ですから、システムについて日々勉強できます。自分自身でいろいろなシステムに関わる事ができますし、インフラ作業といってもL1-L7の様々なシステム構築の経験を積むことができますので、システムについて幅広く興味のある方には向いていると思います。
効率の良い手法があればすぐ取り入れますので、色々試したい方には向いているのではないかと思います(笑)


少人数で成立している理由と働きやすさ

ー規模が大きく、更に業務範囲が広いということは魅力的でありそうな反面、素人考えだと、とても忙しくなりそうな印象を持つのですが、どうやって少人数で成立させているのでしょうか。

落合
確かにこうした規模感の中で、十数人で管理しているって、普通に考えたらすごいと思います。
それが成し遂げられる理由の一つに、ビジネスがBtoBだからというのが大きいと思います。夜間や土日は顧客となる企業が稼働していないことが多いので、モノタロウのサービスを触るユーザーが減るということです。

つまり、我々エンジニアが働いていない時間は顧客も稼働が減るわけですね。それは少ない人数で動かすサービス形態としては理想的だと思っています。これが一般消費者向けのサービス、つまりBtoCだとそうはいかないわけで、皆さんが家に帰られてからの日時に忙しくなったりします。
そういうわけで、モノタロウのインフラ現場の夜間対応は多いときでも月に合計2時間程度、土日祝の対応も月に1回あるかないかです。

井上
リクエスト数自体が休日だと半分に、夜間だと半分から4分の1に減りますからね。
また、その瞬間だけアクセス数が膨れ上がるようなキャンペーンを行っていないというのも大きいかと思います。

落合
ピーキーなシステムじゃないから守りやすい、ということなんですよね。
ちゃんと日中、人間が起きている間に対応でき、もちろんシステムも刷新を続けていて、たとえ大きな流入があったとしても耐えられるようにはしています。

落合
もちろん働いている皆も無理はしていなくて、ピーク時でも月の残業時間は平均15時間、いやそれ未満だと思います。自宅からのリモートワークも現在は週4であって、データセンターでの作業のような物理作業や顔を合わせてのミーティングのような時に出社するぐらいですね。男性の育休についても取得実績があり、実際に半年前に取得された方がいらっしゃいます。

いまのモノタロウは本当に働きやすい職場ですし、そこで働くことでスキルも数多く身につけられますし、とても良い環境だと思いますよ。


仲間になってほしい方

ー落合さんは、前職の同僚の方から「良い会社だ」と聞いたことが転職のきっかけの一つと仰いましたが、その方はどういった理由で良い会社だと言っていたのでしょうか

落合
語弊を恐れずに言えば、優秀なエンジニアって要求がうるさいのですよ。やはりなんらかのこだわりを持っているからです。エンジニアとして幸せになりたい人たちは要求もそれなりにあって、自分がやりたいことをやれているかを非常に重視されているのですよね。
だから会社選びもかなり厳しく行います。「理由は特にないけど昔からこうだからそのままやってます」といった現場はあまり好まないですね。
そういったこだわりのある先人たちであることを知っていましたから、モノタロウに転職して「モノタロウっていい会社だよ!」と言う時点で、間違いないだろうなと感じました。

ーこれまでとのギャップと言いますか、入社して大きく違うと思ったことはどういったことだったのでしょうか。

落合
「止めちゃいかん」という気持ちを抱くようになりました。それこそ前職や前々職と比べると相当強く。
monotaro.comは1日で10億円近い売上がある日もあり、1時間止めるだけでも数千万円の損害が出てしまいます。そういったシステムのメンテナンス画面を、しかも自分の裁量が大きい中で触れてしまうのです。そのため、モノタロウのシステムは安定稼働に重きを置いています。「とりあえずやる」「とりあえず攻める」の一辺倒ではなくて、それはしっかりと動くのかという点に重きを置いています。

ーそうした安定稼働が求められる環境下で新たに共に働くのは、どういった人が向いているのでしょうか。

落合
「技術が好きな人」ですね、私たちとしてもそういった方に入ってきてもらいたいです。
また、いままでこうだったからという慣例に惑わされずに、価値ドリブンで動ける人、この仕事に価値はあるのか・これを行って本当に安定性が高まるのかを考えられる人ですね。
こうすればもっと安定する・楽にできる、という自分のアイデアを持っている人が合っていて、それにはやはり学習・技術のキャッチアップが必要でしょう。ない引き出しからは何も出てこないので。
だから、新しいことへの探求心、つまり「技術が好き」であることが大事だとおもいます。結局、安定稼働というのは守備ではなく、新しいものを貪欲に拾っていくことです。
得た知識を、モノタロウで、価値に変換できる人が、インフラエンジニアとして適性があるのだと考えています。

井上
自分でトライアンドエラーできて、さらに自走して検証できる人が向いているでしょうね。
会社の人口増にともなって単純に人を増やすのではなく、既存の仕組みを変えられるような提案ができて、それを踏まえて最適化できる人に来てほしいと思っています。後はやはりITが大好きな人でしょうね(笑)

ー言葉のイメージだけ取ると「安定が必要だからチャレンジできない」となりそうですが、実際は真逆なんですね

落合
そこは小さくPoCする、小さなところから試してみるということです。「コンテナ」が良い例でして、おおごとにならないところから試験していって、そこから徐々に大きくしていきます。「コンテナ」に関してはまだ知見が薄いからとりあえず適応してみる、といったところです。

是非こうした環境にご興味をお持ちいただけましたら、私たちの共に働くことをご検討頂けると嬉しく思います!

ー落合さん、井上さん、ありがとうございました!


モノタロウでは共に働く仲間を募集しています!