見出し画像

会社のITインフラ改革〜いろいろな経験〜

考えることは自由で無料、それを積み重ねていけば成果につながる。
参考になれば。

十数年前に入社して一番の驚いてしまった出来事、自席PCからインターネットができない!ということだった。十数人で1台のインターネット接続可能PCを共有するという環境だった。メールアドレスも部のアドレスで共有され、個人のアドレスは提供されていなかった。当時は、メールソフトはOutlook Express、ブラウザがInternet Explorer 6だったと思うので、Windows XPだったのかな?これを覆すために努力が始まった・・・。

サーバルームは片隅にあり、Windows Serverが1台、NASとしてDELLのPowerEdgeがテスト導入されていた記憶がある。Windows Serverは、当時はMcAfeeからSymantec AntiVirusへの乗り換えで、Nortonサーバが入っていたような記憶だ。当然、インターネットと社内ネットワークが物理的に分離しているため、サーバに対しLANを繋ぎかえて定義ファイルを更新かけ、サーバを再起動させ、ネットワークを切り替えてウイルス対策管理をしていたことが懐かしい。

幕張メッセでのEXPOとかの展示会で、VMwareを使った仮想技術に興味を持った。これがあると、サーバを買い足さなくても複数のサーバが建てられるんだ、すげーなーと感動した思い出がある。

当時の業務は、PC側の方は1割、基幹系業務が9割ぐらいだった。サーバ管理やネットワーク管理は0割の割合だ。ネットワークなんて知識ゼロだ。それが今や、99%がインフラ、1%あるか無いかが基幹系業務に変わっている。ほんと、職場は変わらないものの、業務内容が様変わりとなっている。地道な情報の習得、将来を見据えたあるべき姿の検討の積み重ねだと思う。

導入して失敗し叱られたのも結構ある。なんで叱られるのかが意味がわからない案件もあった。部員への見せつけ叱られ、ってなシーンも経験している。わけわからんよね。見せつけって。つまらない時代だった。

過去に1回、とんでもない事故を起こしたのがある。自殺という死を思い描いた誤操作だ。仮想化ならではのショッキング事故。誤操作で仮想マシンを削除してしまうという失墜だ。今のバージョンでは、ゴミ箱に移動し、1日以内なら復元できるようだが、当時は削除したら、どこにも残らないという大問題だ。この経験で、操作ミスを行わないよう、操作の慎重さを心がけたと共に、バックアップの強化の意識が高まった。

仮想化導入前、2010年ごろかな?グループウエアシステムを刷新した。交通費精算とかの経費精算システムを利用できるシステムを初導入した。成果として得られなかった。まぁ、会計課が入れたもんだから、なんだろう。設定はこちら側だ。業務評価がなぜなかったのか、疑問に残る。これも今となっては励みになった1つだ。どうすれば評価が得られるか、ってね。

新グループウエアは、物理サーバー4台構成だ。APサーバ、DBサーバ、駅すぱあとサーバ、開発サーバ兼バックアップサーバだ。物理サーバーで、HPEのProLiantを採用した。浦和レッズ=コンパック=HPE、という単純な思想だ。会社へのシステム導入は、こんなつまらない思想から始まった(笑)。今もそうだけど、HPE ProLiantは今でもお気に入りのシリーズだ。ま、全社的にHPEのスイッチが多いのも、この理由だ。(ぉぃぉぃ)
機器はシステム管理者が好きなものを入れればいいんだ。これぐらい遊び心あってもいいんじゃない?

サーバなんて、大学院時代のとき、IBM Netfinity3000が、特価で3〜4万円で入手でき自慢したことがあった。当時は付録されたVine Linuxで遊んだことが懐かしい(1999年)。その出会いから、いつかはサーバ管理者になりたいな、と思っていたのが現実化している。何事も諦めないことだ。今苦労していれば、絶対、後で振り返った時には、プラスアルファ材料として自分に降りかかってくる。粘れ、負けるな!

当時、HPE ProLiantで感動したのは、BIOS上からリモートで操作できる、iLOという機能だ。今じゃ、どこのメーカーもあるけど、HPEのセミナーで感動しHPEサーバ入れる場合は、iLO必須という組み合わせでのシステム最低条件が加わった。また、今じゃ当たり前なんだろうけど、サーバー稼働中でも、HDDの抜き差しができるホットプラグにも感動した。RAIDってすげー、会社ってすげー、というのも懐かしい。

構築ベンダーからも色々と教わった。こうだ、と思っていたものが、そうじゃない!だとか、こうすれば、こうなるんだ、とか。コロナ禍により、そういった、面と面でじっくり話し合う機会が失われ、業務として効率が良いんだろうけど、用を済ませば終わり、あとはメールで対応といったつまらない時代になったものだ。

PC交換で一番面倒なのが、Outlook Expressメールデータの移行だ。情シスがなんでもやらなきゃいけない時代。新品PCになっても、データは引き継がれるものが当然、という社員の考え。このデータ移行が面倒だな〜と思っていた。いつかはWebメールでサーバー上で管理できるようにしたい、と思い描いていた。頭の中で考え、自己計画するだけなら無料だ。公開しなけりゃ、上の連中から注意されることもない。まぁ、平社員の頃は、何をいっても採用されないわけだから、色々な情報を蓄積していくことが重要と考えていた。

メールといえば、Office365は有名だが、当時はBPOSと言われていた。ディーラーもアクセンチュアとか3社程度に限られており、当社との取引が無いベンダーだった。その頃、マイクロソフトも、このBPOSを市場に定着させるため、あれやこれやで、セミナーを開いては、マウスとか帽子とか、マイクロソフトグッズをもらいに出掛けていた。ちなみに、BPOSとは、Business Productivity Online Suiteの略で、Exchange Onlineのメール、SharePoint、Skype for Businessの前身Live Meetingぐらいしか無かったのかな?今となっては、シンプルな製品群だった。また今となれば充実した管理コンソールだけれども、何をやるにもPowerShellでコマンド操作が必要だった。

2010年当時、メールはホスティングで行うのが多かった時代だと思う。勤務先もホームページに付録していたメーラーを使っていたと思う。いわゆる、何個作っても、基本的に課金が発生しない、優れたメールサーバーだ。ただ、1人当たりのメール容量は5MBだったかな?そのため、Outlook Expressのメーラーに根こそぎ落とす必要があった。

当時、メールアーカイブというのも注目され、3年やら、5年やら保存するもんだよ、JSOX法たるものに対応するには、とかで、色々な対策をも考えていた。また、社外ではメールは見ることができなかったため、テックリンクのメールタンクとか、面白そうだな、とか思っていたりした。メールタンクは、自社内におき、ミラーHUBをかまして保存するため、特にユーザーに影響を与えることもないのが特徴。これは面白い製品だ。

こういう考えもしていながら、メールのハウジングの検討も入りこんだ記憶がある。また余計な…邪魔が入った。もう担当から外れている人から、見積もりをとったから参考にしろとか。これを、どう、ハウジングはNGだよ、BPOSしか無いんだよ、という、いわゆる「言い訳」を考えることをした。当時は、スパムメールが増え始めてきており、スパムメールをハウジングでは駆除できるのか?と迫った時、お客様のメールを無駄で削除はできない、という回答を獲え、これを会社に対し「ハウジングの場合はスパム対策ができないので導入効果が得られない」というのが、勤務先の私のIT改革の始まりかもしれない。

Exchange Serverのホスティングの提案も気になっていたが、1人あたり500MBなら提供できるよ、という中、BPOSなら1人あたり25GB提供できるよ、という大容量から、BPOSの流れに考えがシフトしていった。マイクロソフトの営業と調整しながら、2011年5月GWあたりに導入するよ、という調整をかけた。勤務先にどのような言い訳でBPOSを入れようか、を考えていた、2010年10月。

BPOSの導入理由として、①メールボックスが25GBになる!②迷惑メール対策を行う③JSOX法対応としてメールアーカイブ(EHS:Exchange Hosted Services。今はEOA : Exchange Online Archiving)④WebメールなのでPC更新してもメールが消えない⑤どこからでもメールが見れる、とかの理由で稟申が決裁され、2011年1月に社員向けに4月ごろ展開を目指して切り替えるという勉強会を開催した。

2011年3月11日、東日本大震災。原発の問題、出社困難になる可能性、と色々な問題が発生した。この影響で、マイクロソフトの営業とコンタクトをとり、早期契約を実施し、いつでもBPOSに切り替えられるという環境を作り上げた。これも、会社として評価得られなかった。

しかしながら切り替えるにあたって大きな問題が立ち上がった。DNS更新には、自社で行えず委託となっていた。しかも前払い対応だ。このドメインのTXTレコードに記入して反映してもらうといった作業が電話越しで電話待ち状態が続くなど、DNS更新はいつかは自社で行うという記憶の奥にしまいこみながら、心の中で愚痴りながら、業者との対応を行った。これが、当社においてBPOS(Office365の前身)の利用の始まりだった。

勤務先はワークグループ環境だ。PCにログインする際、PCにユーザーアカウントを作ってあげないとPCにログインできない。そう、AD(Active Directory)に未対応なのだ。そもそも、ADについても詳しくない。業者の言いなりで作ってもらった。今は、mDNS問題、ドメイン名に.localがついている問題で、AD移転が必要となっており、第4四半期(2023年1月以降)からの切り替え問題が発生している。

2012年ごろ、グループウエアのDBサーバのディスク障害、バックアップを取ろうにも、うまくいかない緊急事態発生。この回避をどうしたか、あまり覚えていないのだが、次入れるシステムは仮想化だ、と覚えている。

2013年のシステム導入では、IT内部統制対応のため、PC操作ログに対応した提案を数社でコンペした。このコンペで選定した業者とは、今でも信頼しており、取引を継続している。ここで、VMware ESXiを導入した。サーバーは、Fujitsuで固め、バックアップにFujitsu ETERNUSを採用した。当然、LTOテープにも書き込みを行うという、D2D2Tという構成を採用した。このETERNUSがとんでもなく衝撃的だった。ETERNUS再起動中に瞬間コピーというのだ。OPC (One Point Copy)という機能で、ある時点の業務ボリュームの全データを高速に複製ボリュームにコピーする機能だ。サーバールームはものすごい騒音ですごかった。当時は若かったので、泊まり込み・オールナイト業務とか行っていたりしており、会社泊していた際、ジェット機が飛び立つような騒音を耳にする。あ、OPCが始まった、なんて。

最終的には、1ラック36Unit全部がESXi構成に埋まった、というのが印象的だ。ESXiの欠点としては、ノードの追加が大変だった。大変といっても業者に実施してもらうわけで、こちらは現場監督的なものだけれども。ノード追加時に、BIOSバージョンを合わせなきゃいけない、とかで、結果的には、ノード追加は行わず、ストレージ追加に留まった記憶がある。また、接続はFc(光ファイバーケーブル)での接続でもあり、ノード追加には、このFcハブの増設も必要だったりするため、イニシャル投資にはある程度余裕を持った構成が必要と感じた。

こういった仮想化システム、停電が想定されていないというのも印象的。社内のサーバルームにESXi 3ノード、ストーレージ、バックアップのETERNUSとかの構成に当たり、停電ありき場所に置いた際の停電手順・復電手順書を作成、それに従って自社作業が必要。年1回のビル停電に対し、手順書通り行うものの、うまくいかないケースが多く不安を何度も経験していた。

ビル停電前に出社し、夜間処理で仮想化システムをはじめとする色々なサーバーを停止し、朝帰り。また、復電した頃に出社し、システムを稼働させて、動作確認して昼帰り。仮想マシン(VM)が停止しなかったり、復電時に、ノードがメンテナンスモードとなり正常にクラスタ(冗長構成)が適応されず、片方にVMが偏り、バランスよく再配置するなど、これは寿命が縮まるよ、という嘆きで5年間対応した。

良かれよかれで仮想化システムを入れた癖に、こんな大変になるとは…。もう停電しない環境を考えなくては、データセンターを考えよう!という計画を入れた。しかしながら、景気後退、不景気は変わらない。データセンターという固定費はなかなか受け入れてくれない。

そういう中、サーバールームの空調が故障、エアコンが効かなくなるという問題、別の事務所の天井から水が垂れ落ちるという事故、が相次いで発生。これを言い訳としてデータセンターを認めてもらう手に取り掛かった。漏電によってショートしてデータは全て失う。火災も対応できない、という問題に対し、じゃ、窒素で対応できるという反論がありながら、サーバルームの窓ガラスはすぐ割れて、人災が起きるとかの口論とかを何度も繰り返した。また首都圏を襲う大きめな地震もあり、2018年12月ごろに上申が降りた。大きな理由は2019年4月27日(土)から5月6日(月)のスーパーゴールデンウィークだった。この期間を利用し、本社からデータセンターに90%以上システムを移動した。

2018年、仮想化システムの5年償却で更新ができる!これまでの不安面は払拭したい、ノードも不安リスクが軽減できる方法で対応したい、とか、色々な問題を整理し、それに適した製品がNutanixだった。ESXiからAHVへの移行は100%不安しかない。どれもAHV上で稼働実績がないシステムだらけだ。ESXiからAHVへの移行には、当時は、Xtract for VMsを利用した移動であったが、これも私は現場監督で対応したので、稼働することを祈るばかりだった。ちなみに、Xtract for VMsは、現在Nutanix Moveという製品に変わり、VMware vSphere(ESXi)だけでなく、Microsoft Hyper-V、Amazon EC2からの移行、その逆のクラウドへの移行もサポートされている。そう考えると、Nutanixを利用していれば、いつだってクラウドにも移行できる魅力がある!ということになる。

結果、ESXiで稼働していたものは、AHVで稼働していることを確認した。
ESXiは、ホスト3ノード・ETERNUS7ノードぐらい?・LTOテープは連装タイプを利用していたので、1ノード2Unitということで、22Unit消費していたのかもしれない。このほかFcで冗長構成で2Unit、UPSとかが4Unitが2台とか入れていましたので、軽く1ラック埋め尽くされる構成だ。

UPSを外しても、24Unit必要なスペースが、Nutanixでわずか2Unitで収まったのが衝撃的だった。ただ、Fcの代わりに10Gbps通信が必要なため、10GbpsのL3スイッチが高額すぎる点で、難点なところはある。また、Nutanixの場合、システムソフトのEOLが比較的短く、少なくとも1年に1回はファームウエアをアップデートしなくては、サポートが受けられないという問題もユーザーダメージはでかい。

2022年11月現在、AHVノードは6となっている。一方、ESXiでしか稼働しないVMも出てきているため、Nutanix上でESXiを稼働しているノードは3となっている。また、バックアップには、筐体内でのスナップショットでは危険なため、Arcserve UDP Applianceでエージェントレスバックアップを実現している。

ここまで至るまで、こうしたい・あーしたい、ということを裏付けを作りながら、説得力のある情報源を持っていれば、実現できるということを経験した。また、考えるのは自由、こういえば、ああ返す、というシナリオを、複数のパターンを自分なりで考え、それを体感的に身につけていき、聞かれたら即答できるぐらいの情報量を蓄積する、ということも重要だ。

文章が長くなってしまったため、この辺で…。

この記事が気に入ったらサポートをしてみませんか?