見出し画像

MSの「水中データセンターの信頼性は地上の8倍」が示すニューノーマル

昨朝、マイクロソフトの真壁さんが次のようなTweetをされていました。

スコットランド沖にデータセンタを沈めて2年。引き上げてみたら故障率が地上比1/8で、詰めた窒素と、人が触って衝撃を与えないことの影響ではないか、と。 / Microsoft finds underwater datacenters are reliable, practical and use energy sustainably
Toru Makabe 午前8:33 · 2020年9月15日

非常に興味深い話で、寝る前の一時でメモをつくろうと思っていたのですが、noteを開いてみるとタイムラインにちょうど、ほりまさたけさんの「マイクロソフトがデータセンターを海の底に沈めた実験が大成功」が流れてきたところだったのでした。仕事が早いです。それでもまあ、僕なりにMSのストーリーなどを読み込んで気づいたことをまとめてみましょう。そしてこの実験から僕が思うこと、ずっと思っていた「サーバールームとオペレーションルームの分離徹底」はニューノーマルに入ってもいいのではということを書いてみたいと思います。

Microsoftの水中データセンター実験

今年の夏の初めに、海の専門家がスコットランドのオークニー諸島沖の海底から藻、フジツボ、イソギンチャクで覆われた輸送コンテナサイズのデータ​​センターを巻き上げました。この回収により、水中データセンターの概念が実現可能であるだけでなく、ロジスティック、環境、経済的に実用的であることが証明された、長年にわたる取り組みの最終段階が始まりました。

こう始まるMicrosoftの記事によれば、同社は2018年に水中設置用に設計されたデータセンターコンテナを海底に沈めました。

記事では海の利点として「冷却しやすい」「潮力、波力、風力、太陽光等でのクリーンな発電を利用しやすい」を挙げています。これはグリーンITでは古くからあるアイデアで、例えばGoogleは2008年に海上データセンターの特許を出願し2009年に取得、2013年にはそれらしき施設を建設中と報じられました。Microsoftはそうしたことに加えて「世界人口の半分以上が海岸から120マイル(200km弱)以内に」住んでいるので、その近接地にデータセンターを置くのは通信環境的にも理に適っているとしています。

「ロジスティック、環境、経済的に実用的であることが証明された」とは、こうした仮説が実証されたということになります。

データセンター無人化による劇的な故障率改善

そしてもう一つ、今回実証されたのは、このコンテナ内のデータセンターでは機器故障が実に1/8だったとのこと。

実はMicrosoftとって、これは2つ目の水中無人データセンターです。2015年に行われた最初の実験は3か月という短期間、写真で見る限りありふれた1ラックのサーバー群を収めた小さなもので、電力供給や無人運用などと言った水底データセンターの実現性と、こうしたものを海底に設置することが自然環境や生態系を壊さないか確認されました。周辺水温は数千分の一度の上昇にとどまり騒音もほとんどなく、周辺に生息するカニやタコの住居にもなった(TechCrunch)と結果は良好だったようです。

画像1

水中データセンターの実現可能性を確認した同社は、次に「仮説では、窒素は酸素よりも腐食が少ないほか、部品にぶつかったりする人間もいないため、地上にあるデータセンターよりも海中のデータセンターのほうが信頼性が高まる」ことを確認する実験に移りました。このため海中データセンターは一般的な部品で構成され、一方で比較用のレプリカデータセンターが陸上に用意されてまでいます。

影響を分析するため、マイクロソフトは同様の容器を陸上にも設置し、どれくらいシステムがうまくいくかを比べることにしている。今回の実験では最先端のテクノロジーは使われていない、とCutlerは強調する。特殊なサーバーを使っているわけではなく、海中ケーブルや容器もごく普通のものだ。
マイクロソフトが海中にデータセンターを設置する理由とは | TechCrunch Japan

今回の水中データセンターは、12サーバーラック搭載のサーバールーム並と言えるサイズのデータセンターコンテナを2年間の海底に沈めて長期運用するという規模になっています。加えて、食品包装パックが酸化防止のために窒素などの不活性ガスが充填されているように、このコンテナ内も同目的で窒素充填されています。

画像2

この結果は「水中のデータセンターのサーバーは、陸上のレプリカデータセンターのサーバーよりも8倍高い信頼性がありました」としています。それが本当に人立ち入り禁止と窒素充電の効果だったのかは、これから故障機材の調査で確認していくようです。

収集されレドモンドに搬送されたコンポーネントの中には、故障したサーバーと関連ケーブルがあります。研究者たちは、このハードウェアは、水中のデータセンターのサーバーが陸上のサーバーの8倍の信頼性がある理由を理解するのに役立つと考えています。(略)チームは、酸素よりも腐食性が低い窒素の大気構成、およびコンポーネントをぶつけたり押したりする人々の不在が違いの主な理由であると仮定しています。

Microsoftは「分析によりこれが正しいことが判明した場合、チームは調査結果を陸上のデータセンターに転用できる可能性があります」と記事に記しています。窒素充填された空間で人は生きられないので、この成果が転用されたデータセンターでは、陸上ではあっても「人の出入りは控える」レベルでなく「人は中にいられない」無人データセンター、少なくとも無人サーバールームになるのでしょう。

冷却効率とデータセンターという極地労働

水中データセンターでは冷たい海流が冷却効率に大きく寄与しますが、それがない陸上データセンターでは、無人化はサーバールームの冷却効率にも大きくかかわりそうに思います。人の出入りは冷やされていない外気を持ち込みますし、人体自体も36℃もの温度がある50kg~の質量の熱の塊です。しかもデータセンターが頑張って冷却すると、人体の方は体温を維持しようと体内で熱を作るという熱源です。ここでは冷却と熱産生がお互いを削り合う悪循環が起こります。

人の側から見るならば、冷え続けていないといけないサーバールームは、冷え続けていると体を壊す人間にとって過酷な「極地」です。まだクラウドコンピューティングが存在しなかった入社当時、上司が私に教え込んだのは「30分作業したら外に出て10分休憩すること」でした。夏場でもデータセンターに出向くときは、厚手のコーデュロイジャケットを携行しました。かなり「非人間的スペース」だと以下の記事がいくつかの理由から紹介しています。

サーバールームでは意外と人が働いているものです。いまだに、システムエンジニアがサーバーラックに据え付けられたコンソールをにらみキーボードをたたいたりしています。保守員が定期的に各サーバーを目視し、異常を示すLEDが点灯していないか確認して定期報告していたりします。もし故障があれば調査から復旧まで、技術者がその前に張り付きます。

MSの実験から考えるデータセンターのニューノーマル

MSの実験結果が示す「新しいデータセンターのあり方」が無人化であることは間違いないでしょう。そしてサーバールームという極地での労働をロボット化しようという動きもすでにあります。例えば、掃除ではなく保守員の代わりにサーバールームを巡回するRoombaです。

IBMやEMCといった企業は既に、「Roomba」のカスタマイズ可能なバージョンである「iRobot Create」を用いて、データセンターを巡回し、温度や湿度、空気の流れといった環境要素を捕捉したり、資産管理を行うロボットを開発している。
未来のデータセンターを支えるロボット工学 - ZDNet Japan

IIJ白井データセンターキャンパスでは、巡回業務に加えて来訪者アテンドもフィジカルロボットに任せて無人化しているようです。保守交換もロボット化が期待されていますが、課題もあり技術的なチャレンジとなっているといいます。

企業はロボット工学の力を最大限に活用するために、データセンターを大々的に改修する必要が出てくる。現代のラックやサーバ機器は、ロボットによる制御を念頭に置いて設置されているわけではないのだ。Kleyman氏は「ロボットがその役割を効率的に果たせるように、配線やネットワーク系統を見直す必要があるだろう」と述べている。
未来のデータセンターを支えるロボット工学 - ZDNet Japan

しかしMSの実験内容が示す「新しいデータセンターの実践」には、そこまで技術的なチャレンジを含まないものもあります。同社が「ごく普通のもの」だけで作ったデータセンターを海中に沈めた際、2015年の実験の際でも、もちろん3か月間そこに出入りせず「研究者たちはMicrosoftのレドモンドキャンパスの99号館にあるオフィスから」水中のサーバーにアクセスして作業していました。

データセンターは、サーバールームとオペレーションルームを分けることを「標準」に加えてもいいように思います。機器設置者がいまでもサーバーラックの前に張り付くのは、遠隔操作のためのテクノロジー(例えばHPのiLO、富士通のiRMC、DeLLの iDRAC)がないからではなく、それらをつなぐネットワークやそのネットワークにつながったデータセンター内の作業場所がないからだと思います。

データセンター内からのみ操作といった広く聞かれる要件に答えつつ、サーバールーム内に人を極力滞在させないには、データセンター側の設備とルールが必要なのです。ロボット化や窒素充填と違い、技術的なチャレンジというものではありません。そして「極地」労働や現場作業を見直す、新しい働き方を支えるものでもあります。

まずサーバールームとオペレーションルームを分けること。それを標準として、徹底的に例外廃止を進めること。それにより故障率低減、エネルギー効率上昇を図ること、利用企業の新しい働き方にも寄与すること。MSの実験結果から学べる、特別な企業でなくても検討を始められる新しい普通、データセンターのニューノーマルはその辺から始まるのではないでしょうか。

この記事が気に入ったらサポートをしてみませんか?