見出し画像

生成AI向けクラウドサービスの提供計画について~2023年6月19日開催の「『2EFの大規模クラウドGPUインフラ』整備についての説明会」レポート~

さくらインターネットは、2023年6月16日に民間で初めて、経済安全保障推進法に基づく特定重要物資である「クラウドプログラム」の供給確保計画に関する経済産業省の認定を受けました。それに伴い、AI時代を支えるGPUクラウドサービスの提供に向けて、3年間で130億円規模の投資をし、「NVIDIA H100 Tensor コア GPU」を搭載した、合計2EF(Exa FLOPS)※1の大規模クラウドインフラを整備することを発表いたしました。
※1 半精度、Sparsity Accelerationなし

そして2023年6月19日に報道機関に向けて、「『2EFの大規模クラウドGPUインフラ』整備についての説明会」を行いました。本記事では、会にて副社長および執行役員の舘野が「生成AI向けクラウドサービスの提供計画について」と題し、説明を行った内容を紹介します。

生成AIのためのCO2を排出しない計算資源の安定確保

今回の取り組みの背景として、まず1点目は、皆さまご存じの通り、生成AIが世界を席巻してきている中、生成AIのための計算資源の確保が「日本の社会・産業の発展のために非常に重要になってきている」、という点です。

そして、2点目は、それら計算基盤の安定供給や拡張を、消費電力、CO2排出量などをなるべく抑えて実現する必要があるという点です。GPUは電力を大量に消費しますので、環境面も重要な論点になるとさくらインターネットは考えております。

北海道ならではの冷涼な外気を活用した消費電力の低さと、土地・建物・電力といった部分の拡張性があります。2016年からの高火力のコンピューティングの開発・運用経験などのノウハウもあるため、我々さくらインターネットが貢献できると考えております。

なお、高火力コンピューティングの事例でいいますと、2019年からNICT様(情報通信研究機構)の「VoiceTra」というディープラーニング翻訳のためのGPUコンピューティング基盤の提供もさせていただいております。

3年間で130億円規模の投資についてのロードマップ

6月16日にGPUクラウドサービスの供給確保計画の認定を受けまして、2024年1月以降のサービス提供開始を予定しております。

肝心の計算資源の拡張計画に関して言いますと、今年度32億の投資をするということで取締役会にて決議しております。これはおよそ0.5EFほどの計算資源です。「NVIDIA H100 Tensor コア GPU」で換算をすると約500基になります。

その後の拡張に関しては、売れ行き次第なところもございますが、現時点の計画では2025年度には2.0EFに到達する計画になっております。もちろん、状況次第で前倒しもありえると考えております。現在、すでにいくつかのお客様と会話を進めており、「0.5EFほしい」、「1.0EFほしい」といったお声をいただいております。これらのお声から考えますと、1年くらい前倒しになる可能性もあると考えております。

データセンターについては、まずは既存の設備を活用し、スピーディーにサービスの立ち上げを行いたいと考えております。その後、2EFを超える拡張も見据えて、石狩3号棟にサーバールームを増設する計画を進めております。

 スタートアップ~エンタープライズまで、お客様にとって使いやすいサービスを実現

取り組み内容の1点目は、繰り返しになりますが3年間で130億円規模の投資を行い、2EFの計算資源を確保しGPUクラウドサービスの提供を行います。GPUの投資は非常に前倒しになる可能性もありますが3年間で集中的に実施します。しかし、GPUの減価償却や耐用年数などの兼ね合いもあるため、事業対象期間は2028年度までとさせていただいております。電力費などの周辺コストも併せまして、総事業費は135億円を予定しています。

サービス提供開始は2024年の1月以降を予定していますが、それ以前に「無償トライアル」や「アーリーアクセス(有償での先行利用)」を実施して、お客様にできる限り早く計算資源を活用いただけるように努めてまいります。

2点目に関しては、スタートアップ~エンタープライズまでの幅広いお客様、幅広いユースケースでも利用しやすいサービスを提供したいと考えております。そのために、先ほど触れた「無償トライアル」や「アーリーアクセス」といったもので、お客様の生の声をお聞きして、GPUのラインアップや料金形態を検討してまいります

GPUのラインアップに関しては「NVIDIA H100 Tensor コア GPU」だけではなく、「NVIDIA L40 GPU」や「NVIDIA L4 Tensor コア GPU」の計3種を予定しております。しかし、現時点で「『NVIDIA H100 Tensor コア GPU』が欲しい」というお客様が多くいらっしゃるという点と、サービス提供開始時は物理サーバーベースでの提供となることが想定されておりますため、おそらく提供開始時は「NVIDIA H100 Tensor コア GPU」が中心となり、そこからサービス内容の拡充に合わせてGPUラインアップも増やしていく予定となっております。

2.0EFを超える拡張に向けてサーバールームを増設予定

さくらインターネットは、「常に余白を残す」というポリシーで経営を行っているため、石狩データセンターも常に空きサーバールームを確保しております。そのため、今回の件も迅速な立ち上げが可能です。まずは、この空きサーバールームに0.5EFの設備をまずは設ける予定です。

そして、将来の事業拡大を見据えてサーバールームの拡張を行います。石狩データセンターの3号棟ですと、1サーバールームで1MW(Mega Watt)の電源容量があるため、約1.5EFの「NVIDIA H100 Tensor コア GPU」の設備を設けることができます。

電力に関しましては、今年の6月より石狩データセンターは水力発電を中心とした再生可能エネルギー100%の電力を活用し運営しています。つまり、今回提供を予定しているGPUクラウドサービスはCO2排出量がゼロのサービスとなります。

また、北海道にある石狩データセンターならではの冷涼な外気を活用した冷房構造のため、東京などの都市型データセンターと比較しますと空調部分の電力コストを抑えることができ、非常に環境負荷が少ないサービスとして提供が可能となっております。

特別高圧の受電容量についても、30MWと現時点で非常に大きな余力があります。そのため、大規模な投資ができれば既存の3号棟だけでもサーバールームを増設すれば、10EF規模の計算資源を提供可能です。

そして、石狩データセンターは最大で5棟建設可能な土地があります。4号棟、5号棟と新棟を建設すれば20~30EF規模の拡張ができます。

日本の社会や産業の課題解決や、継続的な発展に貢献

最後にまとめとなります。今後3年間で130億円規模の投資を行い、2.0EFの計算資源を整備します。そして、整備を行った計算資源をスタートアップ~エンタープライズのお客様まで幅広く活用いただける生成AI向けクラウドサービスとして提供します。それにより、さくらインターネットとして、日本の社会や産業の課題解決や、継続的な発展に貢献してまいります。

舘野 正明(たての まさあき)
さくらインターネット株式会社 副社長 執行役員

 
ガバメント領域の担当役員。以前は、GPUサービス「高火力コンピューティング」も担当。
 
茨城県出身。金沢大学経済学部卒業後、味の素に入社し、国内食品事業を中心に営業を10年経験。2002年に畑違いのさくらインターネットに入社し、2004年以降のほぼすべての事業・サービスに企画担当・事業責任者として関わる。2019年からは経営企画に軸足を移し、2020年より現職。ゲヒルン株式会社取締役兼任。


この記事が気に入ったらサポートをしてみませんか?