見出し画像

【後編:さくらインターネット事業説明会】副社長の舘野が語る、生成AI向けクラウドサービスについて

さくらインターネットは、メディア向けの事業説明会を2024年8月27日に実施しました。
当日のアーカイブは以下のURLよりご参照ください。

https://youtu.be/R-bZ3BT6C64

生成AI向けのクラウドサービス「高火力」の担当役員でもある副社長の舘野より発表した内容を記事化いたしました。ぜひご覧ください。

※「【前編:さくらインターネット事業説明会】代表の田中が語る、さくらインターネットについて」は以下をご参照ください。

▼生成AI向けクラウドサービスについて、取り組みの背景

<AIに関わる計算資源の安定供給を確保することは、日本の社会・産業の継続的な発展のために必要不可欠>
まずは当社が生成AI向けのクラウドサービス提供に取り組むことになった背景をお伝えします。
大前提として、AIに関わる計算資源の安定供給は非常に重要で、たとえ当社でなくても誰かがやる必要があると思っていました。「デジタル敗戦」という言葉があるように、特にスマートフォンやクラウドに関しては、外資のビッグテックに市場が寡占化されてしまっているように思います。AIの影響を受けない産業は無いとも言われる中、再度AI分野においても外資企業の寡占化が起きてしまうことは、日本としては避けた方が良いと私は考えています。

ご存知の通り、GPUは未だに需給が非常にタイトな状況が続いており、最新のGPUを大量に導入することは簡単なことではありません。また、外資のビッグテックは自社でAI開発をしているという背景もあり、外部企業にGPUリソースをほとんど提供していません。クラウドサービスとして提供されているものもありますが、本国でのサービス提供を優先しているので、外資のビッグテックが日本市場に最新のGPUリソースを潤沢に供給してくれることは考えにくいです。
このような背景から、日本に軸足を持っている企業が計算資源の安定供給をするべきではないかと考えていました。 

<「高火力コンピューティング」の提供経験>
当社は2016年から「高火力コンピューティング」というGPUリソースサービスを提供しており、生成AI向けクラウドサービス「高火力」もこの経験から生まれました。このサービスの提供により、GPUを用いたスパコンに関する技術的な知見、事業的な経験を積んできています。また、NVIDIAとの関係性もこの時期から構築されています。 

<消費電力量やCO2排出量を抑制して計算基盤の拡張を進めていく必要があり、当社および石狩データセンターが最適> 
消費電力量やCO2排出量を抑制して計算基盤の拡張を進めていく必要があるという点で、石狩データセンターを運営する当社がGPUサービスの提供事業者として最適であると考えています。
ご存知の通り、GPUは非常に大量の電力を使用します。GPUサーバー1台で9,000W~10,000Wの消費電力となり、これを一般家庭の消費電力に換算するとGPUサーバー1台で約20世帯以上分に相当します。 1台で約20世帯分ですので、100台設置すると約2,000世帯以上分の電力を消費します。この膨大な電力を使用するサービスを、再生可能エネルギーを利用し省電力性の高いデータセンターで提供することが日本社会、日本産業にとっても非常に重要です。北海道の冷涼な外気や豊富な再生可能エネルギーを活用している、当社の石狩データセンターで提供すべきだという結論に至りました。 

▼取り組みの内容

次に、経産省からの認可を受けた特定重要物資クラウドプログラムの供給確保計画の概要についてお話します。
第一次計画は、総事業費約130億円で2023年6月に経産省から認可を受けたものです。本計画は一年以上前倒しして、すでにGPUの整備を完了しております。これによりNVIDIA社の「H100」というGPUが約2,000基、当社の石狩データセンターで稼働しております。なお、すぐに多くのお申込みをいただき、すでに売り切れています。

第二次計画は、総事業費約1,000億円で2024年4月に経産省から認可を受けたものです。2027年度中に第一次計画分の計算能力2.0エクサフロップスと合わせ、合計18.9エクサフロップスを目指して事業推進をしています。また、GPU数は第一次計画の2,000基と合わせ、合計約10,000基を予定しています。

▼サービス提供までのタイムスパン

上記の表はサービス提供までのタイムラインです。非常にスケジュールがタイトな中、スピード感を持って対応を進めることができたという点がポイントです。

第一次計画に関しては2023年3月末から申請の検討を始め、その後10日ほどで事業計画のドラフトを作成、社内外での各種調整を経て2023年5月の取締役会で約130億円の投資を決議したという流れです。さらにその翌月、2023年6月には経済産業大臣の石狩データセンター視察もあり、まさに怒涛の展開でした。 
このような経緯を経て、2024年1月末にまずは第一弾としてベアメタルシリーズ「高火力 PHY」の提供開始に至りました。 

▼ベアメタルシリーズ「高火力 PHY」

生成AI向けクラウドサービス「高火力」の第一弾、ベアメタルシリーズ「高火力 PHY」についてご紹介します。
クラウドプログラムの供給確保計画の趣旨が、日本の社会産業に計算資源を提供していくということだった点、お客さまからも大規模言語モデル(LLM)などの大規模なトレーニングに対応できるコストパフォーマンスに優れた計算資源を提供してほしいという声を多くいただいた点から、まずはシンプルに月額料金形式でGPUサービスの提供を開始することになりました。

サーバー1台あたりNVIDIA社の「H100」が8基搭載されており、それだけで十分な性能がありますが、さらに大きな規模で利用されたいお客さまは数十台並べて同時に計算をするような使い方をされています。ですので、各サーバー間を400Gbps×4本のインターコネクトで接続する形態をとっています。 もちろん1台でも十分にご利用いただけますが、複数台同時にご利用いただくことでGPUクラスターとしての運用もできるサービスになっています。 

▼コンテナーシリーズ「高火力 DOK」

次に生成AI向けクラウドサービス「高火力」の第二弾、コンテナーシリーズ「高火力 DOK」についてご紹介します。
お客さまにDockerイメージをご用意いただき、それをタスクとして実行するだけで自動的に計算結果が出力されるという非常に手軽なサービスです。前述したベアメタルシリーズ「高火力 PHY」は月額料金形式でしたが、コンテナーシリーズ「高火力 DOK」は秒単位での従量課金形式です。 
2024年7月のサービス提供からすでにたくさんの反響があり、機能追加のご要望も多数いただいております。 単に計算をするためだけではなくサーバーとして使いたいというお声もいただいており、中でも特にご要望が多かった外部からのHTTPS接続機能に関しては現在機能実装中で、近日中に提供開始予定です。

提供開始以降「V100プラン」のみの提供でしたが、2024年8月27日より「H100プラン(β版)」の提供を開始しました。NVIDIA社の「H100」を1時間あたり1,008円(税込み)、1秒あたり0.28円(税込み)で利用可能な、リーズナブルなプランです。推論用途だけではなく、トレーニング用途にも十分お使いいただける内容です。これにより、さらにユースケースの幅が広がっていくのではと期待をしております。 

▼さくらインターネット、生成AI向けクラウドサービス「高火力」のコンテナーシリーズ「高火力 DOK」より、1秒から利用できる「NVIDIA H100プラン(β版)」を提供開始
https://www.sakura.ad.jp/corporate/information/newsreleases/2024/08/27/1968216352/

▼今後の展望①

最後に、今後の展望についてお伝えします。
現在、石狩データセンター4号棟の建設予定地だったエリアに、コンテナ型のデータセンターを構築しています。また2025年度以降もGPUサーバーを増設していくために、さらに追加でコンテナ型データセンターの建設を予定しています。これにより、4号棟の予定地にはコンテナ型データセンターが二棟建つ予定となります。 

現在提供中の「H100」用サーバーに関してはすべて空冷タイプを使っていますが、コンテナ型データセンターに収容するラックには水冷タイプのサーバーを設置予定です。これはコールドプレート形式と呼ばれるもので、いわゆる直接液冷方式(ダイレクトリキッドクーリング)というGPUサーバーを設置予定です。 
空冷サーバーの熱伝導率は高くなく、冷却効率が芳しくないので、1ラックにサーバーは2台ほどしか積めません。それ以上の台数を積んでしまうと、冷却が追いつかなくなります。無理やりに冷やそうとするとファンを過剰に動かすことになりますので、消費電力的にも非常に不利と言われているのが空冷のGPUサーバーです。 
一方このたび整備する水冷サーバーは、空冷と比べ熱伝導率的に圧倒的に優位です。今回コンテナ型データセンターを選択した理由の一つに、GPUサーバーを設置するという前提だと空冷に限界を感じていたこと、またコンテナ型のデータセンターにおいては水冷サーバーを導入しやすかったということがあります。 

また、いち早くGPUサーバーを日本の社会産業界に提供していきたいという思いから、建築確認が不要になり工期短縮が期待できるコンテナ型データセンターを選択しました。

▼今後の展望②

冒頭にもお伝えした通り、第二次供給確保計画として総事業費約1,000億円の投資を行い、2027年度に向けて合計10,000基のGPUを整備し、計算資源量は18.9エクサフロップスを目指して事業推進をしています。また、今は「H100」という現行世代のGPUに対し投資をしていますが、その都度最新世代のGPUに対して投資し続けていくという考えです。 

我々のアクションが日本の社会産業にとってポジティブなインパクトになるよう邁進していく所存ですので、今後のさくらインターネットにもぜひご期待ください。

舘野 正明(たての まさあき)
さくらインターネット株式会社 副社長 執行役員

茨城県出身。金沢大学経済学部卒業後、味の素株式会社に入社し、国内食品事業を中心に営業を10年経験。2002年にさくらインターネットに入社し、2004年に執行役員就任。以降、 ほぼすべての事業・サービスに企画担当・事業責任者として関わる。2008年に副社長就任。現在、経営戦略やマーケティングなどを管掌。ゲヒルン株式会社取締役兼任。​ 
生成AI向けのクラウドサービス「高火力」の担当役員を務める。

いいなと思ったら応援しよう!