ARMベースのAWS イーロン・マスク氏は、Grok 3.0のトレーニング用に10万個のNvidia GPUを搭載したスーパーコンピューターの構築を計画

AWS Graviton4ベースのAmazon EC2 R8gインスタンス:Amazon EC2で最高の価格性能比を提供します。本日、re:Invent 2023以降プレビューで利用可能だった新しいAWS Graviton4ベースのAmazon Elastic Compute Cloud(Amazon EC2)R8gインスタンスが、一般に公開されたことを非常に嬉しく思います。AWSは、世界規模で150種類以上のAWS Graviton駆動のAmazon EC2インスタンスタイプを提供し、200万個以上のGravitonプロセッサを製造し、50,000人以上の顧客がAWS Gravitonベースのインスタンスを使用して、アプリケーションに最適な価格性能比を実現しています。
AWS Graviton4は、Amazon EC2で実行される幅広いワークロードに対して、これまでに設計された中で最も強力でエネルギー効率の高いプロセッサです。他のAWS Gravitonプロセッサと同様に、AWS Graviton4は64ビットArm命令セットアーキテクチャを使用しています。AWS Graviton4ベースのAmazon EC2 R8gインスタンスは、AWS Graviton3ベースのAmazon EC2 R7gインスタンスよりも最大30%優れたパフォーマンスを提供します。これにより、高性能データベース、インメモリキャッシュ、リアルタイムビッグデータ分析など、最も要求の厳しいワークロードのパフォーマンスを向上させることができます。
re:Invent 2023でのプレビュー発表以来、Epic Games、SmugMug、Honeycomb、SAP、ClickHouseを含む100社以上の顧客が、AWS Graviton4ベースのR8gインスタンスでワークロードをテストし、比較可能なインスタンスよりも顕著なパフォーマンス向上を観察しました。SmugMugは、AWS Graviton4ベースのインスタンスを使用して、画像およびデータ圧縮操作でAWS Graviton3ベースのインスタンスと比較して20-40%のパフォーマンス向上を達成しました。Epic Gamesは、AWS Graviton4インスタンスがこれまでにテストしたEC2インスタンスの中で最も高速であると発見し、Honeycomb.ioは4年前に使用していた非Gravitonベースのインスタンスと比較して、vCPUあたりのスループットが2倍以上になりました。
新しいインスタンスで利用可能にした改善点をいくつか見てみましょう。R8gインスタンスは、R7gインスタンスよりも最大3倍のvCPU(最大48xlまで)、3倍のメモリ(最大1.5TBまで)、75%多いメモリ帯域幅、2倍のL2キャッシュを提供します。これにより、より多くのデータを処理し、ワークロードをスケールアップし、結果までの時間を短縮し、TCOを削減することができます。R8gインスタンスは、Graviton3ベースのインスタンスでの最大30Gbpsのネットワーク帯域幅および最大20GbpsのEBS帯域幅に対して、最大50Gbpsのネットワーク帯域幅および最大40GbpsのEBS帯域幅を提供します。
R8gインスタンスは、2つのベアメタルサイズ(metal-24xlおよびmetal-48xl)を提供する最初のGravitonインスタンスです。インスタンスのサイズを適切に調整し、物理リソースへの直接アクセスが有益なワークロードをデプロイできます。R8gインスタンスの仕様は次のとおりです:炭素足跡を削減し、持続可能性の目標を達成するために、よりエネルギー効率の高いコンピューティングオプションを探している場合、R8gインスタンスはEC2でメモリ集中型ワークロードに最適なエネルギー効率を提供します。さらに、これらのインスタンスはAWS Nitro System上に構築されており、CPUの仮想化、ストレージ、およびネットワーキング機能を専用のハードウェアおよびソフトウェアにオフロードして、ワークロードのパフォーマンスとセキュリティを向上させます。Graviton4プロセッサは、すべての高速物理ハードウェアインターフェースを完全に暗号化することで、強化されたセキュリティを提供します。
R8gインスタンスは、Amazon Elastic Kubernetes Service(Amazon EKS)、Amazon Elastic Container Service(Amazon ECS)、Amazon Elastic Container Registry(Amazon ECR)、Kubernetes、Dockerを使用して構築されたコンテナ化およびマイクロサービスベースのアプリケーションを含む、すべてのLinuxベースのワークロードに理想的です。また、C/C++、Rust、Go、Java、Python、.NET Core、Node.js、Ruby、PHPなどの一般的なプログラミング言語で書かれたアプリケーションにも適しています。AWS Graviton4プロセッサは、AWS Graviton3プロセッサよりもウェブアプリケーションで最大30%、データベースで40%、大規模なJavaアプリケーションで45%高速です。詳細については、AWS Gravitonテクニカルガイドをご覧ください。
Gravitonインスタンスタイプへのアプリケーションの移行を開始するためのGravitonリソースのコレクションをチェックしてください。また、Graviton採用の旅を始めるために、AWS Graviton Fast Startプログラムを訪れることもできます。
現在利用可能 R8gインスタンスは、本日より米国東部(バージニア北部)、米国東部(オハイオ)、米国西部(オレゴン)、ヨーロッパ(フランクフルト)のAWSリージョンで利用可能です。
R8gインスタンスは、リザーブドインスタンス、オンデマンド、スポットインスタンス、セービングプランを通じて購入できます。詳細については、Amazon EC2の価格をご覧ください。
https://aws.amazon.com/jp/blogs/aws/aws-graviton4-based-amazon-ec2-r8g-instances-best-price-performance-in-amazon-ec2/

要約 AWSは、新しいAWS Graviton4ベースのAmazon EC2 R8gインスタンスを一般公開しました。これらのインスタンスは、AWS Graviton3ベースのR7gインスタンスよりも最大30%高いパフォーマンスを提供し、高性能データベースやリアルタイムビッグデータ分析などの要求の厳しいワークロードに適しています。AWS Graviton4は、64ビットArm命令セットアーキテクチャを使用し、エネルギー効率が高く、セキュリティが強化されています。R8gインスタンスは、Linuxベースのワークロードやコンテナ化されたアプリケーションに理想的で、ウェブアプリケーション、データベース、JavaアプリケーションにおいてGraviton3よりも高速です。現在、米国東部(バージニア北部)、米国東部(オハイオ)、米国西部(オレゴン)、ヨーロッパ(フランクフルト)のAWSリージョンで利用可能です。詳細は、AWS GravitonテクニカルガイドまたはAmazon EC2 R8gインスタンスのページを参照してください。


Graviton4プロセッサとは何ですか?

Graviton4プロセッサは、AWSが独自に開発した最新のCPUで、Amazon EC2上で実行される幅広いワークロードをサポートすることを目的としています。64ビットArm命令セットアーキテクチャを採用し、前世代のGraviton3に比べてコア数が1.5倍、メモリ帯域が75%広がっています。これにより、優れたコストパフォーマンスとエネルギー効率を実現しており、特にデータベースやWebアプリケーション、大規模なJavaアプリケーションの処理において、Graviton3よりもそれぞれ40%、30%、45%高速です。また、全物理ハードウェアインターフェースの暗号化によるセキュリティ水準の向上も特徴の一つです。

Graviton4プロセッサのアーキテクチャについて詳しく教えてください

AWS Graviton4プロセッサは、AWSが独自に開発した最新のCPUで、arm64アーキテクチャベースです。Graviton4は、Neoverse V2コアを96個搭載し、コアごとに2MBのL2キャッシュを持っています。また、DDR5-5600のメモリチャンネルが12個あり、PCIe gen 5が96レーン搭載されているため、非常に高速なデータ処理が可能です
Graviton4は、Graviton3と比較してコア数が50%増加し、DRAMアクセス能力も3倍になっています。これにより、データベースやWebアプリケーション、大規模なJavaアプリケーションの処理が、それぞれ40%、30%、45%高速化されています
セキュリティ面では、全ての物理ハードウェアインターフェースを暗号化することで、強化されたセキュリティを提供しています。この高性能なプロセッサは、特にメモリ集中型のワークロードや、高速なコンピューティングが求められるアプリケーションに適しており、AWSのEC2インスタンスタイプであるR8gインスタンスに搭載されています。Graviton4を使用することで、エネルギー効率とコストパフォーマンスを大幅に向上させることができます。興味がある場合は、AWS Gravitonテクニカルガイドを参照することをお勧めします。

イーロン・マスク氏のAI開発会社であるxAIとオラクルの間で進行していたサーバーレンタル契約の拡大に関する協議が終了しました。交渉は、タイムラインと電力供給に関する意見の相違により決裂したと報じられています123。
現在、xAIはテネシー州メンフィスに自社のAIデータセンターを建設中であり、このプロジェクトにはDellとSupermicroから購入したNvidiaチップが使用されています。また、xAIはOracleから既に約16,000個のNvidiaチップをレンタルしており、今後もその利用を継続する予定です。
イーロン・マスク氏は、Grok 3.0のトレーニング用に10万個のNvidia GPUを搭載したスーパーコンピューターの構築を計画しています。一方で、OracleはMicrosoftとの間でOpenAIにNvidia搭載サーバーを提供する契約を締結し、この契約にはNvidiaの次期GB200チップ10万個が含まれているとされています。
この取り決めには2年間で約50億ドルの費用がかかると見積もられており、新しいチップクラスターは2025年第2四半期までにテキサス州アビリーンに設置される予定です。さらに、xAIはOracleから24k H100を契約し、現在Grok 2をそれらでトレーニングしており、来月にはリリースされる可能性があります。
xAIは、世界で最も強力なトレーニングクラスターを目指して、100k H100システムを自社で構築しています。この決定は、他のAI企業よりも速く進むことがxAIの基本的な競争力にあるとされています。Oracleは引き続き重要なクラウドサービスプロバイダーであり、OpenAIのGB200クラスターに関与しているなど、有望な企業との関係を維持しています

関連1)
イーロン・マスク氏が設立したAI企業、xAIは、自社のAI開発用データセンターを建設することを発表しました。当初はクラウドサービス大手のオラクルとの協業が検討されていましたが、最終的には独自にデータセンターを手掛けることになりました。これにより、クラウドサービスプロバイダーへの依存を避ける方針です。
xAIは、5月に60億ドルの資金調達を行い、その資金を使ってテネシー州にAI開発の拠点を設立する計画です。この動きは、AI技術の進展とともに、自社のインフラストラクチャを持つことの重要性が高まっていることを示しています。

この記事が気に入ったらサポートをしてみませんか?