Dockerを使ったお手軽GPUベンチマーク！【ハイエンドGPU5種類で検証】

荒井まあも

2024年6月16日 14:05

こんにちは！まあもです．
Deep Learning用に購入していたPalit製のGeforce 4090が2つ届きました．ドスパラさんで買ったのですが，ポチった翌日に届いてびっくりしました．

さて，今回4090をせっかく買ってみたのでベンチマークを取ってみようと思いました．ついでにと言ってはあれですが，そのほかの自分が所有しているGPUたちの結果と比較してみます．

比較実験

今回ベンチマーク使ったGPUは，以下の5種類です:

Geforce RTX 2080ti
Geforce RTX 3090
Geforce RTX 4070ti super
Geforce RTX 4090
RTX A6000

今回はシングルGPUの計測になりますので以下のコマンドを実行し，ベンチマークをとりました．

$ docker run --rm --gpus all nvcr.io/nvidia/k8s/cuda-sample:nbody nbody -gpu -benchmark -numbodies=1280000 -fp 32

-numbodies=<n>の部分は，256の倍数を指定して計算時間を増やします．
私は，-numbodies=128000にしました．

実行結果をまとめると，以下のようになりました．

$$
\begin{array}{c||c|c|c|c|c} \hline
\textbf{GPU} & \textbf{合計時間}& \textbf{相互作用数 (1秒あたり)} & \textbf{GFLOP/s (単精度)} \\ \hline
\text{2080ti} & 31729.607 \text{ ms} & 516.363 \text{ billion} & 10327.263 \\ \hline
\text{3090} & 16970.902 \text{ ms} & 965.417 \text{ billion} & 19308.343 \\ \hline
\text{4070ti SUPER} & 13580.567 \text{ ms} & 1206.430 \text{ billion} & 24128.594 \\ \hline
\text{4090} & 7977.246 \text{ ms} & 2053.842 \text{ billion} & 41076.835 \\ \hline
\text{A6000} & 16830.328 \text{ ms} & 973.481 \text{ billion} & 19469.614 \\ \hline
\end{array}
$$

合計時間を見てみると，4090はA6000と3090よりも，2倍ほど計算時間が短縮できているようです．同様にGFLOP/sをみても，4090が最も強力な計算能力を持っているのがわかって，2台も買った甲斐がありました（？）．

これから4090君にはフル稼働してもらって，ゴリゴリ計算をしていってもらおうと思います！電気代は考えてません笑
今後GPUを購入する人の参考になれば幸いです．
ではまた．

Dockerを使ったお手軽GPUベンチマーク！ 【ハイエンドGPU5種類で検証】

比較実験

いいなと思ったら応援しよう！

Dockerを使ったお手軽GPUベンチマーク！【ハイエンドGPU5種類で検証】