Dockerを使ったお手軽GPUベンチマーク! 【ハイエンドGPU5種類で検証】
こんにちは!まあもです.
Deep Learning用に購入していたPalit製のGeforce 4090が2つ届きました.ドスパラさんで買ったのですが,ポチった翌日に届いてびっくりしました.
さて,今回4090をせっかく買ってみたのでベンチマークを取ってみようと思いました.ついでにと言ってはあれですが,そのほかの自分が所有しているGPUたちの結果と比較してみます.
比較実験
今回ベンチマーク使ったGPUは,以下の5種類です:
Geforce RTX 2080ti
Geforce RTX 3090
Geforce RTX 4070ti super
Geforce RTX 4090
RTX A6000
今回はシングルGPUの計測になりますので以下のコマンドを実行し,ベンチマークをとりました.
$ docker run --rm --gpus all nvcr.io/nvidia/k8s/cuda-sample:nbody nbody -gpu -benchmark -numbodies=1280000 -fp 32
-numbodies=<n>の部分は,256の倍数を指定して計算時間を増やします.
私は,-numbodies=128000にしました.
実行結果をまとめると,以下のようになりました.
$$
\begin{array}{c||c|c|c|c|c} \hline
\textbf{GPU} & \textbf{合計時間}& \textbf{相互作用数 (1秒あたり)} & \textbf{GFLOP/s (単精度)} \\ \hline
\text{2080ti} & 31729.607 \text{ ms} & 516.363 \text{ billion} & 10327.263 \\ \hline
\text{3090} & 16970.902 \text{ ms} & 965.417 \text{ billion} & 19308.343 \\ \hline
\text{4070ti SUPER} & 13580.567 \text{ ms} & 1206.430 \text{ billion} & 24128.594 \\ \hline
\text{4090} & 7977.246 \text{ ms} & 2053.842 \text{ billion} & 41076.835 \\ \hline
\text{A6000} & 16830.328 \text{ ms} & 973.481 \text{ billion} & 19469.614 \\ \hline
\end{array}
$$
合計時間を見てみると,4090はA6000と3090よりも,2倍ほど計算時間が短縮できているようです.同様にGFLOP/sをみても,4090が最も強力な計算能力を持っているのがわかって,2台も買った甲斐がありました(?).
これから4090君にはフル稼働してもらって,ゴリゴリ計算をしていってもらおうと思います!電気代は考えてません笑
今後GPUを購入する人の参考になれば幸いです.
ではまた.
この記事が気に入ったらサポートをしてみませんか?