見出し画像

Dockerを使ったお手軽GPUベンチマーク! 【ハイエンドGPU5種類で検証】

こんにちは!まあもです.
Deep Learning用に購入していたPalit製のGeforce 4090が2つ届きました.ドスパラさんで買ったのですが,ポチった翌日に届いてびっくりしました.

クソデカです…
30万円弱でした

さて,今回4090をせっかく買ってみたのでベンチマークを取ってみようと思いました.ついでにと言ってはあれですが,そのほかの自分が所有しているGPUたちの結果と比較してみます.

比較実験

今回ベンチマーク使ったGPUは,以下の5種類です:

  • Geforce RTX 2080ti

  • Geforce RTX 3090

  • Geforce RTX 4070ti super

  • Geforce RTX 4090

  • RTX A6000

今回はシングルGPUの計測になりますので以下のコマンドを実行し,ベンチマークをとりました.

$ docker run --rm --gpus all nvcr.io/nvidia/k8s/cuda-sample:nbody nbody -gpu -benchmark -numbodies=1280000 -fp 32

-numbodies=<n>の部分は,256の倍数を指定して計算時間を増やします.
私は,-numbodies=128000にしました.

実行結果をまとめると,以下のようになりました.

$$
\begin{array}{c||c|c|c|c|c} \hline
\textbf{GPU} & \textbf{合計時間}& \textbf{相互作用数 (1秒あたり)} & \textbf{GFLOP/s (単精度)} \\ \hline
\text{2080ti}  & 31729.607 \text{ ms} & 516.363 \text{ billion} & 10327.263 \\ \hline
\text{3090}  & 16970.902 \text{ ms} & 965.417 \text{ billion} & 19308.343 \\ \hline
\text{4070ti SUPER}  & 13580.567 \text{ ms} & 1206.430 \text{ billion} & 24128.594 \\ \hline
\text{4090}  & 7977.246 \text{ ms} & 2053.842 \text{ billion} & 41076.835 \\ \hline
\text{A6000}  & 16830.328 \text{ ms} & 973.481 \text{ billion} & 19469.614 \\ \hline
\end{array}
$$

合計時間を見てみると,4090はA6000と3090よりも,2倍ほど計算時間が短縮できているようです.同様にGFLOP/sをみても,4090が最も強力な計算能力を持っているのがわかって,2台も買った甲斐がありました(?).

これから4090君にはフル稼働してもらって,ゴリゴリ計算をしていってもらおうと思います!電気代は考えてません笑
今後GPUを購入する人の参考になれば幸いです.
ではまた.


この記事が気に入ったらサポートをしてみませんか?