見出し画像

ggplot2 を使った散布図の作成

ggplot2 を使用して、散布図 (scatter plot) を作成する例です。散布図は、2つのデータ(列)を比較して、同じような傾向があるかどうかを確認するために、よく使用されます。

データを生成

input_data <- tibble("Sample1" = rnorm(100),
                     "Sample2" = rnorm(100))

まず、例に使用するデータを生成します。input_data として、2つのサンプル (Sample1 と Sample2) に対して、ランダムな数字を100個ずつ生成(rnrom(100))しています。

> input_data
# A tibble: 100 × 2
   Sample1 Sample2
     <dbl>   <dbl>
 1  -1.42  -1.79
 2   0.998 -1.30
 3  -0.100 -2.06
 4   0.792  0.0890
 5  -0.172 -0.800
 6  -1.31   0.781
 7   1.28   0.698
 8   0.275 -0.884
 9   0.235 -0.708
10   0.331  0.536
# … with 90 more rows

ggplot に使用するデータを指定

続いて、 ggplot の基本形で解説しているように、ggplot() に「使用するデータ」と、「どの列を使用するか」を指定します。どの列を使用するかは、aes() を忘れずに使用してください。この場合、散布図のX軸に Sample1 を、Y軸に Sample2 を指定しています。

g <- ggplot(input_data, aes(Sample1, Sample2))

geom_point() で散布図を表示

散布図なので、 geom_point() 関数を指定します。

g + geom_point()

これで下記のような散布図が表示されます。今回は、2つのランダムなデータなので、下図のように、点は広がった状態になります。もし、XとYに指定した2つのデータに相関関係が見られるのであれば、散布図では、左下から右上にかけて点が集まって見えるはずです。 (y = x の直線をイメージすると分かりやすいです。)

散布図 scatter plot
散布図の例

ggsave で画像の保存

ggsave("ファイル名.png") のように、ファイル名を指定して画像を保存します。保存形式は、拡張子で自動的に判別されます。この場合は、 PNG 形式で出力されます。 PDF など、その他の形式にも対応しています。

ggsave("scatter_plot.png")


この記事が気に入ったらサポートをしてみませんか?