ggplot2 を使った散布図の作成
ggplot2 を使用して、散布図 (scatter plot) を作成する例です。散布図は、2つのデータ(列)を比較して、同じような傾向があるかどうかを確認するために、よく使用されます。
データを生成
input_data <- tibble("Sample1" = rnorm(100),
"Sample2" = rnorm(100))
まず、例に使用するデータを生成します。input_data として、2つのサンプル (Sample1 と Sample2) に対して、ランダムな数字を100個ずつ生成(rnrom(100))しています。
> input_data
# A tibble: 100 × 2
Sample1 Sample2
<dbl> <dbl>
1 -1.42 -1.79
2 0.998 -1.30
3 -0.100 -2.06
4 0.792 0.0890
5 -0.172 -0.800
6 -1.31 0.781
7 1.28 0.698
8 0.275 -0.884
9 0.235 -0.708
10 0.331 0.536
# … with 90 more rows
ggplot に使用するデータを指定
続いて、 ggplot の基本形で解説しているように、ggplot() に「使用するデータ」と、「どの列を使用するか」を指定します。どの列を使用するかは、aes() を忘れずに使用してください。この場合、散布図のX軸に Sample1 を、Y軸に Sample2 を指定しています。
g <- ggplot(input_data, aes(Sample1, Sample2))
geom_point() で散布図を表示
散布図なので、 geom_point() 関数を指定します。
g + geom_point()
これで下記のような散布図が表示されます。今回は、2つのランダムなデータなので、下図のように、点は広がった状態になります。もし、XとYに指定した2つのデータに相関関係が見られるのであれば、散布図では、左下から右上にかけて点が集まって見えるはずです。 (y = x の直線をイメージすると分かりやすいです。)
ggsave で画像の保存
ggsave("ファイル名.png") のように、ファイル名を指定して画像を保存します。保存形式は、拡張子で自動的に判別されます。この場合は、 PNG 形式で出力されます。 PDF など、その他の形式にも対応しています。
ggsave("scatter_plot.png")
この記事が気に入ったらサポートをしてみませんか?