見出し画像

R/RStudioベーシック講座:基本操作のチートシート集

UdemyでR/RStudioベーシック講座【データ処理・グラフ作成】というコースの学習を始めました。今回は前半で学ぶ入出力・基本的なグラフ作成の仕方をまとめてチートシートとして利用できるようにしました。

#データの整形・視覚化に標準的に使われるtidyverseを使えるようにする
#tidyverseのパッケージにはggplot2,dplyr, readr等が含まれている
library(tidyverse)
library(readr)
library(readxl)
setwd("C:/Users/user/Desktop/統計学習用資料")


#readrの機能でCSVファイルを読み込む
d <- read_csv(file = "testdata.csv", locale = locale(encoding = "UTF-8"))
head(d)
summary(d)


#readxlの機能でEXCELファイルを読み込む
d02 <- read_excel(path = "testdata.xlsx", sheet = 1)
head(d)
summary(d)


#サンプリングデータ(標本集団)をデータから作成する
d_sample <- sample(x = c("YES", "NO"), size = 100, replace = TRUE)
d_sample

d_sample02 <- sample(x = c("YES", "NO"), size = 100, replace = TRUE, prob = c(0.2, 0.8))
d_sample02


#正規分布に従うデータを生成する。多くの自然なデータは、正規分布に従うケースが多い
normal <- rnorm(n = 1000, mean = 0, sd = 1)
plot(normal)
hist(normal)


#データをCSVファイルにして出力する。データはdata.flame形式にする必要がある
normal02 = data.flame(normal)
write_csv(x = normal02, file = "RNorm_dist.csv")


#ISLRパッケージ=クレジットカード会社の匿名の顧客情報を分析にかける
#tidyverseでデータ分析をする際は、as_tibbleでtibble形式に変換する
install.packages("ISLR")
library(ISLR)
Default <- as_tibble(Default)

head(Default)
plot(Default)
hist(Default)

library(psych)
Default.s <- Default[,c(1,2,3,4)]
psych::pairs.panels(Default.s)


#データ構造を変える・一部を抽出する方法
#データの列名をチェックし、colnamesでラベルを変更する
str(Default)
colnames(Default) <- c("d","s","b","i")

#データの行数・列数を確認する
dim(Default)
length(Default$default)

次回はデータのグラフ化について書きたいと思います。この調子で頑張りますね!

この記事が気に入ったらサポートをしてみませんか?