R/RStudioベーシック講座:基本操作のチートシート集
UdemyでR/RStudioベーシック講座【データ処理・グラフ作成】というコースの学習を始めました。今回は前半で学ぶ入出力・基本的なグラフ作成の仕方をまとめてチートシートとして利用できるようにしました。
#データの整形・視覚化に標準的に使われるtidyverseを使えるようにする
#tidyverseのパッケージにはggplot2,dplyr, readr等が含まれている
library(tidyverse)
library(readr)
library(readxl)
setwd("C:/Users/user/Desktop/統計学習用資料")
#readrの機能でCSVファイルを読み込む
d <- read_csv(file = "testdata.csv", locale = locale(encoding = "UTF-8"))
head(d)
summary(d)
#readxlの機能でEXCELファイルを読み込む
d02 <- read_excel(path = "testdata.xlsx", sheet = 1)
head(d)
summary(d)
#サンプリングデータ(標本集団)をデータから作成する
d_sample <- sample(x = c("YES", "NO"), size = 100, replace = TRUE)
d_sample
d_sample02 <- sample(x = c("YES", "NO"), size = 100, replace = TRUE, prob = c(0.2, 0.8))
d_sample02
#正規分布に従うデータを生成する。多くの自然なデータは、正規分布に従うケースが多い
normal <- rnorm(n = 1000, mean = 0, sd = 1)
plot(normal)
hist(normal)
#データをCSVファイルにして出力する。データはdata.flame形式にする必要がある
normal02 = data.flame(normal)
write_csv(x = normal02, file = "RNorm_dist.csv")
#ISLRパッケージ=クレジットカード会社の匿名の顧客情報を分析にかける
#tidyverseでデータ分析をする際は、as_tibbleでtibble形式に変換する
install.packages("ISLR")
library(ISLR)
Default <- as_tibble(Default)
head(Default)
plot(Default)
hist(Default)
library(psych)
Default.s <- Default[,c(1,2,3,4)]
psych::pairs.panels(Default.s)
#データ構造を変える・一部を抽出する方法
#データの列名をチェックし、colnamesでラベルを変更する
str(Default)
colnames(Default) <- c("d","s","b","i")
#データの行数・列数を確認する
dim(Default)
length(Default$default)
次回はデータのグラフ化について書きたいと思います。この調子で頑張りますね!
この記事が気に入ったらサポートをしてみませんか?