マガジンのカバー画像

Rによる二次的データの分析

51
社会的データについてRStudioを使ってグラフを作成したり統計学的分析をおこないます。
運営しているクリエイター

#ggplot2

Rをつかう単純な計算のための備忘録

 Rを使い始めた頃に参照していたものの1つは『データ解析環境「R」』(工学社発行)という本であった。著者は、舟尾暢男・高浪洋平の2氏。本に書き込みをしながら読んだ。有意義な本であった。  まず、その本に書き込んだメモを見ながら、Rの使い方を復習してみようと思う。そうすることで、しばらく使わないでいたあとにまごつかないようにすることができるだろう。  別の本(注)も、昔真剣に取り組んだことがある。その本の巻末に「補遺 RとS-PLUSの備忘録」というものがあり、これも復習してみ

1737市町村(両対数グラフ)

data <- data0[1:1737,]library(ggplot2)ggplot()+geom_abline(intercept = 11.003,slope = -1.655,color="blue",linetype=2)+ geom_hline(yintercept=100,linetype=2,color="green",size=0.3)+ geom_point(data=data,aes(y=rank,x=pop,col="red"))+ theme_

新型コロナ死亡者数のグラフ

データの出所: https://covid19.mhlw.go.jp/public/opendata/deaths_cumulative_daily.csv library(readr)death_total <- read_csv("https://covid19.mhlw.go.jp/public/opendata/deaths_cumulative_daily.csv")dat <- death_total[,c(1,2)]colnames(dat)[2] <- "

人口のランキングと人口(べき乗分布)

​ べき乗分布、対数正規分布への当てはめ。ggplot2でグラフを描く。```{r,warning=FALSE,include=TRUE,echo=FALSE}ggplot(df_long,aes(x,y,col=bucket))+ geom_point()+ geom_line()+labs(title = "全国",subtitle = "y: 人口\ny1=実際値\ny2=(10^6.6430)*x^(-0.6013)\ny3=(10^6.6162)*x^(-0.57

転出入人口比率の高い市町村(福岡県)

転出入人口比率(OutOverIn)について。```{r,echo=FALSE,include=FALSE}for (i in 1:60) { cat(dat$X2[i],"--",dat$OutOverIn[i],"\n")}``````{r}# データフレームを転出入人口比率の降順で並び替える# 新しいオブジェクト名: OutOverInd <- arrange(dat,-OutOverIn)``````{r}# 上位20を抜き出すtop20 <- d[1:20,]t

転出入人口比率(福岡県)

### 4.7.2 転出入人口比率(OutOoverIn)```{r, include=TRUE, echo=FALSE}library(ggplot2)ggplot(fukuoka_map)+geom_sf(aes(fill=OutOverIn))+labs(x="東経",y="北緯",title="転出入人口比率",fill="OutOverIn",caption = "2015年")+theme_minimal(base_family = "HiraKakuProN

ggplot2で作図

第1波から第2波へ

産業別就業者数の推移

感染症死亡率の推移

```{r}library(tidyr)dat_ <- dat %>% gather(Y2012:Y2019,key="key",value="value",-X1,na.rm = TRUE)library(ggplot2)ggplot(dat_,aes(x=key,y=value,group=X1))+ geom_line(size=1, aes(col=X1))+labs(y="死亡率(人口10万対)",col="凡例",title="感染症死亡率の推移",captio

専門的技術的、管理的職業の動向

long formatでデータを作成。```{r}dat_ <- gather(work,"key","value",-code)``````ggplot(dat_,aes(x=key,y=value,group=code))+ geom_line(size=2,aes(col=code))+labs(x="year",y="percent",fill="legend",title="専門的管理的職業の動向",caption = "国勢調査",subtitle = "19

昼夜間人口比率の高い市町村(福岡県)

昼夜間人口比率(A6108)について。```{r,echo=FALSE,include=FALSE}for (i in 1:60) { cat(dat$X2[i],"--",dat$A6108[i],"\n")}``````{r}# データフレームを昼夜間人口比率の降順で並び替える# 新しいオブジェクト名: dd <- arrange(dat,-A6108)``````{r}# 上位20を抜き出すtop20 <- d[1:20,]top20[,c(1,2,28)]``````

RStudioでグラフを描いてみる--COVID-19

以下のようなスクリプトをRStudioで記述する。データは厚生労働省オープンデータをウェブから直接に読み込む。グラフ作成で直接的に使っているのはggplot2というパッケージである。結果のグラフは、この記事の最後に示している。 ## 死亡者数```{r,message=FALSE,warning=FALSE}library(readr)death_total <- read_csv("https://www.mhlw.go.jp/content/death_total.cs