マガジンのカバー画像

Rによる二次的データの分析

51
社会的データについてRStudioを使ってグラフを作成したり統計学的分析をおこないます。
運営しているクリエイター

#RSudio

Rをつかう単純な計算のための備忘録

 Rを使い始めた頃に参照していたものの1つは『データ解析環境「R」』(工学社発行)という本であった。著者は、舟尾暢男・高浪洋平の2氏。本に書き込みをしながら読んだ。有意義な本であった。  まず、その本に書き込んだメモを見ながら、Rの使い方を復習してみようと思う。そうすることで、しばらく使わないでいたあとにまごつかないようにすることができるだろう。  別の本(注)も、昔真剣に取り組んだことがある。その本の巻末に「補遺 RとS-PLUSの備忘録」というものがあり、これも復習してみ

第1波から第2波へ

感染症死亡率の推移

```{r}library(tidyr)dat_ <- dat %>% gather(Y2012:Y2019,key="key",value="value",-X1,na.rm = TRUE)library(ggplot2)ggplot(dat_,aes(x=key,y=value,group=X1))+ geom_line(size=1, aes(col=X1))+labs(y="死亡率(人口10万対)",col="凡例",title="感染症死亡率の推移",captio

専門的技術的、管理的職業の動向

long formatでデータを作成。```{r}dat_ <- gather(work,"key","value",-code)``````ggplot(dat_,aes(x=key,y=value,group=code))+ geom_line(size=2,aes(col=code))+labs(x="year",y="percent",fill="legend",title="専門的管理的職業の動向",caption = "国勢調査",subtitle = "19

昼夜間人口比率

地図データと統計データの結合 ### 4.7.1 昼夜間人口比率(A6108)<div style="text-align: left;"><image src="ss2020-09-15 11.24.23.png"width="300" height="300"></div>```{r}library(ggplot2)ggplot(fukuoka_map)+geom_sf(aes(fill=A6108))+labs(x="東経",y="北緯",title="昼夜間人口比率

出生率、婚姻率、離婚率の推移

## 2.3 2020年公表データ```令和元年上巻 総覧 第3.2表-2 年次別にみた人口動態総覧(率)注:1) 1944年(昭和19年)~1946年(昭和21年)は戦災による資料喪失等資料不備のため省略した。1947年(昭和22年)~1972年(昭和47年)は沖縄県を含まない。1948年(昭和23年)・1949年(昭和24年)の*印は概数による率である。2) 新生児死亡の1943年(昭和18年)以前は1か月未満の死亡である。また、新生児死亡の1943年(昭和18年)は

合計特殊出生率

合計特殊出生率のグラフをRのggplot2で作成する。 ## 2.2.1 合計特殊出生率```{r,message=FALSE,warning=FALSE}library(readr)library(dplyr)mb010000 <- read_csv("mb010000.csv")birth <- mb010000head(birth,3)tail(birth,3)df <- birthdf$fertility_rate <- as.numeric(df$fertilit

死因別死亡率

## 1.4 死因別死亡確率(生命表による)死因別死亡確率(令和元年)死因別死亡確率は、生命表の上で、ある年齢の者が将来どの死因で死亡するかを計算し、確率の形で表したものである。 ```{r,message=FALSE}library(readr)mortality_probability_2019 <- read_csv("mortality probability-2019.csv")mortality <- mortality_probability_201

雇用形態別雇用者数の推移

## 雇用形態別雇用者数```[詳細集計] 長期時系列表9 (1)年齢階級(10歳階級)別就業者数及び年齢階級(10歳階級),雇用形態別雇用者数 - 全国 (男女計)[Detailed Tabulation] Historical data 9  (1) Employed person by age group (ten-year group) and Employee by age group (ten-year group) and type of empl

ある町内会の単年度収支の推移

```{r}ggplot(dat_,aes(x=会計年度,y=value,group=key))+ geom_point(size=1.5)+ geom_line(aes(linetype=key))+ geom_hline(yintercept=0,size=1,linetype="dashed")+labs(col="凡例",x="会計年度",y="金額",title="単年度収支の推移",caption="○○町内会", subtitle="2014-2020 単位:円

RStudioでグラフを描いてみる--COVID-19

以下のようなスクリプトをRStudioで記述する。データは厚生労働省オープンデータをウェブから直接に読み込む。グラフ作成で直接的に使っているのはggplot2というパッケージである。結果のグラフは、この記事の最後に示している。 ## 死亡者数```{r,message=FALSE,warning=FALSE}library(readr)death_total <- read_csv("https://www.mhlw.go.jp/content/death_total.cs