見出し画像

Rを活用した地域課題解決のためのヒント NDB分析編 #3(特定健診)

特定健診データの可視化(その1)

Rの実行環境

Rの実行環境の構築は成書を参照ください。私の環境は以下の通りです。
R version :4.2.2、開発環境:RStudio 2023.03.0 Build 386 for Windows
ファイルはフォルダにまとめて管理します。今回は、NDBという名称のフォルダにエクセルファイルとRスクリプトを保存することにします。
また、RStudioのプロジェクトとして保存することでスクリプトやデータをまとめて管理することができます。

Rへのデータの取り込み

前編で作成したエクセルファイルをRに取り込みます。必要なlibraryはreadxlになりますので事前にインストールしておきます。
skipを使ってエクセルの5行目までを無視して、6行目が項目名となるようにパラメータを設定しています。

library(readxl)
#エクセルファイルのデータをRのデータフレームに格納
df.pref_kenshin_avg <- read_excel("都道府県_特定健診_検査値_平均.xlsx", 
                               sheet = "都道府県_平均値", skip = 5)

#取り込まれたデータをプレビューする
View(df.pref_kenshin_avg)

プレビューを実行すると下記図のように問題なく取り込まれていることが確認できます。

図1:df.pref_kenshin_avgのプレビュー(一部のみ表示)

検査値の分布を可視化する(箱ひげ図)

ここから先は

2,114字 / 3画像

¥ 250

この記事が気に入ったらサポートをしてみませんか?