見出し画像

Rへのデータ読み込み(基本)

東京大学医学部附属病院老年病科の矢可部と申します。

基礎、臨床研究の統計解析でRを用いています。

Rの使用法について本やインターネットで調べても、解決法がわからなかったり、うまくいかなかったりすることが度々ありました。

そこで、同じような悩みを持つ方々に向けて「痒いところに手が届く」ような情報発信をしていきたいと思います。よろしくお願いいたします。

今回は、Rへのデータ読み込みについてです。

前回の記事でreadxlというパッケージのインストール方法を紹介しました。

readxlでExcelファイルを読み込む場合、以下のようなコマンドになります。

# パッケージ"readxl"を呼び出す(すでにreadxlをインストール済みの場合)
library(readxl)
# "AAA.xlxs"というExcelファイルを読み込む。
dat<-read_excel("AAA1.xlsx",sheet = 1)

ここで、コマンドの"sheet = 1"は、Excelファイルの1枚目を意味します。

このコマンドの意味は「ファイルのデータフレームを"dat"という名前の"箱"に保存した」と考えるとわかりやすいと思います。

"箱"の名前はdat以外でもかまいません。

ただしこの方法は、Rのディレクトリに入っているファイルにしか使えません。

そこで、直接データをRにコピペできる方法を紹介します。
私はこの方法を使っています。

まず、データをクリップボードにコピーします。これはRに限らずよく使うショートカットキーです。

  Control + Aでコピペしたい表全体を選択
→Control + Cでコピー
(Windowsの場合。MacではControlの代わりにCommand)

なお、コピペするデータの1行目は変数名(ID, 年齢, 性別など)になるようにしてください。

その後、Rで以下のコマンドを実行します。
私はMacを使っていますが、Windowsだとコマンドが違うので両方を紹介します。

# clipboardからの読み込み(Windows)
dat<-read.table("clipboard", sep="\t", header=T)

# clipboardからの読み込み (Mac)
dat <- read.table(pipe("pbpaste"), sep="\t", header=T)

ここでheaderは1行目を意味し、"header=T"というコマンドで「1行目は変数名である」という意味になります。

ちなみにTは"TRUE"を意味するので、Windowsの場合は

dat<-read.table("clipboard", sep="\t", header=TRUE)

としても同じ結果が得られます。

その後、以下のように入力します。

# datの列目を変数名として使えるようにする。
attach(dat)
# datを表示
dat

attach関数により列名(1行目にある項目)をそのまま変数名として使えるようにします。

attach()を用いないと変数名を指定するのが面倒なので、最初に行います。

さらにdatと入力することで、dat全体が表示されます。


ところで、ここに書いてあるコマンドは毎回手入力する必要はありません。

コマンドはR文書に保存しておきます。

そして、実行したいコマンドの行にカーソルを合わせて以下のショートカットを使うと実行することができます。

・Windowsの場合
Control + R
・Macの場合
Command + Return

Rをスムーズに使うには必須ですので、ぜひ覚えてください。


次回は、実際にExcelファイルからデータを読み込むことにします。

今後も少しずつ記事を書いていきますので、よろしくお願いいたします。


この記事が気に入ったらサポートをしてみませんか?