見出し画像

再開編・Day10. 『はじめてのR』を写経する(統計プログラミング入門)

村井 潤一郎『はじめてのR: ごく初歩の操作から統計解析の導入まで』の内容を1日30分間なぞって、統計プログラミング言語「R」を勉強することにした。

Day10.

繁忙時期と情勢への不安・適応の時期が重なり、1ヶ月も空いてしまった。

やることがなくて困るなんてことはなく、逆に毎日やることに追われている...。そしてこの写経も業務のためにやっているが、他の業務とは流れる時間軸が異なるように思えてホッとする。

さて、3章の冒頭でずっと止まっていたわけだが、再開していきたい。本章はファイルやエディタの基礎のパートなのでなんとか進みそうだ。残念ながら、4章からはさらに進みが遅くなるだろう...。本書の3章までは、富士山の5合目までをバスで登るようなものだ。

※個人の感覚です。中学生のころの富士登山を思い出して書きました。

Day.10も、統計解析そのものではなくRによる統計解析に必要なベースとなる部分を学ぶ。

3-2. データファイルの読み込み

データの読み込みではまらないために、Rでの作業を行っている場所(作業ディレクトリ)とデータの置き場所の2者に注意を払う必要がある。

・データの読み込みのパターン
 ー 作業ディレクトリにデータファイルを置いて読み込み
 ー 作業ディレクトリをデータファイルがある場所に変更して読み込み
 ー 作業ディレクトリを変更せずにデータファイルのある場所を指定して読み込み

・作業ディレクトリ(working directory)の確認

> getwd()
[1] "/Users/teromatsu"

 ー webサイトのパス(一般的にはURLと呼ばれている文字列)でも使うディレクトリの区切り文字は、Rでも「/」を使うことがわかった。

・「デスクトップ」 > 「R」にあるデータファイルを開く
今回は「作業ディレクトリをデータファイルがある場所に変更して読み込み」を試してみる。作業ディレクトリを「R」に移動してみた。

> setwd("/Users/teromatsu/Desktop/R")

そして「テストデータ」というオブジェクトに「renshu.csv」をいれてみようとすると、

> テストデータ<-read.csv("./renshu.csv")
警告メッセージ: 
read.table(file = file, header = header, sep = sep, quote = quote,  で: 
 incomplete final line found by readTableHeader on './renshu.csv'

あれ、エラーになってしまった。
本書はWindowsを使用してるのでこれはちょっとググってみるしかない...

ちなみにファイルのフルパスを知るには、Macの場合は、「テキストエディタ」で新規ドキュメントを「標準テキスト」で作成し、そこに「renshu.csv」をドラッグアンドドロップしてパスをゲットした。

続きはDay.11で。

まとめ

・作業ディレクトリとデータファイルがどこによって、パスの書き方が異なる
・「./」は「今いるディレクトリ」
・オブジェクトの一種である「データフレーム」については、また追って学ぶので保留
・謎のエラーはDay.11で解決しよう...

写経している教本(「本書」とは)

村井 潤一郎『はじめてのR: ごく初歩の操作から統計解析の導入まで

補足:書いてる人間について

このnoteでは、昨秋からマーケ・分析に転向した筆者が、下記のバックグラウンドがあることと、あくまで写経をすることが目的である。よってこのnoteでの記録の割愛がまぁまぁある。
※著作物の内容をまるまる載せる行為に近くなるからである。

・筆者は過去にUIデザインの仕事と並行して、フロントのコーディングでHTML/CSSや(たまにjQuery)を扱っていた。※4年以上前の話
・挫折してはいるが、上記の時期にPHPやRuby on Railsなどでのweb開発の初歩にも挑戦したことがある。
・上記と同じく、コマンドラインツールにはGitを利用する中でちょっと親しんでいた(wipという表現の便利さに目覚めた)。

補足:マーケターがRを学ぶ背景

2019年の秋からマーケ・分析担当として、EXCELで重回帰分析をするときに数多くの壁にぶつかってしまった。Rの学習のきっかけは、社外の統計に詳しい人に、Rをおすすめされたことだった。Rなら、エクセルでの解析時に人力でやっていた下処理などを関数などで簡単に処理できるという。

***

いったんの目標は、この本を一度すべてなぞった上で、重回帰分析のスクリプトが理解できるようになること。

そうすれば、これまでの少ないプログラミング学習経験に照らして、コピペで他の解析がちょっとできるようになると見込んでいる。

写経とは、読んで字のごとくお経を書き写すこと。
IT業界では「プログラミングコードを書き写す」ことを意味しており、効果的なプログラミング学習方法のひとつとして知られている。
(出典:プログラミング学習で写経を最大限に活かす方法)

わたしをサポートしたつもりになって、自分を甘やかしてください。