見出し画像

Day9. 『はじめてのR』を写経する(統計プログラミング入門)

村井 潤一郎『はじめてのR: ごく初歩の操作から統計解析の導入まで』の内容を1日30分間なぞって、統計プログラミング言語「R」を勉強することにした。

Day9.

R Consoleやわからないことの参照の仕方など、超基本的な事柄ばかりの第1〜2章がやっと終わった(noteにまとめながらとは言え8日間もかかってしまった)。

3章はファイルやエディタの基礎のパートなのでなんとか進みそうだが、残念ながら、4章からはさらに進みが遅くなるだろう...。本書の3章までは、富士山の5合目までをバスで登るようなものだ。

※個人の感覚です。中学生のころの富士登山を思い出して書きました。

Day.9からは、統計解析そのものではなく、Rによる統計解析に必要なベースとなる部分を学ぶ。

3-2データファイルの作成

・Rで統計解析をするには
 ー 日常的に使うExcelファイルなどをRで読み込む必要がある
 ー あらかじめプログラムを書いておき、まとめて実行することが多い

・Rエディタが便利
 ー Rのプログラムを書くためのテキストエディタ
 ー エディタからプログラムの実行ができる

備忘録:言語ごとにエディタを変えるのは非効率な気もする

・作業の前に前回つくったオブジェクトを削除しておく
2章の書きぶりでは、ローカルファイルを消さないとだめかと思っていたがどうやら下記で可能らしい(早く知りたかった...!初学者には便利)。

> ls()
[1] "1番めの箱" "x"          "y"          "一番めの箱" "一番目の箱"
> rm(list=ls())
> ls()
character(0)
> 

→ls()で確認したところ、前に作ったオブジェクトが入っていたので、「rm()」で削除した。

・データを作成する
「c()」でも可能だが、サンプルサイズが大きく変数が多いデータを「c()」でポチポチ入力するのは現実的ではない。
→ CSVファイルを用意する(Excelでもメモ帳でもいい)
※RではExcelファイルのままでも読み込めるが、書式設定などの情報がないCSVファイルのほうが軽く汎用性が高い、とのこと。
※CSVファイルは日本語や全角文字を避けて作成したほうがいい。
※ExcelでCSVファイルをつくるときはA1セル(A列のフィールド名が入る箇所)に「ID」という項目名を使わないようにする。CSVファイル形式で保存できなくなるらしい。

▼実際に作成したファイル「renshu.csv」の中身

number, sex, testA, testB
1, f, 56, 51
2, f, 67, 45
3, m, 43, 72, 

30分経ってしまった...今日はここまで。

まとめ

・エディタがRエディタじゃないといけないかは検討したい。
・備忘:以前作業の名残りが残ってるかも知れないので、Macの場合の保存先のファイルを探して消しておく。→rm()でスッキリ!!!
・解析には、汎用的で軽いCSVファイルが最適。

写経している教本(「本書」とは)

村井 潤一郎『はじめてのR: ごく初歩の操作から統計解析の導入まで

補足:書いてる人間について

このnoteでは、筆者が下記のバックグラウンドがあることと、あくまで写経をすることが目的のため、理解するプロセスである程度端折っていることがある。

なにより、書籍の写経とは言え、内容をまるまる載せる訳にはいかない

・筆者は過去にUIデザインの仕事と並行して、フロントのコーディングでHTML/CSSや(たまにjQuery)を扱っていた。4年以上前の話だが。
・挫折してはいるが、上記の時期にPHPやRuby on Railsなどでのweb開発の初歩にも挑戦したことがある。
・上記と同じく、コマンドラインツールにはGitを利用する中でちょっと親しんでいた(wipという表現の便利さに目覚めた)。

補足:マーケターがRを学ぶ背景

2019年の秋からマーケ・分析担当として、EXCELで重回帰分析をするときに数多くの壁にぶつかってしまった。Rの学習のきっかけは、社外の統計に詳しい人に、Rをおすすめされたことだった。Rなら、エクセルでの解析時に人力でやっていた下処理などを関数などで簡単に処理できるという。

***

いったんの目標は、この本を一度すべてなぞった上で、重回帰分析のスクリプトが理解できるようになること。

そうすれば、これまでの少ないプログラミング学習経験に照らして、コピペで他の解析がちょっとできるようになると見込んでいる。

写経とは、読んで字のごとくお経を書き写すこと。
IT業界では「プログラミングコードを書き写す」ことを意味しており、効果的なプログラミング学習方法のひとつとして知られている。
(出典:プログラミング学習で写経を最大限に活かす方法)

わたしをサポートしたつもりになって、自分を甘やかしてください。