見出し画像

有給中に読んだ本②

11月の有休中に読んだ本紹介の続きをしたい。名付けて、「超私的R入門書レビュー」。有休中に読み始め、有休明けから大活躍しているワークホースたちである。とある大規模なアンケート分析の社内プロジェクトで実験的にR言語を全面活用しているため、Rに関係する本になる。

まずR言語を使っている感想から

初心者としてこの1,2か月本格活用してみて、RにはExcelよりも取り扱いが簡単な面と、難しい面の両方があると感じた。簡単な面は、大量のデータを取り扱うことである。Excelだと固まりかけるような数万行のデータも瞬時に読み込み、集計・可視化できる。これはとても助かる。

一方で難しい面は、「作り込み」である。ステークホルダーへのレポートに耐えるようなチャートを作成しようとすると、要素の配置、色味、線の太さ等の調整が必要になる。もちろん、そういった要素を操作するために様々なパラメータが用意されてはいる。だが、初心者がその操作をできるようになるには時間がかかる。
あとよりマイナーだが初心者的に苦労したのは、日本語テキストcsvの扱いだ。Excelと比べると、だいぶ調整すべきパラメータが多く、ファイル一つ開くだけで苦労した。

「新技術(というほど新しくはないが)Rで部内を制覇するぞ」と意気込んでみたが、まあ世の中そんなに甘くないなというのが素直な感想だ。趣味の歴史や、いろんな業務で感じていたことだが、新技術導入がすぐアウトプット向上につながるとは限らない。レガシー技術(この場合はExcel)×熟練者 vs 新技術 vs 素人 だと、しばしば前者のほうがアウトプットの質がよく、かつスピードも速かったりする。

とはいえ、まずはやりきるしかないので、その気分転換(≒現実逃避)がてら、お世話になっている本たちを紹介したい。

『RユーザーのためのRstudio「実践」入門』

https://www.amazon.co.jp/dp/4297121700/ref=cm_sw_em_r_mt_dp_V6ME5TDH22FY9ADFKHN8?_encoding=UTF8&psc=1

■初版の表紙のデザインから通称「宇宙本」。第二版は少しデザインが変わり「宇宙船本」と言われる。
■「データの読み込み~可視化、成果物作成まで、ワークフローのすべてをtidyverseベースで学べる」というのがコンセプト。
■ありがたい点その1
tidyverseパッケージがともかく便利。トラブルを起こしがちな日本語テキストも、Rのデフォルトでなく、read_csvで読み込んでtibbleで扱うようにすると、何とかできるめどが立った。ちなみに、read_excelはなぜかうまく動かないことがあり、結局CSVに変換してから読み込むのが早いという結論に至った。
■ありがたい点その2
記述の詳しさが程よく、ともかく痒い所に手が届く。なので、私のような初心者が、使い込んでいくのにちょうどよい。毎回分からないことがあって本を開くたびに、有用な発見がある。この手の本は分厚すぎると読む気がしないし、薄すぎるとググるばかりになって読まなくなってしまうので、著者はとてもよくわかっている。

『Rグラフィッククックブック』

https://www.amazon.co.jp/dp/4873118921/ref=cm_sw_em_r_mt_dp_ZRRQMRVE5BJG9668Z7P7?_encoding=UTF8&psc=1

■O'REILLY社が刊行する、動物のイラストをあしらった表紙の技術書シリーズの一つ。シリーズは通称オライリー本と言われる。この本はRの描画用パッケージであるggplotに絞って紹介する。
■こいつはともかく詳しいので、辞書としてとても有用。投げれば人を殺せる分厚さ。日々携帯したおかげで表紙がぼろぼろになり、カバーが本に張り付いた
■チャートを作り込んでいく上で湧く、「Excelだと瞬殺だけど、ggplotだとどうすればいいんだっけ?」という疑問は、こいつでやっつける。Qitaかstack overflowで検索もするが、いちど付箋を付けた事項であれば、こいつを見直すほうが早い(気がする)。

『実践Data Scienceシリーズ データ分析のためのデータ可視化入門』

https://www.amazon.co.jp/dp/4065164044/ref=cm_sw_em_r_mt_dp_2KVMPBW168ZA8VXJ3W4R

■Rユーザーから非常に評価が高い本。ただ私はまだレベルが低いせいか良さがいまいちわからず、『Rグラフィッククックブック』のほうを圧倒的に利用頻度が高い。
■この本の最大の価値は、ファクタ値で積み上げ棒グラフを作る、正しい方法を教えてくれたことにある。自力で作った最初のバージョンは間違っていたのだが、作り方のどこがどう間違っていて、どこを直せばよいか、「第4章 正しい数値の示し方」を読んでようやく気付いた。この点において、この本は最大にして最高の価値を発揮したと言えよう。

『Rでできる因子分析』

https://www.amazon.co.jp/dp/4762831662/ref=cm_sw_em_r_mt_dp_920SVC1BA5FWHXWPAD5Q

■プロジェクトの都合で因子分析を理解する必要があり購入。実際に手を動かしながら学べるのでとても助かる。あと、心理学系のRパッケージpsychも知ることができ、これがまた便利。
■世間は機械学習一色だが、多変量解析を正しく理解し使いこなせるだけで仕事の質って上がるんだなと感じた。

テキスト分析系の本も試してはいるけど、まだ学んだ内容を実戦投入してできていないので、今日はここまで!



この記事が気に入ったらサポートをしてみませんか?