見出し画像

書記の読書記録#79「バイオインフォマティクス データスキル オープンソースを使ったロバストで再現性のある研究」

V.Buffalo著「バイオインフォマティクス データスキル オープンソースを使ったロバストで再現性のある研究」のレビューと読書記録


レビュー

バイオインフォマティクスの研究で最も時間を割くであろう「Unix」について特に重点的に扱っている。あとは必要に応じてRやPython,SQLを導入している。

訳は2020年9月出版だが,原著は2015年出版で時差があるところに注意,直接の写経でなく適宜調べながらの操作になると思う。


読書記録

# 1p1〜62
・再現性とロバスト性・ディレクトリ・マークダウン記法・Unix:標準出力とリダイレクト,パイプ,プロセス,コマンド置換


# 2p63〜281
・SSHによるリモートマシン・nohup,tmux・バージョンコントロールシステムGit:コミット,ステージング,リモートリポジトリ(プル,プッシュ),ブランチ・データ取得:wget,curl・データの整合性:チェックサム・圧縮:gzip・Unixパイプライン,リテレーションプログラミング・head,tail・less・wc,ls,awk・cut・column・grep・hexdump・sort・uniq・join・AWK:Bioawk・sed・探索的データ解析(EDA)・R言語の基礎:ベクトル化,データフレーム・ggplot2による可視化・データのマージと結合・リスト:lapply,sapply・分割-適用-結合パターン・Rスクリプト


# 3p283〜419
・範囲データ・GemomicRangesによる範囲操作,ランレングス符号,プロモーター領域/イントロン領域の取得・BEDTools・配列データ:FASTA,FASTQ・品質スコア・アラインメントデータの操作:SAM,BAM(Pysamの利用)


# 4p421〜528
・Bashスクリプト・find,xargs・make,makefile・Tabix・SQLite:リレーショナルデータベース


本記事のもくじはこちら:


学習に必要な本を買います。一覧→ https://www.amazon.co.jp/hz/wishlist/ls/1XI8RCAQIKR94?ref_=wl_share