マガジンのカバー画像

バイオインフォマティクスのメモ

42
実験メインの研究者なので、バイオインフォマティクスやデータ解析を忘れないための備忘録的なもの。
運営しているクリエイター

2014年12月の記事一覧

Rでデータ解析 その2

続き

# t テスト

> t.test(diet, mu=0) One Sample t-testdata: dietdata: diett = -2.842, df = 5, p-value = 0.03616alternative hypothesis: true mean is not equal to 095 percent confidence interval: -6.6657

もっとみる

Rでデータ解析 その1

Rでデータ解析を行う。

> flour <- c(3,-2,-1,8,1,-2)> diet <- c(-4,1,-3,-5,-2,-8)> total<-c(flour, diet)

# histogramを書く

> hist(total)

> hist(total, br=c(-8,-6, -4, -2,0,2,4,6,8), ylim =c(0,5))

# 密度推定曲線

> pl

もっとみる

Perl/Tkモジュールのインストール

Windowsの場合、

まず、ActivePerlをインストール
http://www.activestate.com/activeperl

ActivePerlを起動して、

> cd..

で C:¥> まで戻る。

> ppm repo add http://www.bribes.org/perl/ppm/ bribes

Tkモジュールのダウンロードが開始。

> ppm instal

もっとみる

グラフを描く

> x<-c(1,4,2,3,5,4,4,5,6)> y<-c(3,4,5,2,2,3,4,5,7)

# xをプロット

> plot(x)

# x-yをプロット

> plot(x,y)

# x軸、y軸を定義

> plot(x,y, xlim=c(1,8), ylim=c(1,10))

# sinをプロット

> plot(sin)

# x軸の範囲指定

> plot(sin, -p

もっとみる

Rで行列を使う その2

# 行列を作る(1~6を3行の行列にする)

> m1 <- matrix(1:6, nrow=3)> m1 [,1] [,2][1,] 1 4[2,] 2 5[3,] 3 6

# 2行

> m2 <- matrix(1:6, nrow=2)> m2   [,1] [,2] [,3][1,] 1 3 5[2,] 2

もっとみる

Rで行列を使う その1

Rでは行列が使えます。

> matrix(1:6, nrow=2, ncol=3) [,1] [,2] [,3][1,] 1 3 5[2,] 2 4 6

# 上の行から順に並べる。

> matrix(1:6, nrow=2, ncol=3, byrow=T) [,1] [,2] [,3][1,] 1 2 3[2,]

もっとみる

乱数をつかったシミュレーション

# Rでスクリプトを書いてシミュレーション

# runifで0~1までの値を乱数で示す。

# 乱数を5つ表示

> runif(5)[1] 0.5517032 0.6004116 0.4150682 0.2100349 0.5122325

# コインを投げて表か裏か。表を1、裏を0とする。
# まず、答えをaとする。

> a <- 0

# 乱数を1つ返す。

> x<-runif(1)

もっとみる

Welch t-test

等分散を仮定しない場合の母平均の差の検定はWelchのt-検定で行います。
いや、常にWelchでやるように心がけておいた方が、余計な仮定が含まれないのでよいと思います。

# データ入力

> x<-c(28,27,30,32,29,32,33,27,23,22,26,20)> y<-c(29,37,34,37,29,28,33,36,33,32,26,31)

# データ入力の確認

> x[

もっとみる

Student t-testとp-valueについて

2つの集団で差があるかどうかの検定です。
男子 vs 女子、大阪 vs 東京、赤組 vs 白組など。

等分散を仮定した場合の母平均の差の検定は Studentのt-検定で行います。
(個人的には、t-検定は 等分散を仮定しないWelchで行った方がよいと思いますが...)

# データ入力

> x<-c(28,27,30,32,29,32,33,27,23,22,26,20)> y<-c(29

もっとみる

複数のグラフをひとつのウィンドウに表示

# 例として、複数のヒストグラムを描く

# データを入力

> papa<-c(20,20,20,20,20,20,20)> mama<-c(2,0,1,1,0)> oba<-c(2,3,1,9,20,20,20,20,20,4,20,20,12,6,7)> ozi<-c(7,7,20,20,20,20,20,18,20)> aneki<-c(20,14,11,20,20,20,20,20,20

もっとみる

棒グラフ

実は、Rで棒グラフを描くのは意外と面倒。
棒グラフはExcelで描けばいいのでは?(笑)

しかし、Excelだと後から見返した時に、どのデータを使ってどのように描いたかわからなくなることがある。特に他の人が描いたグラフになるとカオスなので、ログを残しておくことは大事。
というわけで、Rで描いてみましょう。

# データ入力

> x<-c(28,27,30,32,29,32,33,27,23,2

もっとみる

箱ひげグラフを描く

# データ入力

> x<-c(28,27,30,32,29,32,33,27,23,22,26,20)

# 入力データの確認

> x[1] 28 27 30 32 29 32 33 27 23 22 26 20

# 箱ひげグラフを描く

> boxplot(x)

# データ入力(その2)

> y<-c(29,37,34,37,29,28,33,36,33,32,26,31)> x[1]

もっとみる

スクリプトを書く

Rで自動処理。
プログラミング

# 1を答えとして返すスクリプトmyfunc01を作る。function( ){ }

> myfunc01<-function(){+ return(1)+ }

* function(){return(1)} の意味だが、 { をタイプした後改行すると、次の行は + から始まり、前行の続きを書ける。

# myfunc01の中身を見る。

> myfunc0

もっとみる

Rで数値計算(その2)

引き続き、Rで練習

> c(1,2,3,4,5)[1] 1 2 3 4 5

# 変数aにベクトルを格納

> a<-c(1,2,3,4,5)> a[1] 1 2 3 4 5

# ベクトルで数値計算

> sqrt(a)[1] 1.000000 1.414214 1.732051 2.000000 2.236068

# logを計算

> log(a)[1] 0.0000000 0.6931

もっとみる