メディカルデータサイエンティスト

古典統計学とベイズ統計学の手法を検討していろいろな検定推定を健忘録を書いていきたいと思…

機械学習(Python編)

メディカルデータサイエンティスト

2本
機械学習(R言語編)

メディカルデータサイエンティスト

8本

R言語を利用した機械学習の練習です。
統計解析

メディカルデータサイエンティスト

10本

R言語やPythonを用いた統計解析の練習です

機械学習(ランダムフォレスト編)

必要なモジュールを読み込んでいきます import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inlineimport seaborn as sns Sicket-Learn…

メディカルデータサイエンティスト

3年前

機械学習(総集編caret編)

今日はcaretパッケージの分類を使っていきます。 methodにサポートベクターマシン(svmRadial)、ニューラルネットワーク(nnet)、k近傍法(knn)、単純ベイズ(nb)、ランダム…

メディカルデータサイエンティスト

3年前

機械学習(単純ベイズ編）

必要なモジュールを読み込んでいきます import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inlineimport seaborn as sns Sicket-Learn…

メディカルデータサイエンティスト

3年前

機械学習(k近傍法編)

パッケージの読み込み library(kernlab)library(class) データセットにirisを取り込み、教師データと検証用データに分割します data(iris)n<-seq(1,nrow(iris),by=2)iri…

メディカルデータサイエンティスト

3年前

機械学習(準備編)

irisのデータを利用していろいろ勉強していきます。 irisのデータを確認して、図示して相関を予想します。 GGallyで図示していきます。まずデータを読み込んで、確認しま…

メディカルデータサイエンティスト

3年前

機械学習(サポートベクターマシン編)

パッケージの読み込みます library(e1071)library(kernlab) データirisの読み込み、データを教師データと評価データの2つに分割します data(iris)n<-seq(1,nrow(iris),b…

メディカルデータサイエンティスト

3年前

機械学習(ランダムフォレスト編)

パッケージの読み込み library(randomForest) irisを読み込んで、学習用と検証用に分割します data(iris)n<-seq(1,nrow(iris),by=2)iris.train<-iris[n,]iris.test<-iri…

メディカルデータサイエンティスト

3年前

機械学習(決定木編)

パッケージの読み込みます library(rpart)library(rpart.plot) irisのデータを読み込んで、学習用と検証用に分割します data(iris)n<-seq(1,nrow(iris),by=2)iris.train…

メディカルデータサイエンティスト

3年前

機械学習(ニューラルネットワーク編)

ニューラルネットワークモデルで解析 3層パーセプトロンの構築していきますパッケージの読み込みます library(e1071)library(kernlab)library(nnet) データセットにiris…

メディカルデータサイエンティスト

3年前

機械学習(単純ベイズ編)

R言語での単純ベイズモデルでの機械学習 irisのデータを用いて分類の問題を復習します。まずパッケージの読み込みです library(e1071)library(kernlab) irisデータの読…

メディカルデータサイエンティスト

3年前

生存時間曲線つづき

同じデータでマルコフ連鎖モンテカルロ法MCMCでサンプリング数を増やしてベイス推定してみました。 model = " data { int<lower=1> N; int<lower=1> T; int<lower=1, upp…

メディカルデータサイエンティスト

4年前

生存時間曲線

ポビドンヨードが話題になっていたので、生存時間曲線で表現するにはと復習してみた。まず、公開されているデータからはイソジンうがい群25例、対照群16例で、最終日…

メディカルデータサイエンティスト

4年前

２群間の時系列データの解析

友人に２群間の時系列データの解析、検定を尋ねられたので改めて勉強してみたので、健忘録として。まず、練習用のデータを作成していきます。症例は30例ずつの2群で、…

メディカルデータサイエンティスト

4年前

分散分析の悩みどころ

引き続いて分散分析です。前回はbrmsパッケージで交互作用ありで解析しましたが、交互作用なしで検討する考えもあります。多重共線性を排除するためです。他に今回は当て…

メディカルデータサイエンティスト

4年前

brmsパッケージで共分散分析をベイズ推定してみた。

library(brms)library(rstan) 用量doseを因子型に変換します。 data=ToothGrowthdata=transform(data,dose=as.factor(dose)) ベイズの線形回帰パッケージbrmsを使用しま…

メディカルデータサイエンティスト

4年前

共分散分析を重回帰解析で

また同じToothGrowthのデータで考えていきます。今回は２元配置分散分析を線形回帰(重回帰解析)で検討していきます。まず、doseは数値型のままです。 lm.fit=lm(len ~ s…

メディカルデータサイエンティスト

4年前

メディカルデータサイエンティスト

2020年11月2日 17:31

機械学習(ランダムフォレスト編)

必要なモジュールを読み込んでいきます

import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inlineimport seaborn as sns

Sicket-Learnからパッケージを読み込んでいます

from sklearn.model_selection import train

もっとみる

メディカルデータサイエンティスト

2020年10月28日 15:31

機械学習(総集編caret編)

今日はcaretパッケージの分類を使っていきます。
methodにサポートベクターマシン(svmRadial)、
ニューラルネットワーク(nnet)、k近傍法(knn)、
単純ベイズ(nb)、ランダムフォレスト(rf)、
決定木(rpart)などを指定できる便利なパッケージです。
irisを読み込み、教師データと検証用に分割します

data(iris)n<-seq(1,nrow(iris),by

もっとみる

メディカルデータサイエンティスト

2020年10月27日 19:01

機械学習(単純ベイズ編）

もっとみる

メディカルデータサイエンティスト

2020年10月27日 16:48

機械学習(k近傍法編)

パッケージの読み込み

library(kernlab)library(class)

データセットにirisを取り込み、教師データと検証用データに分割します

data(iris)n<-seq(1,nrow(iris),by=2)iris.train<-iris[n,]iris.test<-iris[-n,]set.seed(1)

k近傍法のモデルを構築します

knn.result<-knn

もっとみる

メディカルデータサイエンティスト

2020年10月26日 10:39

機械学習(準備編)

irisのデータを利用していろいろ勉強していきます。
irisのデータを確認して、図示して相関を予想します。
GGallyで図示していきます。

まずデータを読み込んで、確認します。

data(iris)head(iris)

Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.

もっとみる

メディカルデータサイエンティスト

2020年10月26日 10:11

機械学習(サポートベクターマシン編)

パッケージの読み込みます

library(e1071)library(kernlab)

データirisの読み込み、データを教師データと評価データの2つに分割します

data(iris)n<-seq(1,nrow(iris),by=2)iris.train<-iris[n,]iris.test<-iris[-n,]set.seed(1)

サポートベクターマシーンの構成します

svm.mod

もっとみる

メディカルデータサイエンティスト

2020年10月24日 14:43

機械学習(ランダムフォレスト編)

パッケージの読み込み

library(randomForest)

irisを読み込んで、学習用と検証用に分割します

data(iris)n<-seq(1,nrow(iris),by=2)iris.train<-iris[n,]iris.test<-iris[-n,]set.seed(1)

ランダムフォレストで分類モデルを作成します

rf.model<-randomForest(Speci

もっとみる

メディカルデータサイエンティスト

2020年10月24日 14:34

機械学習(決定木編)

パッケージの読み込みます

library(rpart)library(rpart.plot)

irisのデータを読み込んで、学習用と検証用に分割します

data(iris)n<-seq(1,nrow(iris),by=2)iris.train<-iris[n,]iris.test<-iris[-n,]set.seed(1)

CARTで分類モデルを作成します

cart.model<-rpa

もっとみる

メディカルデータサイエンティスト

2020年10月23日 14:05

機械学習(ニューラルネットワーク編)

ニューラルネットワークモデルで解析
3層パーセプトロンの構築していきます
パッケージの読み込みます

library(e1071)library(kernlab)library(nnet)

データセットにirisを取り込みます

data(iris)

データを教師データと解析用に分割します

n<-seq(1,nrow(iris),by=2)iris.train<-iris[n,]iris.t

もっとみる

メディカルデータサイエンティスト

2020年10月23日 13:48

機械学習(単純ベイズ編)

R言語での単純ベイズモデルでの機械学習
irisのデータを用いて分類の問題を復習します。
まずパッケージの読み込みです

library(e1071)library(kernlab)

irisデータの読み込みます

data(iris)

教師データと評価データに分けます（半分づつ）

n<-seq(1,nrow(iris),by=2)iris.train<-iris[n,]iris.test<

もっとみる

メディカルデータサイエンティスト

2020年8月8日 15:00

生存時間曲線つづき

同じデータでマルコフ連鎖モンテカルロ法MCMCで
サンプリング数を増やしてベイス推定してみました。

model = " data { int<lower=1> N; int<lower=1> T; int<lower=1, upper=T> Time[N]; int<lower=0, upper=1> Cens[N]; } parameters { real<lower=0> sigma_log

もっとみる

メディカルデータサイエンティスト

2020年8月8日 14:47

生存時間曲線

ポビドンヨードが話題になっていたので、
生存時間曲線で表現するにはと復習してみた。

まず、公開されているデータからは
イソジンうがい群25例、対照群16例で、
最終日に脱落がそれぞれ4例と1例です。
適当な表を作成して、ID、treat(うがい有"1"、無”0”）
陰性化するまでの日数をdays(1-4)として図示します。

fit.surve=survfit(Surv(days, respon

もっとみる

メディカルデータサイエンティスト

2020年7月17日 08:42

２群間の時系列データの解析

友人に２群間の時系列データの解析、検定を尋ねられたので
改めて勉強してみたので、健忘録として。

まず、練習用のデータを作成していきます。
症例は30例ずつの2群で、計測は3時点、処置の有無で層別化します。

id = c(1:60)result0 = rnorm(30,40,10)result1 = rnorm(30,25,7)result2 = rnorm(30,20,5)result3 =

もっとみる

メディカルデータサイエンティスト

2020年7月11日 19:04

分散分析の悩みどころ

引き続いて分散分析です。

前回はbrmsパッケージで交互作用ありで解析しましたが、交互作用なしで検討する考えもあります。多重共線性を排除するためです。他に今回は当てはまりませんが、中心化したり、標準化することもあります。ToothGrowthは因子×因子なので中心化も標準化も意味がなさそうです。

交互作用なしで解析すると、OJ1mgと2mgで有意差が出てしまいます。おそらく不適切な解析と考えま

もっとみる

メディカルデータサイエンティスト

2020年7月7日 10:16

brmsパッケージで共分散分析をベイズ推定してみた。

library(brms)library(rstan)

用量doseを因子型に変換します。

data=ToothGrowthdata=transform(data,dose=as.factor(dose))

ベイズの線形回帰パッケージbrmsを使用します。
交互作用を考えるモデルを組みます。

brms.fit=brm(formula= len ~ supp*dose,family=gaus

もっとみる

メディカルデータサイエンティスト

2020年7月6日 18:07

共分散分析を重回帰解析で

また同じToothGrowthのデータで考えていきます。
今回は２元配置分散分析を線形回帰(重回帰解析)で検討していきます。
まず、doseは数値型のままです。

lm.fit=lm(len ~ supp * dose , data=ToothGrowth)summary(lm.fit)

Call:
lm(formula = len ~ supp * dose)
Residuals:
Min 1

もっとみる

マガジン

機械学習(Python編)

機械学習(R言語編)

統計解析

記事一覧

機械学習(ランダムフォレスト編)

機械学習(総集編caret編)

機械学習(単純ベイズ編）

機械学習(k近傍法編)

機械学習(準備編)

機械学習(サポートベクターマシン編)

機械学習(ランダムフォレスト編)

機械学習(決定木編)

機械学習(ニューラルネットワーク編)

機械学習(単純ベイズ編)

生存時間曲線つづき

生存時間曲線

２群間の時系列データの解析

分散分析の悩みどころ

brmsパッケージで共分散分析をベイズ推定してみた。

共分散分析を重回帰解析で