MITTI

認定理学療法士。Rはハーバード大学がMOOCとして提供しているデータサイエンスの講座、…

MITTI

認定理学療法士。Rはハーバード大学がMOOCとして提供しているデータサイエンスの講座、pythonは東京大学が提供するデータサイエンスの講座(GCI 2019 winter)を修了。臨床半分、データ分析半分(経営・人事)の働き方をしている。最近は病棟看護師の忙しさ指数を作成した。

マガジン

  • Rで始める統計・データ分析入門

    研究やデータサイエンスで使われるR言語について、未経験から脱初心者を目指す話をしていきます。 【対象者】 ・大学生や病院で臨床研究者している方が統計やグラフ作成が必要なんだけどどうやってすればいいかわからない!? ・職場でデータ分析に挑戦したい!でも周りにできる人が誰もいない... と悩んでいる方に刺さるような内容にする予定です 【Rに関して】 ・EdxのProfessional Certificate in Data Scienceを修了 ・LinkedInスキルテストに合格 ・病院の研究チームでRの使い方を指導している ・理学療法士の研修会で統計の講師の経験あり 【注意事項】 ・病院で臨床研究をしている理学療法士です。 ・kaggle的なデータサイエンスや機械学習・AIの情報が欲しい方に刺さる内容はあまり無いです。

  • Edx:ハーバード大学データサイエンス(R)

    無料で世界の大学の授業を受けることができるEdxの勉強記録。今回はハーバード大学の「データサイエンス:Rの基礎」です。

記事一覧

固定された記事

医療統計で必要なtable1、集計からofficeに貼り付けるまでをgtsummaryパッケージで一気に行う

*更新日:2020/09/28 *記事を大幅に追加 *最終更新日:2020/09/30 *gtsummaryのバージョンが上がったことでインストールのコードを一部修正 医療統計に限らず、デー…

MITTI
1年前
18

2章の知識を使った課題

第2章ではtidyverse(特にdplyr)を使ったdata.frameの扱い方について紹介しました。 ここでは実際に架空データを扱ってみます。 今回は解法はいくらでもあります。人によ…

MITTI
4か月前
4

【2-8】Rで集計を行う色々な方法

`summarise()` has grouped output by 'group'. You can override using the `.groups` argument. はじめに今までの記事ではRの基本的な使い方やdata.frameを扱う方法、複…

MITTI
4か月前
3

【2-7】Rでwideデータとlongデータを変換する

はじめにRで分析、集計、グラフを作成するときはlongデータとwideデータについての理解が必要です。 プログラミングやExcelのピボットテーブルで集計をしていないと左のw…

MITTI
7か月前
9

【2-6】複数のdata.frameを横につなげる(bind_cols, joinの使い方)

はじめに【2-5】複数のdata.rameを縦につなげるではdata.frameを縦に繋げました。 今回は横に繋げる方法を紹介します。 例えば"基本情報"と"実際のテスト"という複数のcsv…

MITTI
7か月前
3

【2-5】複数のdata.frameを縦につなげる(bind_rowsの使い方)

例えば1月, 2月, 3月…と複数のcsvやExcelのシートがあったとします。 慣れない方はコピペでデータを繋げたりしますがRでは簡単につなげることができます。 もちろんExce…

MITTI
7か月前
4

【2-4】Rで列名を変更する方法

はじめに第2章ではdata.frameの使い方について紹介しています。 csvやExcelなど外部データを読み込むときは列名を変えたいことはよくあります。 今回は列名を変更する方…

MITTI
7か月前
3

ChatGPTでPubmedの検索式を作ってみる

この記事を読みChatGPTを練習しているところですが、先日のnoteのイベントがlogmiで読めるようになっていました。 この記事を参考にChatGPTでpubmedの検索式を作成してみ…

MITTI
1年前
17

R 〜はじめの一歩〜

先日シリア地震のチャリティー企画でR〜はじめの一歩〜という話をさせていただきました。その時の資料を公開します。 内容Rを始めるときのおすすめの書籍どれも初心者が学…

MITTI
1年前
16

Rを使って3点の座標から角度を求める

はじめにすぐに回答できなかったので数学の復習も兼ねて調べてみました。 基本的な考え方角度は2つのベクトルの内積を計算することで求めることができるらしいです。 デ…

MITTI
1年前

キーボード沼に足を突き刺した話

#買ってよかったもの というタグがあったので1ヶ月前限定でキーボード沼に足を突き刺した話をしてみようと思う。普段はnoteでこんな記事を書かないので思いのまま好きなだ…

MITTI
1年前
52

【2-3】Rで列の追加や修正を行うmutate()の使い方

はじめに第2章ではdata.frameの使い方について紹介しています。 今回は列の追加や修正を行うmutate()について紹介します。 mutate()のイメージExcelでは新しい列を作った…

MITTI
1年前

【2-2】Rで特定の列や行を抽出するselect(), filter(), slice()の使い方

はじめに Rで集計やグラフ作成を行う場面は多くあります。 その際、元の表から分析に使いたい列や行だけを抽出したり、「男性だけを取り出す」みたいに様々な条件にあった…

MITTI
1年前
11

RstudioのEditor font以外のフォントを変更する

*2023.03.06に記事を修正しました。 はじめに最近RStudioを最新に変更したのですが、フォントが変わってしまって困っていました。日本語表示が急に明朝体になってしまっ…

MITTI
1年前
16

第1章の知識を使った課題

第1章ではRの基本的な使い方について説明しました。 ここでは実際に架空データを扱ってみます。 課題1プロジェクトを作成します。 プロジェクト名はtest1とします(他の名…

MITTI
1年前
6

【2-1】Rによる代表的なデータ加工について

データ分析は前処理までが大変一般的にデータ分析や統計をかける場合、IT化が進んでいる施設では分析も行いやすいですが、そうでない施設の場合は分析にかけられる形までに…

MITTI
1年前
3
医療統計で必要なtable1、集計からofficeに貼り付けるまでをgtsummaryパッケージで一気に行う

医療統計で必要なtable1、集計からofficeに貼り付けるまでをgtsummaryパッケージで一気に行う

*更新日:2020/09/28
*記事を大幅に追加

*最終更新日:2020/09/30
*gtsummaryのバージョンが上がったことでインストールのコードを一部修正

医療統計に限らず、データを分析する時に集計表を出す場面は多くあります。
特に医療統計では表1(table1)として図表の最初に提示することが多いです。

ポスター発表だとPower Pointでしょうか。

論文であればWord

もっとみる
2章の知識を使った課題

2章の知識を使った課題

第2章ではtidyverse(特にdplyr)を使ったdata.frameの扱い方について紹介しました。
ここでは実際に架空データを扱ってみます。

今回は解法はいくらでもあります。人によってぜんぜん違うかもしれません。めんどくさく1つずつ手打ちする面倒くさい方法もあれば少ないコードで一気にしてしまう方法もあります。

今ならChatGPTやGeminiに相談すればすぐに教えてくれます。ただどう質

もっとみる
【2-8】Rで集計を行う色々な方法

【2-8】Rで集計を行う色々な方法

`summarise()` has grouped output by 'group'. You can override using the `.groups` argument.

はじめに今までの記事ではRの基本的な使い方やdata.frameを扱う方法、複数のファイルを繋げる方法を紹介してきました。今までの方法を組み合わせればある程度のデータの集計やグラフを作る下準備ができたと言えます。

もっとみる
【2-7】Rでwideデータとlongデータを変換する

【2-7】Rでwideデータとlongデータを変換する


はじめにRで分析、集計、グラフを作成するときはlongデータとwideデータについての理解が必要です。

プログラミングやExcelのピボットテーブルで集計をしていないと左のwideデータが馴染み深いと感じると思います。これは人にとっても見やすい形式だと思われます。

しかし特にRで集計やグラフを作成するとなると右のlongデータの方が圧倒的に作業時間が少なくて済むことがあります。longデータ

もっとみる
【2-6】複数のdata.frameを横につなげる(bind_cols, joinの使い方)

【2-6】複数のdata.frameを横につなげる(bind_cols, joinの使い方)


はじめに【2-5】複数のdata.rameを縦につなげるではdata.frameを縦に繋げました。
今回は横に繋げる方法を紹介します。
例えば"基本情報"と"実際のテスト"という複数のcsvやExcelのデータがあるとします。ここでそれぞれにあるidを揃えてデータがつながると便利ですよね(ExcelだとVlookupです)。他にもデータの構造上行数が揃っている場合もあります(患者の入院時・退院時

もっとみる
【2-5】複数のdata.frameを縦につなげる(bind_rowsの使い方)

【2-5】複数のdata.frameを縦につなげる(bind_rowsの使い方)


例えば1月, 2月, 3月…と複数のcsvやExcelのシートがあったとします。
慣れない方はコピペでデータを繋げたりしますがRでは簡単につなげることができます。

もちろんExcelでもPower Queryを使えばつなぐことは可能ですが、今回はRを使って繋げてみたいと思います。
ちなみに今回の方法は列名の順番がバラバラでも大丈夫です!

データの準備#pacmanパッケージがあるかを確認。な

もっとみる
【2-4】Rで列名を変更する方法

【2-4】Rで列名を変更する方法


はじめに第2章ではdata.frameの使い方について紹介しています。
csvやExcelなど外部データを読み込むときは列名を変えたいことはよくあります。
今回は列名を変更する方法について紹介します。

データの準備#pacmanパッケージがあるかを確認。なければinstall.packagesパッケージをインストールif (!require("pacman")) install.package

もっとみる
ChatGPTでPubmedの検索式を作ってみる

ChatGPTでPubmedの検索式を作ってみる

この記事を読みChatGPTを練習しているところですが、先日のnoteのイベントがlogmiで読めるようになっていました。

この記事を参考にChatGPTでpubmedの検索式を作成してみました。更にChatGPTでその検索式の改善案も提案してもらいました。

Elicitで十分ですって!?そんなこと言わんといて下さい笑

ちなみに使ったのはChatGPT Mar 14 Version. Fre

もっとみる
R 〜はじめの一歩〜

R 〜はじめの一歩〜

先日シリア地震のチャリティー企画でR〜はじめの一歩〜という話をさせていただきました。その時の資料を公開します。

内容Rを始めるときのおすすめの書籍どれも初心者が学ぶ上で有用かつ辞書としても使えるような本ばかりです。

通称宇宙船本という代表的な書籍です。統計以外にもRでこういったことができるというイメージがつきやすいと思います。

個人的には前処理本と考えています。そもそもRを使って分析する前に

もっとみる
Rを使って3点の座標から角度を求める

Rを使って3点の座標から角度を求める

はじめにすぐに回答できなかったので数学の復習も兼ねて調べてみました。

基本的な考え方角度は2つのベクトルの内積を計算することで求めることができるらしいです。

データ#座標の指定o <- c(1,1)a <- c(3,3)b <- c(1,4)#一応可視化tibble(x = c(1,3,1), y = c(1,3,4), label = c("o", "a", "b")) %>% ggpl

もっとみる
キーボード沼に足を突き刺した話

キーボード沼に足を突き刺した話

#買ってよかったもの というタグがあったので1ヶ月前限定でキーボード沼に足を突き刺した話をしてみようと思う。普段はnoteでこんな記事を書かないので思いのまま好きなだけ書いてみたいと思う。

キーボードには沼があるらしいマツコの知らない世界だったかな。最初は意味がわからなかった。
だってキーボードが変わってパソコンの動作が速くなったり、画質が良くなったりしないじゃないですか。いや、確かに謎に湾曲し

もっとみる
【2-3】Rで列の追加や修正を行うmutate()の使い方

【2-3】Rで列の追加や修正を行うmutate()の使い方

はじめに第2章ではdata.frameの使い方について紹介しています。

今回は列の追加や修正を行うmutate()について紹介します。

mutate()のイメージExcelでは新しい列を作ったり、既存の列を一度に修正する作業と似ています。

パッケージと使うデータの準備#pacmanパッケージがあるかを確認。なければinstall.packagesパッケージをインストールif (!requir

もっとみる
【2-2】Rで特定の列や行を抽出するselect(),  filter(), slice()の使い方

【2-2】Rで特定の列や行を抽出するselect(), filter(), slice()の使い方

はじめに Rで集計やグラフ作成を行う場面は多くあります。

その際、元の表から分析に使いたい列や行だけを抽出したり、「男性だけを取り出す」みたいに様々な条件にあった行だけを抽出することが必要になります。

今回はRで指定した列や行だけを取り出すselect関数、slice関数、filter関数を紹介します。
これらはtidyverseパッケージ内にあるdplyrパッケージの機能です。

パッケージ

もっとみる
RstudioのEditor font以外のフォントを変更する

RstudioのEditor font以外のフォントを変更する

*2023.03.06に記事を修正しました。

はじめに最近RStudioを最新に変更したのですが、フォントが変わってしまって困っていました。日本語表示が急に明朝体になってしまったんですよね…

自分の環境は以下の通りです。

macのバージョン:MacBook Pro (Early 2015)R version 4.2.2 (2022-10-31)Rstudioのバージョン:2022.12.0+

もっとみる
第1章の知識を使った課題

第1章の知識を使った課題

第1章ではRの基本的な使い方について説明しました。
ここでは実際に架空データを扱ってみます。

課題1プロジェクトを作成します。
プロジェクト名はtest1とします(他の名前でも可)

課題2url <- "https://github.com/mitti1210/myblog/raw/master/data.xlsx"

(Rを使っても使わなくてもいいので)inputというフォルダを作り、その中

もっとみる
【2-1】Rによる代表的なデータ加工について

【2-1】Rによる代表的なデータ加工について

データ分析は前処理までが大変一般的にデータ分析や統計をかける場合、IT化が進んでいる施設では分析も行いやすいですが、そうでない施設の場合は分析にかけられる形までにすることに多大な労力を割きます。前処理が8割と言われることもあります。

グラフを作ったり統計をかけるための前処理はExcelのコピペのみでは手間がかかりますし間違えた時の修正も大変です(ExcelでもPowerQueryやPowerBI

もっとみる