マガジン

  • シリーズ:生存時間分析

    生存時間分析の基礎から機械学習系の生存時間分析のアルゴリズムまで git: https://github.com/Greenwind1/survival-analysis

  • くまの読書

    読んだ本のレビューを書いています

  • くまの蔵書

    素敵な記事を蔵にいれています

  • くまのメモ

    個人的な論文のまとめ・メモを公開しています.あくまでも個人的にまとめているため,あまり参考にならないかもしれませんが,怒らないでください.

  • Satellite Imagery

    趣味で勉強している衛星画像の画像分析についてアレコレ記事を書いていこうと思います.

最近の記事

  • 固定された記事

はじめに

この note では,データ分析や統計・数理などのトピックを取り扱っていこうと思います.主な興味の対象は,機械学習,統計・数学,金融・保険などです. 最近は,仕事(出向先での研究)の関係上,医療データを取り扱うことが多いので,そのあたりを重点的に何か output していけたらなと思っています. また,私 Maxwell が 2019年 10月に著者の一人として関わり,出版させていただいた「Kaggleで勝つデータ分析の技術」(技術評論社)にて補足しておいた方が良いかなとい

    • 生存時間分析の基礎 6(比例ハザード仮定の検討 その 2)

      生存時間分析の基礎の第 6 回目となります. 今回もぼちぼちやっていきましょう. 前回は Cox PH モデルの前提である「比例ハザード仮定」が成立しているかどうかを検証する方法として,グラフを使う方法を解説しました. グラフを使う方法はグラフを視て判断するという定性的な方法でした. どんな方法であったか忘れてしまった方は前回を振り返ってみてください. 今回からは,都合数回に渡って定量的な統計的検定手法である「適合度を使った方法」をみていきたいと思います. 分析結果を公に

      • 生存時間分析の基礎 5(比例ハザード仮定の検討 その 1)

        生存時間分析の基礎の第 5 回目となります. なんと・・・前回の記事から二年以上も間が空いてしまいました. 更新が遅くてすみません. ぼちぼちと再開していきたいと思います. そういえば,しばらくみないうちに note の仕様が大幅に改良されていますね.Tex 形式で数式が表現できるようになっていて,とても嬉しいです. 内部的には MathJax を使用しているのでしょうか. さて,今回からは計 3 回に渡って,Cox PH モデルの前提であった「比例ハザード仮定」が成立し

        • 読書感想文「Kaggle に挑む深層学習プログラミングの極意」

          2023 年の 1 月末に出版されました 「Kaggle に挑む深層学習プログラミングの極意」 を著者の一人である 小嵜氏 及び 講談社サイエンティフィク様 から献本いただきました. 本書のお話を最初に聞いた時,あることを思い出しました. それは,4 年程前の「Kaggle で勝つデータ分析の技術」の執筆当時, 「深層学習系の Kaggle 本をだすのはとても大変で,テーブルデータ主体の本の方がまだ執筆しやすい」 と,感じたことです. なぜなら,深層学習の分野は日進月歩

        • 固定された記事

        はじめに

        • 生存時間分析の基礎 6(比例ハザード仮定の検討 その 2)

        • 生存時間分析の基礎 5(比例ハザード仮定の検討 その 1)

        • 読書感想文「Kaggle に挑む深層学習プログラミングの極意」

        マガジン

        • シリーズ:生存時間分析
          6本
        • くまの読書
          6本
        • くまの蔵書
          2本
        • くまのメモ
          4本
        • Satellite Imagery
          2本

        記事

          読書感想文「R ユーザのための tidymodels 実践入門」

          2022 年も終わりですが,2023 年の 1 月に出版されます 「R ユーザのための tidymodels 実践入門」 を著者の一人である 瓜生氏 及び 技術評論社様 から献本いただきました. 本記事はその読書感想を徒然なるままに述べたものとなります. 宜しければ少しの間お付き合いいただけると嬉しく思います. 1. 本書の特徴皆さんは R 言語の package である tidymodels はご存知でしょうか? ご存知ない方も R ユーザーであれば,tidyver

          読書感想文「R ユーザのための tidymodels 実践入門」

          読書感想文「Vision Transformer 入門」

          先日,今年の 9 月末に出版された「Vision Transformer 入門」を 技術評論社様 から献本いただきました. 本記事はその読書感想となります. Computer Vision (CV) の分野に Transformer を応用する Vision Transformer (ViT) の論文が ArXiv に投稿されてから二年が経ちました (Oct. 2022 現在). 論文が発表されてから現在に至るまで僅か二年の間に,私が知る限りでも非常に多くの ViT に関

          読書感想文「Vision Transformer 入門」

          読書感想文「データ分析のためのデータ可視化入門」

          2021/1/26 に講談社サイエンティフィック様から出版された「データ分析のためのデータ可視化入門」を翻訳者陣(瓜生真也様・江口哲史様・三村喬生様)のうちの一人であるシエ口様より献本いただきました. 本記事はその読書感想を記したものです. 本書の概要本書はデューク大学の社会学で教鞭をとる Kieran Healy の名著「Data Visualization: A Practical Introduction」(2018)の翻訳本です. 原本は R のコミュニティにのみ

          読書感想文「データ分析のためのデータ可視化入門」

          生存時間分析の基礎4(Cox 比例ハザードモデル)

          秋になり大分涼しくなってきましたが,皆さんお元気でしょうか? 前回から大分間が空いてしまいましたが,本シリーズも第 4 回目となりました. 本シリーズの内容の多くは,「エモリー大学クラインバウム教授の生存時間解析(サイエンティスト社)」にもとづいたものとなっていますので,より詳しく勉強されたい方は合わせてそちらを読んでみることをお勧めします. さて,今回からモデリングのお話へとうつっていきます. 最終目標は「機械学習の生存時間分析モデルの紹介」ですので,まだまだ先は長そうで

          生存時間分析の基礎4(Cox 比例ハザードモデル)

          読書感想文「世界一わかりやすい医療政策の教科書」

          今回は,2020/06/01 に出版された,カルフォルニア大学ロサンゼルス校 内科学 助教授 津川友介先生 による「世界一わかりやすい医療政策の教科書」の読書感想となります. 1. 全体を通しての感想なかなか一言でまとめるのは難しいですが,私なりの言葉でいうのであれば,「非常に野心的な良本」でした. この言葉だけだと意味不明ですよね. どういうことかといいますと・・・ この本は医療政策学に関しての本なのですが,この医療政策学は ・医療経済学 ・統計学 ・政治学 /

          読書感想文「世界一わかりやすい医療政策の教科書」

          SpecAugment: A Simple Data Augmentation Method for Automatic Speech Recognition

          Daniel S. Park, William Chan, Yu Zhang, Chung-Cheng Chiu, Barret Zoph, Ekin D. Cubuk, Quoc V. Le Google Brain SpecAugment は Google Brain チームから提案された speech recognition における spectrogram の data augmentation の手法.約 1 年前に(本記事を書いている現在は Jul. 2020)

          SpecAugment: A Simple Data Augmentation Method for Automatic Speech Recognition

          Validity and Efficiency of Approximation Methods for Tied Survival Times in Cox Regression

          Irva Hertz-Picciotto and Beverly Rockhill BIOMETRICS 53, 1151-1156 Sep. 1997 1. Abstract セミパラメトリックなCox 比例ハザードモデルは,生存時間の確率分布を仮定していないため,サンプルのイベント発生順をもとに尤度の式を決定するモデルである.分析に使用するサンプルを常にモニタリングすることができていれば,生存時間 および イベント発生時点 を正確に計測できるが,現実問題としてそれ

          Validity and Efficiency of Approximation Methods for Tied Survival Times in Cox Regression

          Kaggle: Dstl Satellite Imagery Feature Detection 2

          前回に続いて,Dstl Sattelite Imagery Feature Detection の解説をしていきたいと思います. 第 1 回はタスクの理解(背景・評価指標)をしましたが,今回はデータの確認をしてきます. 以下のような流れでみていきます. 1. Data DescriptionDstl コンペのデータ(https://www.kaggle.com/c/dstl-satellite-imagery-feature-detection/data)一覧は以下の

          Kaggle: Dstl Satellite Imagery Feature Detection 2

          biglasso: Extend Lasso Model Fitting to Big Data in R

          先日,貧弱な計算環境で R を使用して分析している時に,そこそこ大きなテーブルデータ(50GB 程)を使って Lasso 回帰を行う必要がでてきてしまいました.無理矢理計算を走らせたところ,普通に計算機が固まり帰宅したくなりました. が・・・,そこは一応社会人ですので何か解決策はないか調べていたところ,biglasso という下記のリポジトリに行きつきました. 下記論文によると,16 GB しかメモリのないラップトップ上で,31 GB のデータを使った Lasso 回帰が可

          biglasso: Extend Lasso Model Fitting to Big Data in R

          Kaggle: Dstl Satellite Imagery Feature Detection 1

          2016年 12月 ~ 2017年 3月にかけて,Kaggle で開催されていた衛星画像をもとにした segmentation タスクのコンペ 「Dstl Sattelite Imagery Feature Detection」 の個人的な解説を書いていきます. 3 年前の開催当時,私は segmentation に疎いのもあり参加はしていませんでしたが,興味深く watch していたのだけは記憶に残っています. そして,このコンペ以降,上空からの画像という点では,「雲」や

          Kaggle: Dstl Satellite Imagery Feature Detection 1

          Fast AutoAugment

          Arxiv Official Pytorch implementation One of the Authors, Kaggle Competitions Master 1. Abstract 1-1. Fast AutoAugment is an algorithm to automatically search for augmentation policies. 1-2. A GPU workload of Fast AutoAugment is sm

          Fast AutoAugment

          The Lovasz-Softmax loss: A tractable surrogate for the optimization of the intersection-over-union measure in neural networks

          Arxiv Tensorflow / Pytorch implementation Demo 1. Abstract 1-1. Loss function for direct optimization w.r.t Jaccard index 1-2. Optimizing the Jaccard index in a continuous optimization framework 1-3. Lovasz hinge loss: binary im

          The Lovasz-Softmax loss: A tractable surrogate for the optimization of the intersection-over-union measure in neural networks