マガジン

  • くまの読書

    読んだ本のレビューを書いています

  • シリーズ:生存時間分析

    生存時間分析の基礎から機械学習系の生存時間分析のアルゴリズムまで git: https://github.com/Greenwind1/survival-analysis

  • くまの蔵書

    素敵な記事を蔵にいれています

  • くまのメモ

    個人的な論文のまとめ・メモを公開しています.あくまでも個人的にまとめているため,あまり参考にならないかもしれませんが,怒らないでください.

  • Satellite Imagery

    趣味で勉強している衛星画像の画像分析についてアレコレ記事を書いていこうと思います.

    • くまの読書

    • シリーズ:生存時間分析

    • くまの蔵書

    • くまのメモ

    • Satellite Imagery

最近の記事

  • 固定された記事

はじめに

この note では,データ分析や統計・数理などのトピックを取り扱っていこうと思います.主な興味の対象は,機械学習(深層学習),統計・数学,金融・保険などです. 最近は,仕事の関係上,もっぱら医療データの分析に従事していますので,そのあたりを重点的に何か output していけたらなと思っています. また,私 Maxwell が 2019年 10月に著者の一人として関わり,出版させていただいた「Kaggleで勝つデータ分析の技術」(技術評論社)にて補足しておいた方が良いかな

    • 読書感想文「R ユーザのための tidymodels 実践入門」

      2022 年も終わりですが,2023 年の 1 月に出版されます 「R ユーザのための tidymodels 実践入門」 を著者の一人である 瓜生氏 及び 技術評論社様 から献本いただきました. 本記事はその読書感想を徒然なるままに述べたものとなります. 宜しければ少しの間お付き合いいただけると嬉しく思います. 1.   本書の特徴皆さんは R 言語の package である tidymodels はご存知でしょうか? ご存知ない方も R ユーザーであれば,tidyver

      • 読書感想文「Vision Transformer 入門」

        先日,今年の 9 月末に出版された「Vision Transformer 入門」を 技術評論社様 から献本いただきました. 本記事はその読書感想となります. Computer Vision (CV) の分野に Transformer を応用する Vision Transformer (ViT) の論文が ArXiv に投稿されてから二年が経ちました (Oct. 2022 現在). 論文が発表されてから現在に至るまで僅か二年の間に,私が知る限りでも非常に多くの ViT に関

        • 読書感想文「データ分析のためのデータ可視化入門」

          2021/1/26 に講談社サイエンティフィック様から出版された「データ分析のためのデータ可視化入門」を翻訳者陣(瓜生真也様・江口哲史様・三村喬生様)のうちの一人であるシエ口様より献本いただきました. 本記事はその読書感想を記したものです. 本書の概要本書はデューク大学の社会学で教鞭をとる Kieran Healy の名著「Data Visualization: A Practical Introduction」(2018)の翻訳本です. 原本は R のコミュニティにのみ

        マガジン

        マガジンをすべて見る すべて見る
        • くまの読書
          Maxwell
        • シリーズ:生存時間分析
          Maxwell
        • くまの蔵書
          Maxwell
        • くまのメモ
          Maxwell
        • Satellite Imagery
          Maxwell

        記事

        記事をすべて見る すべて見る

          生存時間分析の基礎4(Cox 比例ハザードモデル)

          秋になり大分涼しくなってきましたが,皆さんお元気でしょうか? 前回から大分間が空いてしまいましたが,本シリーズも第 4 回目となりました. 本シリーズの内容の多くは,「エモリー大学クラインバウム教授の生存時間解析(サイエンティスト社)」にもとづいたものとなっていますので,より詳しく勉強されたい方は合わせてそちらを読んでみることをお勧めします. さて,今回からモデリングのお話へとうつっていきます. 最終目標は「機械学習の生存時間分析モデルの紹介」ですので,まだまだ先は長そうで

          読書感想文「世界一わかりやすい医療政策の教科書」

          今回は,2020/06/01 に出版された,カルフォルニア大学ロサンゼルス校 内科学 助教授 津川友介先生 による「世界一わかりやすい医療政策の教科書」の読書感想となります. 1.   全体を通しての感想なかなか一言でまとめるのは難しいですが,私なりの言葉でいうのであれば,「非常に野心的な良本」でした. この言葉だけだと意味不明ですよね. どういうことかといいますと・・・ この本は医療政策学に関しての本なのですが,この医療政策学は ・医療経済学 ・統計学 ・政治学 /

          SpecAugment: A Simple Data Augmentation Method for Automatic Speech Recognition

          Daniel S. Park, William Chan, Yu Zhang, Chung-Cheng Chiu, Barret Zoph, Ekin D. Cubuk, Quoc V. Le Google Brain SpecAugment は Google Brain チームから提案された speech recognition における spectrogram の data augmentation の手法.約 1 年前に(本記事を書いている現在は Jul. 2020)

          Validity and Efficiency of Approximation Methods for Tied Survival Times in Cox Regression

          Irva Hertz-Picciotto and Beverly Rockhill BIOMETRICS 53, 1151-1156 Sep. 1997 1.   Abstract セミパラメトリックなCox 比例ハザードモデルは,生存時間の確率分布を仮定していないため,サンプルのイベント発生順をもとに尤度の式を決定するモデルである.分析に使用するサンプルを常にモニタリングすることができていれば,生存時間 および イベント発生時点 を正確に計測できるが,現実問題としてそれ

          Kaggle: Dstl Satellite Imagery Feature Detection 2

          前回に続いて,Dstl Sattelite Imagery Feature Detection の解説をしていきたいと思います. 第 1 回はタスクの理解(背景・評価指標)をしましたが,今回はデータの確認をしてきます. 以下のような流れでみていきます. 1.   Data DescriptionDstl コンペのデータ(https://www.kaggle.com/c/dstl-satellite-imagery-feature-detection/data)一覧は以下の

          biglasso: Extend Lasso Model Fitting to Big Data in R

          先日,貧弱な計算環境で R を使用して分析している時に,そこそこ大きなテーブルデータ(50GB 程)を使って Lasso 回帰を行う必要がでてきてしまいました.無理矢理計算を走らせたところ,普通に計算機が固まり帰宅したくなりました. が・・・,そこは一応社会人ですので何か解決策はないか調べていたところ,biglasso という下記のリポジトリに行きつきました. 下記論文によると,16 GB しかメモリのないラップトップ上で,31 GB のデータを使った Lasso 回帰が可

          Kaggle: Dstl Satellite Imagery Feature Detection 1

          2016年 12月 ~ 2017年 3月にかけて,Kaggle で開催されていた衛星画像をもとにした segmentation タスクのコンペ 「Dstl Sattelite Imagery Feature Detection」 の個人的な解説を書いていきます. 3 年前の開催当時,私は segmentation に疎いのもあり参加はしていませんでしたが,興味深く watch していたのだけは記憶に残っています. そして,このコンペ以降,上空からの画像という点では,「雲」や

          Fast AutoAugment

          Arxiv Official Pytorch implementation One of the Authors, Kaggle Competitions Master 1. Abstract 1-1.   Fast AutoAugment is an algorithm to automatically search for augmentation policies. 1-2.   A GPU workload of Fast AutoAugment is sm

          The Lovasz-Softmax loss: A tractable surrogate for the optimization of the intersection-over-union measure in neural networks

          Arxiv Tensorflow / Pytorch implementation Demo 1. Abstract 1-1.   Loss function for direct optimization w.r.t Jaccard index 1-2.   Optimizing the Jaccard index in a continuous optimization framework 1-3.   Lovasz hinge loss: binary im

          N-BEATS: Neural basis expansion analysis for interpretable time series forecasting

          Arxiv Keras / Pytorch implementationDemo 1. Abstract 1-1.   Improving accuracy by 3% over Smyl's winning solution in M4 competition. 1-2.   M4 competition summary paper:     https://www.sciencedirect.com/science/article/pii/S016920701930

          生存時間分析の基礎3(生存曲線の検定)

          前回の記事を up してからかなりの期間をあけてしまいましたが,ようやく重い腰をあげて続編を up しました. ペースの遅い投稿者ですみません(汗.このような感じで遅々としてやっていくと思いますが,気がむいた際にでも読んでいただけますと幸いです. ちなみに,続編を執筆せずに何をやっていたのかといいますと,昨年の 11 月から 今年 1 月上旬にかけて開催されていた ProbSpace の「浮世絵作者予測」や 昨年末から今年 3 月上旬まで開催されていた Kaggle の 「

          読書感想文「Python ではじめる Kaggle スタートブック」

          2020/3/19 に講談社様から「Python ではじめる Kaggle スタートブック」が出版されますが,本書を筆者の村田様より献本いただきましたので,今回はその感想を投稿したいと思います. なお,私こと Maxwell は共著(門脇・坂田・保坂・平松)で昨年の 10 月に「Kaggle で勝つデータ分析の技術」を技術評論社様から出版させていただいています.本書は,拙著と相補関係にあり,初心者向けとしての意味合いが強いと思います.もし「Kaggle で勝つデータ分析の技