Yasui

生物統計学と遺伝統計学を頑張りたい人/医療ベンチャー企業のAIエンジニア/更新頻度は大…

Yasui

生物統計学と遺伝統計学を頑張りたい人/医療ベンチャー企業のAIエンジニア/更新頻度は大体週1 Github: https://github.com/yasuih777 お問い合わせ: https://note.com/like_biostat/message

マガジン

  • トランスミッション

    • 131,650本

    とらねこが運営する共同マガジン。グループ合計で参加者1,200名を超えました。フォロワ数2000名以上、120,000記事以上が収録されています。🌱コンテンツを広めたい方の参加をお待ちしています。🌱マナー:①連続投稿はしない②社会一般的に不適切な記事は投稿しない③トップ画面は変えない。参加希望の方は,マガジンの固定記事からコメントしてね(ง •̀ω•́)ง

  • データサイエンス

    データサイエンスの話題はこちら

  • 雑談

    雑談です。思ったことなど雑多に書きます

  • 作ったもの

    これまでに作ったものを紹介します

最近の記事

標本データにおける外れ値の考え方②

こんにちは、データ分析の際に厄介者として扱われがちな外れ値について考えてきたいと思います。 外れ値とは、「データのメインボディから外れている値」のことをいいます。例えば、以下のようなデータがあるとき、25.5は怪しいと考えるのは自然だと思います。 $$ \mathcal{X} = \{5.6, 5.7, 5.4, 5.5, 5.2, 5.3, 5.8, 5.4, 5.6, 25.5 \} $$ このような、値が現れたときにどのように考えていくかを書いていきます。 ※こ

    • 標本データにおける外れ値の考え方①

      こんにちは、今回はデータ分析の際に厄介者として扱われがちな外れ値について考えてきたいと思います。 外れ値とは、「データのメインボディから外れている値」のことをいいます。例えば、以下のようなデータがあるとき、25.5は怪しいと考えるのは自然だと思います。 $$ \mathcal{X} = \{5.6, 5.7, 5.4, 5.5, 5.2, 5.3, 5.8, 5.4, 5.6, 25.5 \} $$ このような、値が現れたときにどのように考えていくかを書いていきます。

      • 新卒で東京暮らしして思ったこと

        私は新卒入社を機に東京に引っ越し、約2年間住んでいました。そこで思ったことなどをこの記事では書いていこうと思います。 これまでの経歴は↓に書いています。 ちなみに、これまでの居住地の遷移は以下の通りです。 熊本:19年 広島:6年 東京:2年 熊本:~ 東京に住む前上の居住地遷移の通りですが、私は東京に住む前はずっと地方に住んでいました。東京に行ったのも旅行や就活くらいで、そこに住む人がどのような生活をしているのかもあまり想像できていませんでした。 正直、あま

        • 抽象的な模様を生成する謎アプリを作成した

          現代において間違いなく、ブレイクスルーを起こし続けている技術の一つとして生成AIがあります。 生成AIができることの一つとして、画像生成があります。これは、文字を入力するだけでそれに近い内容の画像を生成します。下の画像は、Canvaのオンライン画像生成機能を使って出力した画像です。文字は「花火っぽいウニ」と入力しました。 写真とほぼ変わらないような解像度でかつ、入力した文字っぽい画像が確かにできています。生成AIはこのように、誰でも簡単にかつオーダーに最大限答えた魅力的な

        標本データにおける外れ値の考え方②

        マガジン

        • トランスミッション
          131,650本
        • データサイエンス
          6本
        • 雑談
          5本
        • 作ったもの
          3本

        記事

          読了: ゲノムオデッセイ

          今回は、私が遺伝統計学面白そう!!と思ったきっかけとなった本を紹介します。それはゲノムオデッセイという本です。 この本を知ったきっかけは、私は医学研究に関わる仕事をしているので、よく羊土社の本を買うのですが、そこで沢山オススメされていたからです。丁度本屋に立ち寄ったときに見つけたので衝動買いしました。 この本は、医学・遺伝子学の教授であるユアン・アンガス・アシュリーさんの経験を元に記されたノンフィクション作品です。循環器系の疾患にゲノム治療の視点から立ち向かっていき、従来

          読了: ゲノムオデッセイ

          Pythonでいろんな確率分布の乱数生成器を作るためのTips

          少し前に統計的仮説検定の謎シミュレーターに関する記事を書きました。 そのシミュレーターでは、指定した確率分布から標本を作成し、その標本同士で検定計算を行うということをしております。 確率分布は複数個用意する必要があるため、全てを愚直に書いていくと物凄いコード量になってしまうでしょう。そうなると、シンプルに実装が大変ですし、一部の処理を変更したいときに全部の確率分布分のコードを変更することになるのでかなりストレスになります。 実際、データサイエンスを学び始めた方は過去に作

          Pythonでいろんな確率分布の乱数生成器を作るためのTips

          e-Statのデータで心不全パンデミックを可視化してみた

          私は現在AIエンジニアをやっておりますが、時にBIが恋しくなるときがあります。普段ゴリゴリに統計を考えて頭が疲れるので、ぼやーっと生産性のないグラフを無性に眺めたくなることがあるのです。 ということで、Tableauでe-Statのデータを使ってダッシュボードを作ってみました。(1年くらい触っていなかったので、なんか手触りが気持ち悪かったですw。) 作ったダッシュボードのリンクはTableau serverに置きました。自由にダウンロードできるので改変等はお好きに(ただし

          e-Statのデータで心不全パンデミックを可視化してみた

          私がデータサイエンスに期待すること

          私は、修士時代に初めてデータサイエンスに触れてから今に至るまで、約5年間ずっとそれに関わることをしてきました。(詳しくは、以下の記事に書いています。) その中で、広く浅い範囲で経験値を積むことが出来たと思うので、データサイエンスに対して何を思っているのか、今後何を期待しているのかを書いていきたいと思います。 将来に希望を見いだせる領域であってほしいビックデータが操作できるようになり、それに伴ってAI技術も著しく進化してきており、データサイエンスはブームの真っ最中であると思

          私がデータサイエンスに期待すること

          16 Peasonalitiesをやってみた

          今更ながら、現在最も主要な自己分析テストである「16 Peasonalities」をやってみました。 軽く自己紹介すると、私はAIエンジニアをやっていてデータを眺めたりするのが好きな人です。(プロフィールは↓) 16 Peasonalitiesとは16 Personalities性格診断は、物事に対する考え方や価値観の傾向から個人の思考を分析し、その人の深層的な強みと弱みに加え、思考の傾向について明らかにする性格診断テストのことを言います。 やり方は、質問を7段階で答え

          16 Peasonalitiesをやってみた

          「Tidy」を共通言語にして、データサイエンス上のやり取りを簡素にしたい

          こんにちは、今回はデータ構造のフレームワークである「Tidy data = 整然データ」を紹介していきたいと思います。 私は、この「Tidy」はデータ分析をプログラミング言語で行いたい人がまず知るべきものであると考えています。この概念を知っていることでAI構築やBIエンジニアリングを行うまでの前処理の道筋を簡単に立てることができます。しかし、このフレームワークはデータサイエンス系の教本で見かけることはあまりありませんし、知らないままに自然と扱っている方も多くいると思います。

          「Tidy」を共通言語にして、データサイエンス上のやり取りを簡素にしたい

          これまでのキャリア、今後の目標など

          記事も5本目ということで書くのに慣れてきたので、投票企画に参加してみようと思います。 これまでのキャリア経歴は↓に書いています。 ざっくり話すと、数学の勉強を頑張った人が生命科学の研究をし、データサイエンティストを経て、現在医療業界のAIエンジニアをしているのが私です。 今の職種で頑張っていこうと思ったのは大学院での経験が生きています。そして、それを現在まで継続することができています。 戦略なく選んだ大学 私は、高校までは将来何をやるのか、全くイメージもなく漠然と大学

          これまでのキャリア、今後の目標など

          統計的仮説検定を端折って説明するのは無理がある

          何故、仮説検定やP値の議論は燃えるのか※ここでは統計的仮説検定の詳しい解説はしません。100%正確に伝えられる自信がないです。数学科の講義資料や数学者が出している統計の本には比較的良い解説が載っていますのでそちらを参照ください。 統計的仮説検定はどの統計本にも載っているような手法で、科学の分野ではよく使われています。その一方で、その手続きや解釈は大変わかりづらく、世の中の使用例には誤用が多く見られます。 そのような統計的仮説検定をわかりやすく説明するのを試みた結果、色んな

          統計的仮説検定を端折って説明するのは無理がある

          統計的仮説検定のシミュレーションができるアプリを作った

          こんにちは、 今回は母集団分布から標本を生成して統計的仮説検定を行うシミュレーター「simulation significant test」を作ったのでそちらの紹介をしていきたいと思います。 アプリのリンクはこちら(Streamlit Cloudを使っています) GitHubのリンクは↓です。ローカルで動かしてみたい場合はCloneして使ってください! 「simulation significant test」を作った目的統計的仮説検定は普段統計を扱うような人にとって悩

          統計的仮説検定のシミュレーションができるアプリを作った

          データサイエンス用プラットフォームのAnacondaが辛い

          こんにちは! 今回はデータサイエンティストを志したなら一度は見た or 聞いたことがあるであろうAnacondaについて書いていこうと思います。 個人的にはこのツールのライブラリ管理における光と闇を理解し始めたころにデータサイエンス脱初心者の道が開けると思っています。 ちなみに私はこのツール使うのを辞めました(Anacondaだけに脱皮と定義します)。PythonにしろRにしろもっと良い管理ツールがあると思ったからです。というわけで始めていきます~。 Anacondaとは

          データサイエンス用プラットフォームのAnacondaが辛い

          プロフィールやnoteをやる意義とか

          初めましてYasuiと申します。このnoteでは自己紹介を書いていきます。 経歴生まれ:九州のどこか 高校:文武両道を掲げる進学校 まじで、部活もしんどかったですw 大学:地方の国公立大学 学士:国立大学の数学科 アクチュアリーになりたくて資格勉強を頑張っていました 修士:国立大学院の応用数理学専攻 WETとDRY両方やってました 新卒:受託分析会社のデータサイエンティスト データ基盤構築、AIモデル構築から施策立案まで幅広く 現職:医療ベンチャー企業の

          プロフィールやnoteをやる意義とか