hanaori

noteでエンジニアをしています。 統計学がおもしろくて勉強中です。今統計学を勉強中の…

hanaori

noteでエンジニアをしています。 統計学がおもしろくて勉強中です。今統計学を勉強中の方やそんなに詳しくないよ、という方でも楽しんでもらえるような記事を書いていきたいなと思っています。 その他ときどき山や日常の出来ごとも書きます。

マガジン

  • noteのみんな

    • 669本

    noteで働く仲間の、お仕事noteや社員インタビュー、イベントレポをまとめるマガジンです。

  • 統計ガール

    最近統計の勉強をしているので試行錯誤なんかをまとめていきたいです。

  • 山と日常にっき

    登山の記録+日常のあれこれをメモ。

  • わんこアーカイブ

    ヨークシャテリアな日常のアーカイブ。

ウィジェット

  • 商品画像

    Rが生産性を高める〜データ分析ワークフロー効率化の実践

    igjit
    • noteのみんな

      • 669本
    • 統計ガール

    • 山と日常にっき

    • わんこアーカイブ

  • 商品画像

    Rが生産性を高める〜データ分析ワークフロー効率化の実践

    igjit

最近の記事

  • 固定された記事

R|階層線形モデルで渋谷区の賃貸価格を予想する

以前の重回帰による賃貸価格の予測では、『最寄り駅ごとに賃貸価格の母集団分布(例えば各説明変数の母回帰係数)が異なりそう』という仮説を立て、1駅ずつ重回帰モデルを推定していきました。 ただ、駅が変わるとモデルの作り直しをしたりですんごいめんどくさい。 今回はそうした「最寄り駅」ごとに階層構造になっているデータに対する分析手法として知られている「階層線形モデル」を試してそうしたお悩みの解消を試みたいと思います( ˆoˆ ) ■ 今回やりたいこと■ 階層線形モデルとは切片や傾

    • 階層ベイズ入門 | Eight Schoolsデータを用いて特別教育プログラムの効果を推定する

      前回、ベイズ推定の基本について野球選手の打率を例にとって学びました。今回はもう一歩踏み込み、学校教育を例にとって 階層ベイズモデル についてがんばって考えていきたいと思います 💪 使用するデータ今回は Eight Schools というデータを使用します。これはアメリカの 8 つの高校で実施された SAT−V スコア向上のための特別な教育プログラムの平均値と標準誤差(※1)のデータです。例えば、学校 1 の平均と標準誤差はそれぞれ 28, 15 となります。 今回やりたい

      • ベイズ推定入門|野球選手の打率を推定したい

        今年になって『データ解析のための統計モデリング入門(通称 緑本)』を読みました。 とても読者にやさしく書かれているなと感じる一方、どうしても特に後半が個人的に難しく「もっと理解したいな」と思ったため David Robinson さんが書かれた記事なども参考にしつつ、もう少し自分なりに噛み砕いて考えてみようと思います。 ベイズ推定がよくわかってないことが理解が難しかった大きな原因のひとつだと感じたので、こちらの記事ではベイズ推定の基本的な考え方からまとめて共有できればと思

        • 英語で記事を書くときにおすすめのツール(日本語→英語 翻訳編)

          先日、たぶん生まれてはじめて英語で技術的な記事を書きました。 不安を感じながら、それでも投稿してみると思った以上に温かい反応をたくさんいただき、とっても嬉しかったです。 わたしと同じように英語で書いてみたいけど敷居が高く感じている方もいると思います。自分やった方法である程度通じることがわかったので、 今回どのように英語で記事を書いたこちらに残すことにします。参考になる部分があると幸いです。 自分について日本語ですら統計や機械学習周りのことを書くのはまだまだ大変なので、初

        • 固定された記事

        R|階層線形モデルで渋谷区の賃貸価格を予想する

        • 階層ベイズ入門 | Eight Schoolsデータを用いて特別教育プログラムの効果を推定する

        • ベイズ推定入門|野球選手の打率を推定したい

        • 英語で記事を書くときにおすすめのツール(日本語→英語 翻訳編)

        マガジン

        • noteのみんな
          note編集部 他
        • 統計ガール
          hanaori
        • 山と日常にっき
          hanaori
        • わんこアーカイブ
          hanaori

        記事

          Kaggle|American Express - Default Prediction の評価指標を理解したい(ROC曲線/AUC/正規化ジニ係数)

          最近Kaggleに入門しまして、知らないことも多くて日々わくわくしています。最近は『American Express - Default Prediction』というクレジットカードのデフォルト(貸し倒れ)率を予測するコンペティションに参加していました。クレジットカードの支払いが極度に滞ったような状態になりそうかどうかを予測しましょうという内容です。 コンペティションごとにうまく予測ができているかを測るための評価指標が与えられているのですが、自分にとってわかりづらい箇所が何

          Kaggle|American Express - Default Prediction の評価指標を理解したい(ROC曲線/AUC/正規化ジニ係数)

          Kaggle初心者がCompetitions Expertになるためにやった4つのこと

          今年の3月頃から同僚とKaggleを始めて、つい最近2つめの銅メダルを取りKaggle Competitions Expertになりました。 Kaggleは世界規模のデータサイエンスコンペティションに参加できるプラットフォームです。Kaggleを始めてみたものの機械学習エンジニアの経験などはないため、どう戦っていけばいいかわからないことだらけでした。 今回の経験で感じたことが同じようにKaggle興味ある・頑張りたいなと思っている方の参考になればうれしいと思い、体験談の1

          Kaggle初心者がCompetitions Expertになるためにやった4つのこと

          データ分析者さん以外にもおすすめしたい『データ分析のためのデータ可視化入門』

          訳者の1人である @kilometer00さん から『データ分析のためのデータ可視化入門』をいただいて、ざっくり読んだので感想を書きたいなと思います。 この本をおすすめしたい対象者・ データの可視化について学びたい人 ・ 伝わりやすいグラフを描きたい人 良いグラフ・悪いグラフについて考えたいとくに感動したのが、良いグラフ/悪いグラフはなんなのか、というところから説明してくれているところです。今まで R やその他のツールでグラフを書くことはありましたが、どう表現するのが適切

          データ分析者さん以外にもおすすめしたい『データ分析のためのデータ可視化入門』

          大学数学に入門しました -微分積分編-

          今年の 3 月に高校数学を一通り勉強し終えた ので、もうちょっと踏み込んだい内容を勉強したいと思い、微分積分を続けて勉強することにしました。9月に一区切りついたので勉強に使った本などを振り返りたいと思います。 こんなかんじの人間です統計学を勉強中なのですが、もう少し理解できるようになりたいな、と思って数学の勉強をはじめました。 ・ 文系(英文学科)出身 ・ Webエンジニア ・ 数ⅠA〜数ⅢCまでは一応復習済み 受講した講座一度勉強した範囲だったり、数学が得意という方は

          大学数学に入門しました -微分積分編-

          統計学|検出力とはなんぞや

          検出力の手計算がいつもぱっとできないので、これを機に検出力についてまとめてみようと思います。同時にこれから勉強したい、今そこ勉強中だよという方の参考になるとうれしいです 🌱 統計的仮説検定の基本的な流れ最初に基本的な統計的仮説検定の流れを確認します。 第1種の誤りと第2種の誤り 検定を行うときは有意水準・棄却域を定め、求めた検定統計量がその中に入ると自動的に H0 が棄却されます。しかし棄却域に入っているものの本当は H0 が正しい場合もあります。反対に本当は H1 が正

          統計学|検出力とはなんぞや

          瀕死のお肌を助け隊 - むちゃくちゃ肌荒れしたときの対処法 -

          2020年3月末あたりにかつてない程の肌荒れに見舞われました。乙女としては非常にショックを受ける荒れっぷりでした。 幸いにも 1ヶ月ほどで回復することができたので同じように悩んでいる方に向けて、あるいは未来の自分に向けてその時なにをしたのかを残しておこうと思います。 症状・ お肌がデコルテ付近までザラザラ・ゴワゴワする ・ かつてないにきびの数(赤くて痛い 😢) もともとそんなに肌は強くないほうで、生理前や寝不足になったとき等かならずと言っていいほどニキビができてしまう

          瀕死のお肌を助け隊 - むちゃくちゃ肌荒れしたときの対処法 -

          数学を勉強する時におすすめのツール

          少し前に高校数学をやり直したのですが、徐々に勉強スタイルが整ってきたので使って便利だったツールをまとめておこうと思います。 今から勉強はじめようと思ってる方や、もうすでにはじめられてる方の参考になればうれしいです。 GeoGebra Graphing Calculator 数式を入力するとグラフを描いてくれます。 Webブラウザやスマホ・iPadのアプリでも使用でき、ぱっとグラフの形を確認したいときにとっても便利です。 Webブラウザや iPad などでも使用できます

          数学を勉強する時におすすめのツール

          文系社会人が統計のために1から高校数学をやりなおしました

          こういう人間です・ 文系(英文学科) ・ Webエンジニア ・ 統計を勉強中 モチベーションここ2年ほど統計を勉強しているのですが、そこで毎回立ちふさがるのが数学の壁でした。わたしは文系ということもあって数ⅡB(しかも途中まで)しか履修していなかったため、微分積分や線形代数などが出てくると理解することが難しく時間がかかってしまいます。 でももっと統計を知りたいし理解したい 😭 という気持ちをずっと感じていて今回数学をやり直すことにしました。 高校3年分と考えるとなかな

          文系社会人が統計のために1から高校数学をやりなおしました

          蔵王連邦|はじめての雪山とキツネ村、ときどき子ヤギ

          noteの登山部 with THE GUILDの面々で雪山ハイクに行ってきました。 わたしは京都出身で現在東京で働いていますが、どちらもあまり雪が降らないため雪にはかなりの憧れがあります。そのため誘っていただいたときはとても嬉しかったです。 今回行った蔵王連邦の地蔵山はロープウェイで頂上まで登ることができます。「雪山行くよ!」とまわりに報告したところ、いろんな方々に「危険だよ、生還してな」と言われ怖くて若干怯みましたが、蔵王は雪山初心者でも安心できる優しい雪山だったと思い

          蔵王連邦|はじめての雪山とキツネ村、ときどき子ヤギ

          中央アルプス|男前な風貌の空木岳で雲海を眺める

          9月に登って空木岳です(ずっと下書きのまま放置していた熟成noteです👼) 前回は秋雨前線と台風の卵に挟まれ、前日(なんなら当日)までどきどきしながら天気を伺っていましたが、今回はなんの心配もなく晴れました。 今回は他の会社の登山部と合同登山。 社内のメンバーで行くのも楽しいですが、社外メンバーもとっても楽しい! ▲ スケジュール■ 9/13 6:00    中央アルプス駒ケ岳ロープウェイ 千畳敷駅 に到着 11:30   檜尾岳 登頂 13:45  熊沢岳 登頂 1

          中央アルプス|男前な風貌の空木岳で雲海を眺める

          北アルプス|白馬岳の1泊2日の大雪渓 満喫コース

          白馬岳は北アルプスにある標高2,932mの山です。 今回は会社の登山部でちょっとハードだけど人気と噂の大雪渓を経由するコースを登って来ました。 空の青・草木の緑・雪の白が映える美しい山だったので、とてもおすすめです! 🗻 今回の旅程■ 8/23 5:30  猿倉(白馬尻小屋)に到着 9:00    岩室跡・大雪渓を登る 14:30  白馬岳頂上宿舎到着 15:00  宿の周りを散策 ■ 8/24 9:00  白馬岳山頂に到着 10:00   小蓮華山頂上   10:30 

          北アルプス|白馬岳の1泊2日の大雪渓 満喫コース

          ARIMAモデルでnoteの週間アクティブユーザー数を予測する

          今年早々、note の月間アクティブユーザー数が1,000万人を突破したという記事が出たと思います。 実際 note はかなりの勢いで成長していますが、はたして過去のデータを用いて今後の成長の予測ができるのかどうか気になりました。 今回はGAの週間アクティブユーザー数データを用いて、どのようにnote が成長しているのか、次週のアクティブユーザー数が予測できるのかを見ていきたいと思います 😊 ■ 原系列・差分系列・対数差分系列の確認 ① 原系列 ・ 各時点で期待値・

          ARIMAモデルでnoteの週間アクティブユーザー数を予測する