マガジンのカバー画像

note データアナリストマガジン

32
noteのデータアナリストが、データ分析まわりで考えていることをまとめているマガジンです。
運営しているクリエイター

#統計検定準1級

検定からのもう一歩。検出力とサンプルサイズを考える。

先日投稿したこの結果には差があるのか(統計的な検定についての考え方) に関しての続きの会です。 前回の範囲までは統計検定でいうとだいたい2級レベルです。ここからさらに一歩進むために理解するべきことが、検出力とそれに合わせてのサンプルサイズの考え方です。 このあたりを理解するために4つのステップで考えていきたいと思います。 ①第1種の過誤と第2種の過誤について理解をしたうえで、 ②検出力とは何か、 ③検出力は何によって決まるのか、最後に、 ④適切なサンプルサイズはどれくらい

この結果には差があるのか(統計的な検定についての考え方)

生活習慣、仕事の仕方何かを変えたりすることでその変えたことには効果があったのか、変えなかった時とは差があったのかが気になったことはないでしょうか? 2種類のキャッチコピー、メインのイラストどっちのほうがみんなに気に入ってもらえるかなどなども含めどっちの方がいいのかといったことも気になることがあると思います。 そんな時に統計的な検定というものを使うことができます。とはいえ、統計的な検定というものの大前提として、多くの人がその行動をすることで全体として差がありそうかを調べる方

相関と共分散

独立の話をしたので、逆に相関のイメージの話をしたいなと。 相関を見るのって大事ですよね。二つのデータの関係性が分かります。片方のデータが大きくなれば、一緒に大きくなるのか、小さくなるのかそれとも、関係ないのか。 独立の関係があるときは、相関がない(無相関)ですね。(でも無相関だから独立だとは言えないらしいです。この辺がむずかしいところ。) 相関とは一言でいえば2つのデータの関係性で、その強さを表す相関係数は1~-1までの間を取る数字になります。1であれば、完全な相関で、

条件付き独立とは

先日、今年目標にしていた統計検定準1級合格することができました。 合格できたのは100%、毎週すうがくぶんかの先生たちが見捨てることなく教えてくれたからです。複雑な(私から見るとですが、)数式でポカーンとするたびに翻訳してくれるというか、何とか私でもイメージできるように説明してくれ、内容を理解できるようにしてくれたからだと思っています。 自分が特にそうなのかもしれませんが、まずふわっと全体のイメージと特徴的なところをつかむと全体の理解が進みやすいなぁと思っています。 そん