マガジンのカバー画像

note データアナリストマガジン

32
noteのデータアナリストが、データ分析まわりで考えていることをまとめているマガジンです。
運営しているクリエイター

記事一覧

来年の目標を「メンバーシップ」にしたら、いい感じに腹をくくれた、という話

この記事はメンバーシップに加入すると読めます

noteでデータをより使いやすく・身近な存在にするために取り組んだこと

noteでデータアナリストをしているmukuです。 もうすっかり冬ですね。近所の100均に鏡餅と門松が出ていて、早すぎる季節の移ろいを感じています。 さて、この1年、noteのデータチームは”note社が”データ活用を促進するためにこの1年で達成したいこととそのためのタスクを『データで登りたい山』と名付け、山頂を目指してきました。 データ収集から分析・意思決定まで、広く高い『山』の登頂のために、様々なことに取り組んできました。 半年前にnoteに入社した私も、もちろん

noteのデータアナリストチームでやったことの振り返り [2022年]

こんにちは、noteでデータアナリストをしているrinascimentoです。 2021/10にnoteへジョインして、早いもので1年が経ちました。スタートアップへ転職するとこんなにも時の流れが早いのか、と思うくらいアッという間の1年間。note社はもちろんのこと、データアナリストチームとしても色々チャレンジした1年だったので、何をやってきたのか振り返ってみたいと思います。 やったことは、おおきく3つ(+‪ α‬)のPartに分けてご紹介します。 意思決定支援 Part

noteみんなで「データで登りたい山」という目標を作ったら登りきった話

noteでデータアナリストをしている中川です。noteは11月で期が終わり12月から新年度がはじまります。まだもう少し残っている時期で張りますが、この1年取り組んできたことをまとめてみたいと思います。 オープン社内報とは? 一般的には社員しか見ることのできない「社内報」をだれでも見られるように公開することで、会社の中の様子を感じとってもらう記事企画です。 本日の担当:中川 私たちデータチームはデータで登りたい山というものをメンバーで考え、それを実現するために必要なアクショ

データ活用の文化を広げる!ワークショップをやってみた

データを正しく扱えば新しい道を切り開ける! そんな想いを持ち、noteでデータを活用しながらマーケティングをしているくま(@_kuma3_)です。 今回、noteのデータチームが取り組んでいる『データで登りたい山プロジェクト』の一環で全社員向けにデータ活用の文化を広げるためのトレーニングとしてコンテンツの作成とワークショップを開催しました。 この記事では、そのときに考えた事や工夫した事をオープン社内報として公開します。 オープン社内報とは? 一般的には社員しか見ることので

Kaggleソロ参加だった自分に伝えたい、チームで挑むとよい5つの理由

こんにちは、noteでデータアナリストをしているrinascimentoです。 2022/2よりKaggleを再開し、このたび Kaggle Competitions Expert となることができました 🙌 「H&M Personalized Fashion Recommendations」「American Express - Default Prediction」という2つのコンペティションで銅メダル(上位10%の成績)を獲得してExpertとなれたのですが、両コン

【Kaggle挫折しそうな方向け】AtCoderのススメ

はじめにこの記事は、Kaggle Advent Calendar 2020のアドベントカレンダー9日目の記事です。 Kaggle楽しそうだけど、コーディングが難しくて挫折しそうな方向けに、1つのTipsをご紹介するポエムです(あらかじめご了承ください) Kaggleがうまく楽しめない・・・突然ですが、Kaggle楽しんでいますか? 私も昨年Kaggleを知って、プログラミング未経験ながらPythonも覚えて1~2つコンペに参加して、Kaggle楽しいなあと思いながら、頑

データアナリストとしてnoteへ転職して、5ヶ月が経ちました

明日こそ投稿しよう!と思っていたら、あっという間に入社から5ヶ月経ってしまいました。このままではずっと投稿できないのでは…と思い、勢いにまかせて書いていきます。 かんたんな経歴2021/10よりnoteへデータアナリストとしてジョインしました。前々職は事業会社でマーケターを、前職は支援会社でデータサイエンティストとして活動していました。特に、前職ではデータ分析の奥深さを知り、さまざまなデータやビジネス課題に携わらせてもらいました。実務で使うPythonも、AtCoderとK

相関と見せかけの相関の違いを考える

最近、会社のデータの関係性を分析しようと思っていて、相関、因果などを調べているのですが、その中で勉強したこと、考えたこと、学んだことを一回まとめてみたいと思います。 相関とはまずは、一番の基礎となる相関からスタート。相関とはなにか。英語の方が考えやすいと感じているのですが、英語では、correlation(統計の関数などではcor とかcorrみたいな関数になることが多いですよね)。きっと co-relationなんです。つまり、お互いに関係している状態ということです。

平均の上がり方、下がり方

テレビニュースでやっていた業界の平均年収の上昇、減少。 平均だけで判断するのって実は意外と難しいんですよね。 例えば、ある塾で、クラステスト 10人がテストを受けたとして、点数の高い順に 100、90、80、70、60、50、40、30、20、10 だったとすると 平均点は55点です。 次回、平均点が10点下がったとなったとき、イメージしがちなのはこのパターンではないでしょうか。 90、80、70、60、50、40、30、20、10、0 全員が10点ずつ下がったパターン

検定からのもう一歩。検出力とサンプルサイズを考える。

先日投稿したこの結果には差があるのか(統計的な検定についての考え方) に関しての続きの会です。 前回の範囲までは統計検定でいうとだいたい2級レベルです。ここからさらに一歩進むために理解するべきことが、検出力とそれに合わせてのサンプルサイズの考え方です。 このあたりを理解するために4つのステップで考えていきたいと思います。 ①第1種の過誤と第2種の過誤について理解をしたうえで、 ②検出力とは何か、 ③検出力は何によって決まるのか、最後に、 ④適切なサンプルサイズはどれくらい

この結果には差があるのか(統計的な検定についての考え方)

生活習慣、仕事の仕方何かを変えたりすることでその変えたことには効果があったのか、変えなかった時とは差があったのかが気になったことはないでしょうか? 2種類のキャッチコピー、メインのイラストどっちのほうがみんなに気に入ってもらえるかなどなども含めどっちの方がいいのかといったことも気になることがあると思います。 そんな時に統計的な検定というものを使うことができます。とはいえ、統計的な検定というものの大前提として、多くの人がその行動をすることで全体として差がありそうかを調べる方

相関と共分散

独立の話をしたので、逆に相関のイメージの話をしたいなと。 相関を見るのって大事ですよね。二つのデータの関係性が分かります。片方のデータが大きくなれば、一緒に大きくなるのか、小さくなるのかそれとも、関係ないのか。 独立の関係があるときは、相関がない(無相関)ですね。(でも無相関だから独立だとは言えないらしいです。この辺がむずかしいところ。) 相関とは一言でいえば2つのデータの関係性で、その強さを表す相関係数は1~-1までの間を取る数字になります。1であれば、完全な相関で、

Pythonで「ふもとっぱら」キャンプ場へ行き放題Botをつくってみた

さいきん、とあるきっかけから 「バイク × キャンプ」に目覚めてしまい、いろいろギアを買い揃えては、キャンプ場へ足しげく通っている今日このごろ。 特に静岡県にある「ふもとっぱら」というキャンプ場がお気に入りなのですが、ここはキャンパーの聖地らしく(キャンプアニメ「ゆるキャン△」の舞台にもなっています) ただ、聖地ゆえにWEB予約が激混みで、もはや年内週末は予約が取れない、、、というレベル。(キャンプブーム恐るべし…) キャンセル空きが出た瞬間に予約を入れないと、またたく