見出し画像

「カウント」と「個別のカウント」の違い ~Advanced Iを解いて~

「カウント」と「個別のカウント」は同じような名前であり、迷うことも多いのではないでしょうか。

私もAdvanced Iを受けて「カウント」と「個別のカウント」のどちらを選べばいいのか迷うことがありました。データを見比べながらどう違うのか、ここでちゃんと理解したくまとめてみます。

迷った点は

私が作りたいと思ったのは「顧客ごとの購入回数」です。これを見るには顧客IdごとのオーダーIdをカウントすればいいと思ったのですが、オーダーIdを「カウント」(=COUNT)すればいいのか「個別のカウント」(=COUNTD)すればいいのかと迷いました。

画像1

※これで合っているのかわからなくなりました。

データを見比べよう

困ったときは実際にどう違うのかデータを見比べてみます。

今回は顧客ごとの購入回数が知りたいので、「顧客Id」「オーダーId」「カウント(オーダーId)」を列に入れてみました。

画像2

カウント(オーダーId)」に数字が1~4の数字が入っているのがわかります。

では、「個別のカウント(オーダーId)」はどうなるでしょうか。「顧客Id」「オーダーId」「個別のカウント(オーダーId)」を列に入れてみます。

画像3

個別のカウント(オーダーId)」に数字が1の数字だけが入っているのがわかります。

購入回数はオーダーIdが一意になるように(1つのオーダーIdで1と数える)数えられればよいと思うので、今回は「個別のカウント(オーダーId)」を選べばよいとわかりました。

しかし、なぜ「カウント(オーダーId)」では2~3のような数字も出てきたのでしょうか。その答えは列に「製品Id」も追加するとわかりました。

※「顧客Id」「オーダーId」「製品Id」「カウント(オーダーId)」

画像4

※「顧客Id」「オーダーId」「製品Id」「個別のカウント(オーダーId)」

画像5

製品Id」を追加すると、「カウント(オーダーId)」「個別のカウント(オーダーId)」のどちらも数字が1になりました。また、「カウント(オーダーId)」で2~3のような数字があった個所に「製品Id」が複数あることがわかります。

つまり、「カウント(オーダーId)」では「製品Id」の数だけ「オーダーId」が数えられていたのです。「カウント(オーダーId)」ではオーダーIdに重複があっても出てきた数だけ数えていたのですね。

まとめ

個別のカウント(オーダーId)」は同じオーダーIdを1と数え、「カウント(オーダーId)」はオーダーIdが出た回数を数えるとわかりました。

今回、カウントと個別のカウントを理解するにあたり、下記記事も参考にさせていただきました。こちらにも記載のある通り、自分で一度データの中身をきちんと確かめる作業をすることが大事だと思います。

ここまで閲覧いただきありがとうございました!

この記事が気に入ったらサポートをしてみませんか?