リフト値、支持度、信頼度

リフト値、支持度、信頼度の解説

リフト値(Lift)、支持度(Support)、信頼度(Confidence)は、アソシエーション分析やマーケットバスケット分析といったデータマイニングの文脈で用いられる尺度です。これらの指標は、トランザクションデータにおけるアイテム間の関連性を評価するのに役立ちます。

支持度 (Support)

支持度は、全トランザクションのうち、特定のアイテムセットが同時に現れる割合を示します。つまり、全購買データの中で、あるアイテムの組み合わせがどれくらいの頻度で発生しているかを表しています。

使う場面:

  • アイテムの組み合わせがどれだけ一般的かを知りたい場合。

  • 頻繁なアイテムセットを特定する基礎として。

信頼度 (Confidence)

信頼度は、あるアイテムAが購入された際に、アイテムBも同時に購入される条件付き確率です。これは、あるルールがどれだけ信頼できるかを測る尺度です。

使う場面:

  • アイテムAを購入する顧客がアイテムBも購入するかどうかを予測したい場合。

  • プロモーションやクロスセリング戦略の決定に。

リフト値 (Lift)

リフト値は、アイテムAとアイテムBが一緒に購入される確率と、これらが独立して購入される確率の比率を示します。リフト値が1より大きい場合、二つのアイテム間には正の関連があり、1より小さい場合は負の関連があることを意味します。

使う場面:

  • 2つのアイテム間に実際に関連性があるかどうかを判断したい場合。

  • 単なる偶然によるものか、または強い関連性があるかを分析したい場合。

具体例

以下にこれらの概念を説明するための具体的な例を示します。

想定するデータセット:スーパーマーケットのトランザクションデータ

  • トランザクションの総数:1000回

  • パンを購入したトランザクション数:200回

  • 牛乳を購入したトランザクション数:150回

  • パンと牛乳を同時に購入したトランザクション数:50回


この例では、リフト値が1以上なので、パンと牛乳の購入は互いに関連があることを示しています。これらの指標を組み合わせることで、マーケティング戦略や商品配置、在庫管理などに役立つ洞察を得ることができます。

この記事が気に入ったらサポートをしてみませんか?