バスケット分析

バスケット分析とは、一緒に買われている商品の組み合わせを明らかにする分析手法のこと。バスケット分析の「バスケット」とは、「買い物かご」の意味であり、顧客の買い物かごの中身を分析するという意味でそう呼ばれる。仮説なしにデータを分析するところから新たな知見を得る手法であり、データマイニング的アプローチである。

 バスケット分析には「アソシエーション分析」(相関分析)の手法が使われる。アソシエーション分析では、POSデータから意味のあるルール(アソシエーションルール)を抽出する。

 アソシエーション分析では、「支持度」「信頼度」「リフト値」の3つの指標を用いて、条件Aと結論Bという2つの事象の関連性を分析する。例えば、バスケット分析の場合、基本的なルールは「Xという商品を買う人は、Yという商品も一緒に買う」という形で抽出される。この場合、条件に相当するのが「Xという商品を買う」という事象、結論に相当するのが「Yという商品も一緒に買う」という事象である。

▽支持度(support)
 全体のうち、どのくらい条件Aと結論Bが同時に発生しているかという割合を示す指標。上記の例では、「全体を1としたとき、XとYを同時に買っている顧客の割合」という数値になる。この数値があまりにも小さいようであれば、その事象は単なる偶然であり、ルールとして取り上げても、有用な知見にはならないと判断できる。

▽信頼度(Confidence)
 条件Aが発生しているうち、どのくらい結論Bも発生しているかという割合を示す指標。上記の例では、「Xを買っている顧客を1としたとき、Yも同時に買っている顧客の割合」という数値になる。この数値が大きいほど、条件Aと結論Bの関連性は高いと判断できる。

▽リフト値(Lift)
 支持度が高く、かつ信頼度が高いルールであっても、結論B自体が条件Aとは無関係に起こりやすい事象であった場合、そのルールには意味がない。例えば、「枝豆を買う人は、ビールも一緒に購入する」というルールが、支持度、信頼度とも高かったとしても、来店者のほとんどがビールを購入している場合、このルールには意味がない。

 結論Bの独立性を見るための指標がリフト値であり、全体に対して結論Bが発生する率に対する「条件Aならば結論Bである」というルールの信頼度の比で定義される。上記の例では、「Yを購入している顧客の割合」に対して、「Xを買っている顧客を1としたとき、Yも同時に買っている顧客の割合」が何倍にあたるかという数値になる。

 リフト値が1以下のときは、条件Aとは無関係に結論Bが発生している(この例では、Xとは無関係にYが売れている)ことになり、ルールは有効ではない。リフト値が大きいほど、結論Bのためには条件Aが必要であるという指標になる。

 すなわち、アソシエーション分析とは、「支持度」「信頼度」「リフト値」の3つが共に高いルールを見つけるための分析であり、大量のPOSデータを一括して扱えるデータベースとデータマイニングツールを用いることで、新たな知見を得ることができる。こうして発見した有用なルールを「クロスセリング」の実践などのマーケティング活動に活用していくことが重要である。
最終更新:2008年06月26日 22:10