又常称为购物篮分析是指如果兩个或多个事物之间存在一定的关联分析方法,那么其中一个事物就能通过其他事物进行预测.它的目的是为了挖掘隐藏在数据间的相互关系。 关联分析方法分析最常用在市场销售数据中顾客的购物篮中如果包含啤酒的同时,还包含了尿布这就揭示了这两种物品之间的关联汾析方法。关联分析方法分析的挖掘任务可分解为两个步骤:一是发现频繁项集二是从频繁项集中产生规则。 下面用中的arules扩展包来实现apriori来进行关联分析方法分析 数据结构如下,ID表示购物篮编号Item表示物品。 #将数据转化为合适的格式 #用 apriori命令生成频繁项集设其支持度为0.5,置信度为0.8 这说明购买爱国者电影的顾客同时也会购买角斗士 :-) |