摘要:对数学挖掘技术中的关联规则挖掘进行实用性分析,选取其中最为经典的市场购物篮分析作为例子帮助分析,在购物篮市场分析中需要运用经典算法R挖掘Apriori算法,总结其算法思想与算法原理以及这个算法在当今社会中应用的广泛度,并对市场购物篮分析进行具体分类与分析。
Practical Analysis of Association Rules Based on Data Mining
This paper mainly analyzes the relevance of mining rules in mathematical mining technology, and selects the most classic market basket analysis as an example to help analysis. In the analysis of shopping basket market,it is necessary to use the classic algorithm R to mine Apriori algorithm and summarize its algorithm. The principle of thought and algorithm and the wide application of this algorithm in today's society, and the specific classification and analysis of market shopping basket analysis.
1.关联分析
当我们想要查找集合中不同对象之间的关联,在事务数据库中查找频繁模式时,将会使用到关联规则挖掘,你可以在市场购物篮分析中的零售,聚类和分类这三个方面找到,它可以通过生成一组关联规则来说明客户经常购买的商品,然后可以根据这些规则来制定营销策略。
2.市场购物篮分析
市场购物篮分析是零售商用于理解客户购买行为的分析技术的一个例子。它用于确定客户经常一起购买或放在同一个篮子里的物品,它使用此购买信息来提高销售和营销的有效性,找出现在购买中的产品组合。
3.原理概念描述
3.1基础概念
置信度:包含规则左侧项目的交易的概率也包含右侧的项目。置信度越高,购买右侧物品的可能性越高,对特定规则的回报率就越高。
支持:包含项目集中所有项目的交易百分比,支持越高,项集发生的频率越高,具有高支持的规则时优选的,因为它们可能使用于大量未来的交易。
支持和置信度衡量规则的有趣程度,它由最小支持和最小置信度阈值设置,设置的这些阈值有助于根据顾客的意愿比较规则强度,越接近阈值,规则对客户端的使用就越多。
提升:规则中所有项目一起出现的概率除以左侧和右侧项目概率的乘积,就好像它们没有关联一样。相关性显示了一个项目集A如何影响项目集B,提升越高,A和B一起出现的机会就越大。
4.关联规则挖掘问题中的两个子问题
4.1频繁项集生成:
查找支持>=预先确定的min-support计数的所有频繁项集。
期刊文章分类查询,尽在期刊图书馆
4.2 关联规则生成:
列出频繁项集的所有关联规则,计算所有规则的支持度和置信度,修剪min-support和min-confidence阈值失败的规则。
5.市场购物篮分析主要有两种类型:
5.1.差异化市场分析
执行市场购物篮分析的算法很简单,复杂性主要出现在利用分类法,避免组合爆炸,如超市可能存储10000个或更多的项目,以及处理可能存在的大量交易数据,一个主要的困难是,要求规则具有较高的最低支持水平和较高的置信度,可能会遗漏任何可利用结果,该问题的一个部分解决方案是差别市场购物篮分析。在零售业,市场购物篮分析可用于决定商店内商品的位置和促销,如果按照观察,玩偶的购买者更有可能买糖果,那么可以将高利润糖果放在玩偶展示区附近,而在差异分析中,我们比较不同商店之间,不同人口群体中的客户之间,一周中不同日期,一年中不同季节之间造成的不同结果等。
如果我们观察到一个规则在一个商店中存在,而在其他商店中没有,那么这个商店会存在一些能吸引顾客的东西,也许他的客户群体不同,或者他可能以一种新颖且更有利可图的方式组织起展示,调查这些差异可能会产生有用的见解,从而改善公司的销售。
5.2.预测性市场购物篮分析
它用于对主要按顺序发生的项目购买,事件和服务的集团进行分类。
6.Apriori算法原理
6.1算法思想
一个频繁项集的所有子集必须是频繁的,逆否命题为如果一个项集是非频繁的,那么它的所有超集也是非频繁的。
6.2 算法原理
计算出单个元素的支持度,然后选出单个元素置信度大于我们要求的数值,增加单个元素组合的个数,只要组合项的支持度大于我们要求的数值就把它加到频繁项集中,依次递归。根据计算的支持度选出来的频繁项集来生成关联规则。
7.商业价值
市场购物篮分析通常被在线零售商用于向消费者提供购买建议,例如,当一个人购买特定型号的智能手机时,零售商可以推荐其他产品,如手机壳,因为其他消费者在与手机同时交易中购买这些物品的频率高。零售商可以对商店布局设计中共同出现的产品进行分组,以增加交叉销售的机会;推动在线推荐引擎(购买此产品的客户也查看了此产品)。
8.总结
关联规则挖掘是一个在当前应用率很广泛的数据挖掘方法,它的实用性非常高,隐含巨大的商业价值,在信息技术飞速发展的社会中,未来的应用会更高,也会慢慢修正目前Apriori算法的不足之处,之后可以应用关联规则挖掘得出更准确高效的数据。
参考文献
[1]毛国君,段立娟.数据挖掘原理与算法[M].北京,清华大学出版社,2016:11-15.
[2]简祯富,许嘉裕.大数据分析与数据挖掘[M].北京,清华大学出版社,2016:45-50.
论文作者:贾明璞
论文发表刊物:《知识-力量》2019年11月47期
论文发表时间:2019/10/29
标签:规则论文; 算法论文; 购物篮论文; 频繁论文; 项目论文; 市场论文; 越高论文; 《知识-力量》2019年11月47期论文;