基于灰色关联算法对婴幼儿奶粉销售因素问题的研究
胡星辰1,李波2,吴萍1
摘要: 本文针对婴幼儿奶粉销售因素的问题,运用Python软件从某大型电商网站爬取婴幼儿奶粉销售情况,再利用单因素分布分析、插值拟合算法、文本挖掘及灰色关联算法等理论或方法,构建数据变量的插值拟合模型和数据挖掘下灰色关联分析模型,运用EXCEL、MATLAB与EVIEWS等软件编程求解,得出婴幼儿奶粉销售的重要影响因素以及评价量与各因素之间的联系,最后以所得结论结合实际情况向消费者提出意见与建议。
关键词: 婴幼儿奶粉销售因素;单因素分布分析;插值拟合;灰色关联分析;数据变量的插值拟合模型;MATLAB
引言
随着我国经济的进入发展的快车道,人们对生活质量的要求不断提升,越来越多的群众开始重视起对婴幼儿的抚养问题,尤其是产品安全问题。在2008年震惊中外的三鹿奶粉事件之后,国产奶粉的质量问题被社会提上了热点话题,也给国产奶粉带来了信任危机。加之随着互联网经济的发展,国外奶粉进入国人的视线,婴幼儿奶粉的选择面增加,我国奶粉行业的竞争愈发激烈。
当前很多学者对我国适龄生育父母婴幼儿奶粉购买行为导向因素进行研究并得出不少消费者购买奶粉的影响因素。
刘华[1]通过对南京市消费者关于婴幼儿奶粉消费者购买行为的影响的调查中,对消费者认知、风险感知和支付能力等因素对购买行为的影响进行研究。得到安全是消费者购买婴幼儿奶粉时考虑的第一因素;而消费者认知程度越高、支付能力越强越倾向于购买价位更高的进口奶粉,说明国内奶粉依然由很长的路要走。不足之处是统计样本较少只有167份,没有进行抽样调查也没有系统的模型进行结果解释缺乏说服力与比较。
于海龙[2]以北京市消费者为调查对象,运用统计描述法和Logit回归模型,分析消费者对不同品牌婴幼儿奶粉的选购行为及其影响因素。也同样得到国外奶粉在中国的奶粉市场上占据明显优势,这是由于对国产奶粉质量不认同的原因;而消费者的风险感知、收入、子女数和性别是影响消费者选购奶粉的主要影响因素。不足之处是样本具有显著的地域特征,奶粉没有分类处理,研究结果没有普适性。
针对网上购物中“宝爸宝妈”们对婴幼儿奶粉购买影响因素的影响,目前还没有学者进行研究。本文以此为基础,针对消费者在网上购买婴幼儿奶粉的情况研究其背后考虑的购买因素,希望得到一个普适性的结论。
一、数据收集与处理
通过Python软件对某电子商务平台进行数据爬取,得到该平台婴幼儿奶粉的销售情况导入EXCEL中,其中包括婴幼儿奶粉的商品品牌、商品毛重、奶源产地、国产或进口、适用年龄、包装单位、配方、分类、段位、团购价等指标。其中商品品牌、奶源产地、国产或进口、包装单位、配方、分类等为非数据变量;商品毛重、段位和团购价等为数据变量。[3]
这个谜底到20世纪80年代时才小小的揭开了一角。据张三爷的孙子张家善先生讲,张三爷在世时,每年除夕,必供上张、赵、马三姓牌位,说是自己武功的祖师,并说张、赵、马三位是明末清初人,是明朝武将,明亡后隐居山林,创拳传拳自娱。对于三位祖师,张三爷自己也只知其姓,不知其名。后来张三爷又得过深州李武师、鄚州李武师指点,博采众长,融会贯通,已非是某人某家某派的专一武功了,而张三爷也不想创造新拳,所以对拳种门派就闭口不谈了。这里说句题外话,据我的推测,以张三爷的年龄和当年的江湖地位,出身深州的李姓武师,有资格指点他的,恐怕只有一个——形意祖师李洛能。
综上所述,随着我国对河道整治工程逐渐提升重视,在一定程度上促进了河道整治工程的发展。但是在河道综合整治过程当中,基于工程单位诸多方面因素所影响,导致整治中存在诸多安全事故问题。基于此情况下,工程单位需要结合实际情况,加强对河道综合整治工程全过程管理,建立完善安全管理制度,实现对工程项目的安全管理,进而提高河道整治工程的整体安全性,促进河道综合整治工作的全面开展。
在这里,我们选取毛重在(0.85- 1.15)kg之间的奶粉作为对象,统计单位毛重的价格即单价代表影响因素。
二、数据变量的插值拟合模型
在大豆的生长过程中,蚜虫一般会在六月中旬出现,在大豆开花前它就会开始蔓延,到达七月中旬的时候是大豆的生花期,如果条件气侯适宜的话,大豆蚜虫就会迅速繁殖,并且危害性非常强,由于蚜虫的分泌物粘稠,可以导致叶片卷曲、脱落甚至植株死亡。
对于拟合目标函数通常选取一组线性无关的简单函数类的线性组合
一般通过最小二乘法求出待定常数再将常数带回公式中。
(2)准确称取鳞叶1.000 g (内部和外部鳞叶分开),切碎后于10 mL 纯甲醇浸泡,在4 ℃冰箱中放置24 h;每个样品中加入0.1 g水不溶性聚乙烯吡咯烷酮(polyvinyl pyrrolidone,PVP),加液氮在弱光条件下研磨匀浆,加80%甲醇共20 mL(分3次加入,依次为10 mL+5 mL+5 mL)4 ℃冷浸提24 h。
(一)商品毛重与评价量的关系
通过使用MATLAB对插值结果进行分析,线性插值的效果较为理想,如图1所示。
图1 商品毛重与评价量的线性插值图
进一步通过MATLAB进行线性曲线拟合,效果如下图2所示。
图2 商品毛重与评价量的线性曲线拟合图
线性拟合效果数据如下表1所示
表1 线性拟合效果数据表
我们能够看到数据拟合的可决系数为0.4730,效果不是特别的理想,但是整体的发展规律与趋势还是可以展示的。从图1我们可以发现评价量处于较高位置水平的在区间[1,2]内,毛重超过或者低于该水平则评价量均不是很高。而从图2可以判断评价量最大值为1.5kg,也就是毛重为该水平的奶粉最受消费者欢迎。
3.1.1 结果分析
进一步我们通过MATLAB进行线性曲线拟合,效果如下图4所示。
(二)团购价与评价量的关系
通过对数据初步整理,通过使用MATLAB对插值结果进行分析,线性插值的效果较为理想,如图3所示。
首先对数据进行预处理,由于我们选取了团购价与评价量作为单变量分布分析的指标,而每种奶粉在不同商家购买、团购价还要与商品毛重挂钩。因此,我们还要求得每条购物信息之下的商品单位价格,设毛重为m ,团购价为W ,则单位价格w 为:
为实现核电工程项目建设过程中的多项目规模化、标准化的高效发展模式,充分利用资源提升价值创造能力,不断提高项目建造质量和安全水平,有必要对经验和教训进行全面记录,并加以总结和有效管理,避免错误重复发生。
图3 团购价与评价量的线性插值图
家长在购买奶粉过程首先考虑的肯定是质量保质期问题,他们会更多选择刚生产的奶粉,而购买奶粉质量过重会出现奶粉开封时间过长导致的安全隐患,质量过小又会出现频繁购买的麻烦,所以他们选择重量适中的奶粉;而几乎所有消费者都会有贪婪心理,在相同质量与价格下更倾向于毛重偏多的一方。
图3 团购价与评价量的曲线拟合图
线性拟合效果相关数据如下表3所示
表3 线性拟合效果数据表
从表3中可知线性曲线拟合的可决系数为0.7090,拟合效果较为理想;由图3可知团购价在0-500元是大众价格,是最大市场需求人群所能承受的价格区间,而100-400 元之间评价量最大,说明处于这个价位的奶粉最受市场欢迎。但是处于高价位 1000-2500 元即属于奢侈品的奶粉也有少部分的市场需求量,却微乎其微,这部分可能主要用于富人购买。总之,销售商和生产商既要考虑普通大众的价格承受能力,又要满足富人对奶粉的高标准和低需求,不同价位的奶粉商品产品结构应该有所调整,不同价位的奶粉商品应该符合普通大众和富人阶层的人群比例。
由⑤可计算每个比较序列与参考序列对应元素的关联系数。
3.2.1 结果分析
我国仍是处于发展水平,国民消费水平整体不是很高,人均收入水平任处于较低层次,所以在购买时候会首先考虑自身经济承受能力,所以商家在生产奶粉定位价格的时候一定要考虑当前消费水平,以免出现供过于求,难以销售。
三、数据挖掘下的灰色关联分析模型
(一)文字语言转数据处理
将数据收集的EXCEL表转化为奶粉数据.txt 文本,共有 846 条信息,在这846 条信息中由于奶粉的品牌、 场地和国产或进口等的不同,导致奶粉的评价量也不一样。人为引入影响值αij 代替文字语言,定义影响值:
对于已知的n 个数据点总可以唯一确定一条n -1次多项式曲线因为n 个数据点都在曲线上,所以有
他们连滚带爬地出现在后排。一切都恢复了人性的本源,一切都那么的顺其自然,一切都开始了,没有回头的路径了。往前,唯有秉持着向前的动力,冲破内心的桎梏,去寻找去探寻甚至去醉卧在销魂蚀骨的风水宝地中。
三是大力支持易地扶贫搬迁后续扶持工作。各市县要根据工作需要,从自治区切块下达的财政专项扶贫资金中,安排一定的资金用于易地扶贫搬迁人口的产业发展和就业创业等后续扶持工作,确保贫困群众搬得出、稳得住、能就业、有收入。
其中,N是固定值846。
以该理论为基础,将本文数据所有文字语言转化为影响值,实现文字语言到数据的转化。
(二)模型建立
②确定参考数据列
根据文本挖掘处理的结果,得到846×11的纯数字矩阵B。X 1,X 2,…Xn ,分别表示商品品牌贡献值、商品毛重、奶源产地贡献值[5]、国产或进口贡献值、适用年龄贡献值、包装单位贡献值、配方贡献值、分类贡献值、段位贡献值、团购价( n=10)的评价对象。矩阵如下:
①根据评价目的的确定评价指标体系,收集评价数据
参考数据列应该是一个比较理想的比较标准,可以以各指标的最优值(或最劣值)构成参考数据列,也可以根据评价目的选择其他参照值。记作
③对指标数据进行无量纲化
无量纲化后的数据序列仍记为,形成如下矩阵:
④逐个计算每个被评价对象指标序列(比较序列)与参考序列对应元素的绝对差值,即:
⑤确定
⑥计算关联系数[6]
顶层设计是运用系统论的方法,从全局的角度对某项任务或者某个项目的各方面、各层次、各要素统筹规划,以集中有效资源,高效快捷地实现目标。
例如在教学人教版小学语文《我家跨上了信息高速路》一课时,由于文章讲到信息技术的应用,而现阶段的小学生普遍对网络有一定的认识,在生活和学习中也有较多接触,因此教师可以采用将教材与生活相结合的形式进行阅读教学。在学生对课文进行初步阅读以后,教师可以让学生积极讨论自己对电脑的了解,学生通过在课堂上交流,得出许多答案,比如:电脑可以用来打印文件、玩游戏、聊天、发贺卡、看电影等,这些都是与实际生活相关联的方面,比较容易引起学生的热情。通过文本与生活相结合的方式,大大提升了学生的阅读热情和阅读效率,有利于学生阅读能力的提升。
即
式中ρ 分辨系数,在(0,1)内取值。若ρ 越小,关联系数间差异越大,区分能力越强。通常取ρ =0.5。
⑦计算关联度
对各个评价对象分别计算其指标与参考序列对应元素的关联系数的均值,以反映各评价对象与参考序列的关联关系,并称其为关联度,记为:
综上所述,在小学语文阅读教学的过程中,运用微课教学手段,不仅能够提升学生的学习兴趣以及学习积极性,加深学生对文章的理解以及记忆,同时也能够提升他们的自主学习能力以及分析能力,促进学生综合素养的形成。因此,在实际的教学过程中,教师应该注意微课教学手段与传统教学模式的融合,进而保证学生学习质量的提升。
(三)模型求解
通过MATLAB编程求解,可得到评价量与商品品牌、商品毛重、奶源产地、国产或进口、适用年龄、包装单位、配方、分类、段位、团购价的关联度数值,分别用人r1,r2...r10表示,如表4所示。
后格赖斯学派和Bach一致认为,虽然话语的语用充实意义(明意/隐意)已超过严格意义上的所言,却不能划入到所含范畴。一方面,后格赖斯学派基于关联原则,认为话语本身具有语义不确定性,需在给定的语境中加以确定。明意是话语逻辑形式的引申意义,是所言的一部分。[7]而另一方面,Bach认为所言和隐意概念的内涵有所不同,在语言交际中“有不明示的意义,但没有不明示的所言”[4]144。隐意作为交际意义的一部分,是通过语用扩展,隐式地进行交流的。[8]据此,这种意义不能成为所言的一部分。
表4 各项因素关联度表
进一步,我们用MATLAB得到各指标与评价量关联程度的分布直方图,如下图4所示
PON已经历了好几代技术变革,ODN网络也已基本完成部署,功率预算达到32 dB。50 G PON需要兼容已有ODN网络,功率预算是重大挑战。数据中心使用25 G激光器,其发射光功率在0 dBm左右,不能满足32 dB光功率预算要求。25 G雪崩光电二极管(APD)接收50 G PAM4时的接收灵敏度大约为-20 dBm@1E-3,通过均衡补偿高频响应。虽然当前灵敏度有所改善,但要满足32 dB功率预算仍存在挑战,需要产业链进行突破。
图4 指标与评价量的关联程度直方图
从图中我们可以大体知道对评价量量影响大小的顺序是:团购价>商品毛重>商品名称>国产进口>段位>适用年龄>奶源产地>分类>包装单位>配方。占据主要影响力的分别是团购价和商品毛重,这也说明我国消费者在购买奶粉过程首先考虑的是价格,这也符合大多数消费者心理,毕竟需要考虑自身经济能力。这也提醒厂家在定位价格销售时需要考虑大众消费水平放在首位。
四、结语
对于妈宝们来说,需要根据实际情况选择合适的奶粉。每个孩子处在的不同的年龄段,需要有针对性的奶粉商品,不能够随大众,各个年龄段都有着不同的最为适合的集中奶粉,应该考虑孩子自身的身体情况选择奶粉的培养与原料。同时单位质量价格在100-500元/kg的奶粉最受欢迎,这既是考虑了性价比,又是考虑了不同阶层群体的需要。其次,根据孩子在不同阶段的需求及时改变不同阶段的奶粉,并以单罐质量在1-2kg的奶粉为主,既可以保证奶粉不会浪费也可以保证减少购买次数节约时间。
参考文献:
[1]刘华,陈艳.婴幼儿奶粉消费者购买行为的影响因素分析——基于南京市167位消费者的调查数据[J].湖南农业大学学报(社会科学版),2013,14(01):22-28+41.
[2]于海龙,李秉龙.中国城市居民婴幼儿奶粉品牌选购行为研究——以北京市为例[J].统计与信息论坛,2012,27(01):101-106.
[3]刘霞,王运锋.基于最小二乘法的自动分段多项式曲线拟合方法研究[J].科学技术与工程,2014,14(03):55-58.
[4]周源,杜俊飞,刘宇飞,等.基于引用网络和文本挖掘的技术演化路径识别[J/OL].情报杂志:1-6[2018-08-07].h t t p://k n s.c n k i.n e t/k c m s/detail/61.1167.G3.20180801.0908.004.html.
[5]王惠珍.基于改进灰色系统GM(1,1)模型的成本预测[J].统计与决策,2015(15):83-86.
[6]Jian Wang,Wei Deng,Yuntao Guo.New Bayesian combination method for short-term traffic flow forecasting[J]. Transportation Research Part C,2014,43.
(作者单位:安徽财经大学1.管理科学与工程学院,安徽蚌埠,233000;2.财政与公共管理学院)
作者简介: 胡星辰(1998.08) 男,汉族,安徽蚌埠人,安徽财经大学管理科学与工程学院,2016级本科生,研究方向:工程管理与数学建模。
基金项目: 国家自然科学基金“3-流猜想,Fulkerson-覆盖及相关问题”(编号:11601001)
作者简介: 胡星辰(1998-),男,安徽淮南人,本科在读,从事产业经济学与工程管理研究
标签:婴幼儿奶粉销售因素论文; 单因素分布分析论文; 插值拟合论文; 灰色关联分析论文; 数据变量的插值拟合模型论文; matlab论文; 安徽财经大学管理科学与工程学院论文; 安徽财经大学财政与公共管理学院论文;