大数据变革背景下的顾客网络满意度比较——基于OLAP可视化技术应用视角,本文主要内容关键词为:满意度论文,视角论文,顾客论文,数据论文,背景下论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:F272;F719 文献标识码:A 文章编号:1001-8409(2015)05-0106-05 DOI:10.13956/j.ss.1001-8409.2015.05.23 1 引言 大数据顾名思义即所涉及的数据量规模巨大且无法通过人工在合理时间内实现截取、管理、处理、并整理成为人类所能解读的信息[1]。大数据时代,数据的性质发生了质的改变,从简单的处理对象转变为一种基础性资源,这种变化必然导致数据管理方式的变革[2]。近十年,随着社交网络、博客、LBS(Location Based Service)等信息的产生和传播方式的发展,数据以多种多样的形式表现出来,而且其增长速度、表现形式仍在快速增加。因此即使经过一定的过滤,由于数据源众多、较长的积累周期也会形成海量的数据[3],例如顾客网络评价。由于越来越多的消费者喜欢通过网络交流消费经历、感受,并且对消费结果做出评价,经过一定时期的积累,必定会形成大量反映顾客整体满意度的数据。同时,网络评价对消费者行为具有一定的影响[4,5],而且影响到顾客对经营者的信任程度[6],关系到被评价对象的长远发展。所以通过有效的方法实现大数据情境下顾客网络评价信息的可视化,对消费者满意度特性研究以及企业通过提升满意度来增加自身价值等方面具有重要的意义。 本文在分析大数据的特点以及所带来的变革基础上,选取3家火锅餐饮连锁企业进行顾客网络满意度比较。结合mapreduce原理完成数据的筛选和样本的确定,通过OLAP技术实现数据的可视化,将时间、区域维度下的比较结果直观地展示出来,为企业发展战略的制定提供参考,也是大数据研究及应用的重要探索。 2 大数据变革的内涵 由于市场压力和技术的演化,大数据计算正在以极快的速度发展[7],先进的数字传感技术、通信技术、计算存储设备创造了巨大的数据,通过大数据计算收集了关于商业、科技、政府和社会的数据[8]。Bryant和Katz等同时指出,大数据计算不仅改变了公司的经营活动、科学研究、医疗活动,而且关系到国家的国防建设以及情报工作。例如Wal-malt目前正在建立的能够存储4千兆字节(4000万亿字节)的数据库记录每一个消费者的消费信息,为实现消费者的数字化管理奠定了基础;在医疗应用领域,大量医疗数据的收集能够实现更有效的病情诊断,提高医治效率等。在此基础上本文将大数据变革的内涵归纳为:由于海量的关于经济、社会、文化、科技、自然环境以及政治等各个方面的信息、数据,通过收集、存储、分析处理后所产生的能够对以前认知、行为产生一定影响甚至完全颠覆的巨大变革。 2.1 大数据变革的特点 大数据变革的特点主要由大数据3V特点(Volume、Velocity、Variety)所决定,表现为数据量大、输入和处理速度快、数据多样性[8]三个方面,但更强调对现有认知或行为的影响和改变。当然也有一些机构认为大数据还具有价值性(Value)、真实性(Veracity)等特性[9],然而并没有达成一致的共识[2],因此本文从3V角度分析大数据变革的特点。 (1)海量的数据增加量。大数据与传统数据相比,从GB(Gigabyte)、TB(Terabyte)达到PB(Petabyte),网络大数据甚至达到了EB(Exabyte)、ZB(Zettabyte)级别[10],仍然呈爆炸式的快速增长并且远超过摩尔定律的增长速度[11]。(2)高速的数据传输、处理。由于计算机、通信技术、网络设施的发展,数据实现了即时传播,时间的影响呈进一步弱化的趋势。(3)多样的数据形式。主要体现在两个方面:一方面在数据类型上可分为科学数据、Web数据、多媒体数据等多种数据类型[12];另一方面在数据结构上体现为结构化数据、非结构化数据以及半结构化数据,而且后两种占的比重越来越大[2]。 2.2 大数据变革的挑战 2.2.1 大数据研究的两个矛盾 大数据基于数字化、网络化、物联化、智能化、个性化[13]等特征反映的信息具有真实性、连续性以及区位性。虽然大数据展现出在真实性、时间、空间等方面的优越性,但由于数据量巨大必然产生一些新的问题。其主要表现在如下两个方面[14]。 (1)可获取数据爆炸式急剧增长与用户有限的信息选择能力之间的矛盾。随着网络信息的急剧增加,信息的内容、结构、呈现形式都发生了显著的变化,对数据的筛选、应用受个人知识水平、价值取向、生活经验、自身性格等多种因素的影响[15]。(2)海量信息的呈现与用户有限需求之间的矛盾。大数据的一个显著特点就是所呈现的数据量巨大,据统计twitter上每分钟就有700个youtube视频分享[16],然而用户对数据的需求是有限的,更多关注于与自身相关的信息收集,从而经过选择过滤掉其他不相关的信息,但这并不是信息的浪费,而是用户需求的局限性,从而产生了数据量巨大与用户需求有限之间的第二类矛盾。 2.2.2 数据管理要求的变化 目前大数据得到了多层次、多领域的关注,但这并不表明人们对大数据的深入了解,而是从另一方面反映出过度炒作的危险[7]。另外大数据不仅规模庞大而且具有分布式、异构、不准确、不一致等特性,加大了数据的管理难度[12]。大数据是把双刃剑[17],一方面为人们提供了获得新知识的源泉,另一方面却因为大数据的多元性以及非结构性特征导致数据的管理成本增加。因此大数据管理要求更高性能的数据收集、存储以及处理设备来支持包括大量非结构化、动态的数据筛选、传递、存储等工作;同时对数据管理人员具有更高的要求,不仅要具备数学、统计学知识,更要拥有创新精神、相应的交叉学科知识以及对有价值信息的把握能力。所以大数据管理与传统的数据管理相比,无论是基础设施、管理模式或对管理人员的要求都发生了显著的变化。 3 大数据变革对顾客满意度评价的影响 3.1 数据收集方法 对顾客满意度的研究过程中,国外学者通常采用美国消费者满意度指数(American Customer Satisfaction Index,ACSI)来代表顾客的满意度[18,19];国内学者通常采用问卷、访谈等主要方式来研究顾客的满意度[20,21]。不管是国内还是国外对顾客满意度的研究其计算通常采用主动获取的方式得到,即参与相关满意度评价的主体不是自发的而是被动受访,因此在这种情况下可能产生敷衍、厌烦情绪导致数据的效果较差。 大数据时代,网络已经成为人们日常表达情感的一种方式,同时大众点评网、天猫、苏宁易购等多种网络平台为非问卷、调研方法获得消费者对某种消费的满意度提供了可能性,而且通常是自发的、对消费感受的真实评价(排除极少数商家通过一些非诚信手段提高顾客评价的情况),面对如此巨大有价值的信息,怎样获取、筛选、深入挖掘是一项首先要解决的问题。因此本文依托于网络爬虫技术原理在特定网页上以特定检索词或符号,如顾客对消费的评语、打分等来收集相应的顾客满意度数据。 3.2数据筛选方法 顾客网络评价数据伴随着时间的积累形成多条数据流,不同的流由于被评价对象的不同划分成不同的区间。因为数据流的持续到达速度快且规模大,因此数据流的处理具有一定的难度,而且很难把握数据的全貌[2]。Goole早在2004年就提出使用Mapreduce技术来简化大量数据的处理[22],其基本流程如图1所示。Mapreduce技术由于模型简单、拓展性良好、支持大规模并行运算、具有容错性,而且数据分析能力正在不断增强,在大数据分析中具有显著优势。因此本文在对数据流分析过程中以mapreduce原理为基础来实现数据输入到输出的处理。大数据改革背景下客户网络满意度的比较--基于OLAP可视化技术应用的视角_大数据论文
大数据改革背景下客户网络满意度的比较--基于OLAP可视化技术应用的视角_大数据论文
下载Doc文档