互联网用户行为数据价值分析与设计论文_高崇,韩雨,林云

互联网用户行为数据价值分析与设计论文_高崇,韩雨,林云

四川中电启明星信息技术有限公司 610067

摘要随着互联网的普及程度的变高,互联网用户行为分析研究显得越来越重要。通过用户行为分析,掌握用户访问网站的规律性特点,将挖掘出的用户访问模式应用于网站上,在发现顾客的兴趣和偏好,对顾客进行聚类、分类,为顾客提供个性化服务以及改善网站的建设等方面都有很重要意义。

关键词:互联网+;用户行为;数据价值

研究背景

近年来,各类信息化企业积极推进“互联网+”融入企业服务,尤其是以电子商务模式为主体的电子商城应用,分别面向个人及企业客户提供商品在线交易,信息查询,选购、支付、物流配送等全业务流程的综合互联网平台。随之而来的是用户行为在互联网应用中的分析与运用显得尤为重要,为了应对互联网日益激烈的竞争,把握市场变化趋势,促进国网电子商务生态健康发展,开展用户行为价值分析模型研究显得尤为必要。

用户行为分析模型

总体设计

对互联网用户行为数据的价值研究可以大致划分为宏观层、微观层和中间层三个层次,分层建模,以满足运营者不同层次的分析需求和适应合理的分析成本。

宏观层分析模型设计

宏观层用户行为分析主要是反映用户和产品群体的变化动态,反应运营成效,主要由各项数据指标统计为主,是最初级的用户行为价值分析。宏观层用户行为分析主要应用于用户流量监测、用户体验优化等领域。

可以基于用户行为的三大类:黏性、活跃、产出,在每个大类上再去添加不同的行为指标,只要能够体现其分析价值并且不重叠。

微观层分析模型设计

微观层用户行为分析主要是识别用户个体的社会属性及行为习惯,也就是针对用户个体的用户画像。用户画像的核心工作是为用户打标签,通过一系列标记集合还原虚拟世界的现实人。用户画像解决了传统互联网运营中用户对运营者透明的疼点,让运营者知己知彼开展针对性运营工作,对提升平台运营效益有很大的价值。

用户行为数据结构

构建用户行为数据模型是为了还原用户信息,因此数据来源于:所有用户相关的数据。对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式。这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。

用户画像分析模型

用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。一个事件模型因素包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。

价值层分析模型设计

价值层分析模型主要是结合数据分析方法对用户行为数据进行分析评估用户对企业价值的程度。本次采用的是业界RFMT用户价值分析模型对运营活动中某段时间用户价值进行评估。

RFMT模型要素

RFMT模型以客户关系领域广泛用来衡量客户价值和描述客户行为的RFM模型为基础,拓展而成。

Recency:表示用户最近一次消费的时间间隔。理论上,最近一次消费时间越近的用户应该是比较好的用户,对提供即时的商品或是服务也最有可能会有反应。R指标主要刻画了用户对企业的关注程度。

Frequency:表示用户在限定时间内消费的频率,消费频率越高的用户,其满意度和忠诚度也就越高。F指标主要刻画了用户对企业的忠诚度。

Monetary:表示用户在限定时间消费的平均金额。消费金额是所有数据报告的支柱,直接反应了企业的盈利情况。M指标主要刻画了用户的购买力。

Top Monetary:表示用户单次消费金额。T指标主要刻画了用户的消费层次。

期刊文章分类查询,尽在期刊图书馆

RFMT模型以上述四个指标为替代变量,通过指标标准化和赋予权重来计算客户价值,然后根据用户价值来进行均值聚类分析,将用户分成不同的类别,作为企业运营的基础。

RFMT建模方法

确立指标权重

用层次分析法来确定模型各个指标的权重,层次分析法是将与决策总是有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的决策方法。

R、F、M、T值的标准化

由于R,F,M,T各值的度量单位各不相同,数据的取值也存在很大的差异,所以需要对数据进行标准化处理,本文采用数据规格化变换方法,该方法可以客服模型不同指标的计量单位对聚类分析结果产生的不合理影响,又称极差正规比变化。

计算单个客户的价值得分

对标准化后的R,F,M,T进行加权求和,得到每个客户的价值得分,公式如下:SRFMT=Wr*Xr’+ Wf*Xf’+ Wm*Xm’+ Wt*Xt’,SRFM表示客户的RFMT价值得分,Wr、Wf、Wm分别表示R、F、M各指标的权重,Xr’、Xf’、Xm’、Xt’分别表示标准化后的R、F、M、T值。

将客户分类,计算每一类客户的价值得分

通过RFM分析将客户群体划分成重要保持客户、重要发展客户、重要挽留客户、一般重要客户、一般客户、无价值客户等六个级别,客户分级不仅揭示了客户在级别上的差异,而且反映了客户在行为上的特性和变化倾向。在进行客户分类后再对客户的类别进行顾客终身价值排序,使得企业能够量化各类客户的价值的差别,弥补了的客户分类方法的不足。

关键技术

用户行为信息采集技术

WEB日志采集模式

网站分析数据的收集从网站访问者输入URL向网站服务器发出http请求就开始了。网站服务器接收到请求后会在自己的Log文件中追加一条记录,记录内容包括:远程主机名、登录名、登录全名、发请求的日期、发请求的时间、请求的详细、请求返回的状态、请求文档的大小。随后网站服务器将页面返回到访问者的浏览器内得以展现。

专业的工具厂商会有专门的处理服务器对大量的Log数据进行处理,并将处理后的数据存放入自己的数据库中。网站经营人员通过访问分析报表系统查看网站的分析数据。也有一些中小网站主出于成本的考虑不会求助于专业的工具厂商,他们会借助简单的网站日志分析软件完成对Log数据的处理,当然处理后的数据会有一定的局限性。

JS前端埋点采集模式

JavaScript标记同Web日志收集数据一样,从网站访问者发出http请求开始。不同的是,JavaScript标记返回给访问者的网页代码中会包含一段特殊的JavaScript代码,当页面展示的同时这段代码也得以执行。这段代码会从访问者的Cookie中取得详细信息并发送到工具商的数据收集服务器。数据收集服务器对收集到的数据处理后存入数据库中。

包嗅探器的方式

网站访问者发出的请求到达网站服务器之前,会先经过包嗅探器,然后包嗅探器才会将请求发送到网站服务器。包嗅探器收集到的数据经过工具厂商的处理服务器后存入数据库。随后网站经营人员就可以通过分析报表系统看到这些数据。

用户行为大数据分析技术

(1)Hadoop大数据分析架构

Hadoop 是一个能够对大量数据进行分布式处理的软件框架。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。此外,Hadoop 依赖于社区服务器,因此它的成本比较低,方便使用。

(2)Storm大数据分析架构

Storm是自由的开源软件,一个分布式的、容错的实时计算系统。它可以非常可靠的处理庞大的数据流,用于处理Hadoop的批量数据,支持许多种编程语言。

Storm有许多应用领域:实时分析、在线机器学习、不停顿的计算、分布式RPC、ETL等。Storm具有强大的处理速度及可扩展、容错功能,很容易设置和操作。

论文作者:高崇,韩雨,林云

论文发表刊物:《防护工程》2018年第6期

论文发表时间:2018/7/19

标签:;  ;  ;  ;  ;  ;  ;  ;  

互联网用户行为数据价值分析与设计论文_高崇,韩雨,林云
下载Doc文档

猜你喜欢