多维数据建模在短消息通信数据分析中的应用论文_鲁琳

多维数据建模在短消息通信数据分析中的应用论文_鲁琳

中国联合网络通信有限公司广东分公司 广东 广州 510627

摘要:在电信行业发展过程中短消息通信业务扮演着重要的角色,其中涉及着大量、复杂的数据,为了满足数据分析需求,随之出现了联机分析处理(On-line analytical processing,OLAP)技术。本文分析了OLAP技术的概况,重点探讨了多维数据建模在短消息通信数据分析中的应用,旨在适应电信行业发展需求,为其提供可靠的保障。

关键词:多维数据建模;短消息;通信数据

引言:随着科学技术的发展,新决策知识系统快速发展,特别是商业智能,其利用数据仓库,有效整合了业务系统数据,同时借助多种工具,如:OLAP、数据挖掘等,保证了决策者决策的准确性与及时性。为了明确多维数据建模的现实意义,本文探讨OLAP在短信通信数据分析中的设计与实现。

1 联机分析处理技术的概况

OLAP作为重要的应用,对数据展开了建模,通过多维方式对数据进行了处理,如:分析、查询等,并提供了可视性与直观性的结果。经调查发现,该技术主要用于复杂的分析,但传统的数据库常见E-R建模法,为了适应新时期发展需要,有关人员应积极探索新型、多维建模法。

对于数据仓库来说,其为面向主题的数据集合,如果仍沿用传统建模法,难以有效表述各数据间的关系。为了更好地呈现分析数据、细节数据等关系,实践中应合理运用OLAP,并在建模中利用多维数据模型[1]。

2 多维数据建模在短消息通信数据分析中的应用

近几年,各行业均十分关注多维数据建模理念,对其进行了广泛与普遍地运用,以电信行业为例,其短消息通信业务的短消息通信数据呈海量式增长,实际管理中需要借助有关数据进行分析与研究,如:某时间短内短消息提交或下发成功率、各种常见错误所造成的提交失败情况等,为了有效统计基础通信数据,急需短消息数据分析系统。因此,本文提出了短消息0LAP分析模型,并探讨了其实现。

2.1 模型设计

短消息通信业务系统为了全面记录其各种数据,会出现多个文件,以MO话单为例,其属于二进制文件,对各点发往短信中心的短消息信息进行了实时记录,具体有源点、目的地址以及短消息内容、提交情况等。通常,管理者对短消息数据分析需求较多,但其基础均为业务系统文件中的各数据。在设计中以管理者的需求为依据,对OLAP模型设计展开讨论[2]。

期刊文章分类查询,尽在期刊图书馆

以短消息业务系统数据为依据,生成两个报表,一种为业务统计报表,它主要是对各地区、各时段短消息提交、下发情况,如:数量及成功率等;另一种为统计总量报表,以时间段为依据详细呈现短消息提交、下发情况,如:年、月、日等。为了满足上述需求,设计中应考虑以下指标,包括短消息提交总量、成功量、失败量及成功率,下发总量、成本量、失败量及成功率。上述指标主要来自于MO话单与下发短消息数据文件。在设计过程中充分考虑提交数据与下发数据,对二者展开分开设计。具体的多维分析模型中各维表为:

第一,时间维表。它主要是对不同时间段进行描述,以日期为例,字段名称为Data Dsc,而月、季度与年的字段名称分别为Month Dsc、Quarter Dsc、Year Dsc,其字段类型均为字符串,其中主健为Log Data,其用于具体日期的字段描述,字段类型为日期型。

第二,地区维表。它是对不同地区进行描述,以城市为例,其编号与名称的字段类型分别为整型与字符串,字段名称分别为City ID与City Name;而省份的编号、名称,字段类型同上,字段名称分别为Province ID与Province Name,其中主健为City ID。

第三,短信中心维表。它用于描述各个中心的编号与地址以及城市的编号与名称,具体的字段名称为V Center ID、V Center DSC、region ID、region DSC。

第四,服务类型维表,它以短消息业务类型为依据,其中服务类型编号与描述为Service ID与Service DSC,而服务分类代码与描述分别为Service Class与Service Class DSC,起始与终止地址分别为Start Code与End Code。

上述维表直接联系着事实表,其具体结构有,Log Data、City ID、V Center ID、Service ID,此外还包括短消息提交成功量、失败量、及成功率等,分别为Subsuc、Subfail、Sucrate。此后,结合事实表与维表间的关系,便可获得星型分析模型[3]。

2.2 系统实现

为了实现OLAP模型,应选取适合的DBMS,实践中选取了SQL Server数据库管理系统,建立事实表与维表后,使用Analysis Services分析管理器,建立了多维数据集,从而保证了数据有效分析。

首先,导入数据。目前,短消息通信业务生成的文件均为二进制,因此,借助SQL Server的数据导入功能,将数据导入到系统内,并建立业务数据表,此后,对表内短消息中心地址及提交时间等空字段值的数据进行清理。其次,创建事实表与维表,插入数据。在系统中创建表,并插入相应的数据,实践中应高度关注分析需求,以此保证模型可行性与有效性。最后,分析数据,在创建多维数据集后,利用Analysis Services进行分析,并形成相应的报表[4]。

总结:综上所述,OLAP技术适应了分析需求,特别是构建多维数据模型后,实现了数据查询、分析及报表处理。为了充分发挥该技术作用,本文对其进行了简单介绍,重点阐述其在短消息通信数据分析中的应用,成效显著,日后应大力推广。

参考文献:

[1]林菁.多维数据建模在短消息通信数据分析中的应用[J].现代计算机(专业版),2011,20:32-34+59.

[2]陈垦.客户端聚合服务的协同机制在动态遥感监测中的应用研究[D].成都理工大学,2014.

[3]周轩.下一代移动通信网络中的业务特征认知及服务机制研究[D].浙江大学,2015.

[4]刘义.大规模空间数据的高性能查询处理关键技术研究[D].国防科学技术大学,2013.

论文作者:鲁琳

论文发表刊物:《科技中国》2016年10期

论文发表时间:2017/1/5

标签:;  ;  ;  ;  ;  ;  ;  ;  

多维数据建模在短消息通信数据分析中的应用论文_鲁琳
下载Doc文档

猜你喜欢