关键词:有线电视网络;大数据;数据治理
1大数据时代的特征
大数据时代,数据的种类和数量更为庞大,种类繁多的数据更新更快,这就为数据处理工作带来了更多难题,我们不仅需要重视数据处理能力的提升,还需要重视数据存储能力的提升,更需要针对数据整合的问题优化分类管理,这样才可以满足时代发展的要求。社会处于不断的前进发展之中,人们的隐私问题受到更多关注,对隐私问题的关注程度日益加深。在对数据的价值进行深入挖掘的同时,需要针对数据的开放程度导致的隐私泄露问题也要予以重视。
2有线电视网络大数据数据治理措施
2.1组织构建
有线电视网络运营商要针对行业大数据应用场?绘制关键流程图,建立职责分配模型,以明确大数据治理中的利益相关者。将原有各个系统的数据采集、数据存储和数据管理的人员角色抽象提炼为研发、业务和运维三种用户角色与大数据整体架构相关的角色匹配,由统一的大数据主管管理整个大数据平面下的组织架构。同时结合广播电视系统安全播出和数据特性,对大数据进行责任划分,建立承担包括大数据在内的责任数据治理组织。
2.2元数据管理
在构建元数据模型时,需要深入、完整、细致的描述数据对象,包括数据的格式、质量、处理方法、获取方法、质量要求、安全性要求等各方面细节。元数据管理有两种方式。集中式管理和分布式管理。集中式管理是指在系统中有一个节点专门司职元数据管理,所有元数据都存储在该节点的存储设备上。所有客户端对文件的请求前,都要先对该元数据管理器请求元数据。分布式管理是指将元数据存放在系统的任意节点并且能动态的迁移。对元数据管理的职责也分布到各个不同的节点上。大多数集群文件系统都采用集中式的元数据管理。因为集中式管理实现简单,一致性维护容易,在一定的操作频繁度内可以提供较满意的性能。缺点是单一失效点问题,若该服务器失效,整个系统将无法正常工作。而且,当对元数据的操作过于频繁时,集中的元数据管理成为整个系统的性能瓶颈。分布式元数据管理的好处是解决了集中式管理的单一失效点问题,而且性能不会随着操作频繁而出现瓶颈。其缺点是,实现复杂,一致性维护复杂,对性能有一定影响。
2.3大数据隐私保护
有线电视双向化可以便捷地获取用户操作行为,与传统的业务支撑系统结合可以更好地辅助运营商对业务的规划,提高用户服务能力。在强化整个播出通道和业务服务系统的可管可控的同时,对于个人信息保护也不仅仅是停留在国家法律要求层面,而是要建立在整体数据安全防护基础之上,并保障用户个人隐私权的安全要求。合法合规的采集、处理和应用用户服务数据资源,提供可靠的安全机制,确保个人信息数据不会丢失、泄露,是广电大数据治理对安全要求中的重要内容。
2.4数据质量管理
数据质量管理包括测量、提升和论证质量及整合组织数据的方法。在数据全生命周期过程中,对每个环节的数据进行识别、度量、分析、改进等一系列管理活动,保障数据的可用性。并且全方位管理数据平台的数据质量,实现可定义的数据质量检核和维度分析,以及问题跟踪。数据质量管理的规范包含对数据的标准化格式的要求、数据的完整性要求、以及对数据故障应急相应机制要求。
期刊文章分类查询,尽在期刊图书馆针对数据标准化的管理要求,规范各系统间的数据分类、定义、模型和取值,保证系统间数据的一致性、准确性和可靠性,从而打破不同系统间数据壁垒,为实现集中通过标准化的大数据管理创造条件[1]。主要包括:数据模型:统一模型,统一架构,保证系统架构的一体性;数据编码:统一编码,统一业务内涵,解决语义层差异;数据分类与分布:规范数据分布,解决业务数据源出多头,保证源头数据唯一性;指标体系:统一指标业务定义(例如对于用户收看电视节目有效时间的界定等),规范数据加工口径,形成统一的数据语言,避免理解歧义,保证数据统计的一致性和准确性。
2.5业务流程整合
按照数据生产,采集监控,加工调度,质量管控,数据推送和应用发布等数据应用模式梳理目前系统中对数据的关键活动,建立关键活动的流程图,针对关键活动,整合业务流程,制定大数据治理的政策。在流程的识别过程中,对于广播电视行业包括用户的业务需求预测流程、用户服务反馈业务流程等,针对这些流程梳理数据的传输走向,可以提高对数据挖掘分析的效率。
2.6数据汇聚整合
数据汇聚整合的目的是通过数据的统一处理,提供标准统一的应用数据,为上层业务应用(如:经营分析系统、精准营销系统)提供融合的统一的数据能力。采集客服、播控和信息服务等相关部门的数据及各业务系统的相关数据,并将采集到的数据进行存储和分发[2]。并以网络视听需求作为重点(收视记录、收视率、机顶盒操作行为日志等数据)对广电业务支撑系统、媒资系统,用户行为数据等全面采集并进行统一汇聚。数据整合主要分为对基础数据整合、实时数据整合和机器深度学习三个数据处理模式,整合后的数据可以提供各类不同业务应用需求使用,以及提供个性化加工处理支撑多租户的数据服务。
2.7数据生命周期管理
在各个系统中数据持续增长的背景下,数据体量急剧扩大,对于无效数据过度的管理会严重消耗系统资源,因此研究数据生命周期,可以降低系统成本[3]。根据数据所处的不同时期、访问频度、数据内容、归属系统等所体现出的不同价值,制定相应的数据存储和服务响应策略标准,从数据分类方法、数据有效性、数据成本等方面,开展数据存储、数据服务的有效管理,决定何种数据应该保留在大数据分析系统中,何种数据要给予存档,何种数据要给予销毁删除,以提供最优的数据服务效率、降低数据管理成本、从而获得最大的数据价值。
3实施大数据治理
实施是指围绕大数据治理的阶段、关键要素等,建立大数据治理体系。体系包括支撑大数据治理的战略蓝图和阶段目标,岗位职责和组织制度、关键领域与流程,以及软硬件资源[4]。大数据治理实施流程可分为现状评估、树立目标、制定方案、执行方案、运行与监督、评估与改进等阶段,建立目标明确和方案详实的大数据治理运行体系,在实施过程中需要对照治理目标,依据治理规范和标准,监控和评估大数据治理的成效,发现问题,优化策略和流程,提升人员技能,从而确保大数据治理工作的成功。
结束语:
大数据技术在行业应用的上半场主要任务是收集数据,但是随着数据分析挖掘过程中对于数据和结果的要求不断提高,在下半场时,广电运营商在开展大数据应用的主要任务逐渐向数据治理、数据驱动和数据价值利用等方向转换。科学系统地做好大数据治理,不仅可以更好地利用数据,也可以为安全运营数据奠定坚实的基础。
参考文献:
[1]杨琳,高洪美,宋俊典,张绍华.大数据环境下的数据治理框架研究及应用[J].计算机应用与软件,2017,34(04):65-69.
[2]常朝娣,陈敏.大数据时代医疗健康数据治理方法研究[J].中国数字医学,2016,11(09):2-5.
[3]陈火全.大数据背景下数据治理的网络安全策略[J].宏观经济研究,2015(08):76-84+142.
[4]梁芷铭.大数据治理:国家治理能力现代化的应有之义[J].吉首大学学报(社会科学版),2015,36(02):34-41.
论文作者:朱晓群
论文发表刊物:《建筑实践》2019年16期
论文发表时间:2019/11/20
标签:数据论文; 系统论文; 数据管理论文; 业务论文; 有线电视网络论文; 用户论文; 流程论文; 《建筑实践》2019年16期论文;