(云南电网有限责任公司信息中心 650000)
摘要:大数据时代的到来,电力企业的信息化建设步伐也在加快。信息化数据也在大规模增长,从而带来了存储设备不断增加,存储运维工作不断增多的困境。因此,建立科学的数据存储建设管理标准成为当务之急。进行存储资源池的建设,评析数据生命周期,进行数据分级存储,为企业的海量数据存储提供了新的思路。
关键词:电力企业,数据存储,数据生命周期,数据分级,存储分级
1 引言
南方电网公司信息化在大型数据中心、各级通信网络、大集中的业务系统、信息安全防护体系等方面创新了很多新技术,并提出“绿色IT”的信息化建设理念,并重点从资源整合、推广虚拟化技术等方面提高资源的利用率,遵从低碳经济、节能减排的新的信息化建设模式,实现“优化信息系统运行环境,提高软硬件资源的效能”绿色数据中心建设策略。存储平台也从以往的“烟囱”式架构开始想资源池化迈进。
目前云南电网已经完成了提供业务系统、计算资源池等稳定运行的大集中式存储资源池平台,构建了一个先进的、高效的、安全的存储资源池化环境以支持企业战略发展。随着企业信息系统的业务和需求的逐步深入推广、云计算技术的深入运用、南网异地灾备中心建设等,对数据中心基础架构的存储资源池提出了更高的要求。特别当原来运行于物理设备中的业务系统大量迁移至南网云IaaS层中后,不但对于存储空间提出了新的挑战,同时也对存储的IO能力、高可用能力提出的新的要求。新的框架带来了新的问题,但总体来说云计算是一种全新的计算模式,它把IT作为一种标准、有弹性、可扩展的服务提供给用户,存储资源以服务的方式通过资源池提供,好处显而易见,但依然沿用以往的建设模式、分配方法、运维方式已无法适应存储资源池的运行了。只有通过统筹全盘的规划,在现有存储资源池建设的基础上已确立全面的、合理的存储资源池规划。
2 存储资源池建设原则
以池化概念进行存储规划,将存储资源虚拟成一个“存储资源池”。其原理为通过云计算中的虚拟化技术把零散的存储资源和异构存储设备进行整合,提供统一数据存储服务,同时作为云计算IaaS层中的一部分向上层提供数据存储支撑、数据备份支撑、数据容灾支撑。
通过建立存储资源池,实现异构存储资源的整合、提高资源利用率、简化存储管理、屏蔽系统复杂性和兼容性、提升整体存储资源的功能型、降低重要数据的存储风险等。
同时通过存储资源池所具备的资源分割和分配能力,依据“服务水平协议(service level agreement)”的要求对整合起来的存储池进行划分,以最高的效率、最低的成本来满足各类不同应用在性能和容量等方面的需求,从而实现存储资源池的分级建设。
分级存储是指根据数据不同的重要性、可用性、访问频次、存储成本等指标,分别存放在相应的存储设备上。其工作原理是基于数据访问的局部性,通过将不经常访问或非重要业务的数据在系统搭建初期即将数据存放于存储层次中较低的层次,从而大大减少非重要性数据在一级磁盘所占用的空间,释放出较高成本的存储空间给更频繁访问的数据,从而加快整个系统的存储性能,获得更好的总体评价。因此,需要将业务数据进行等级划分,并分类存储。
总体来说规划原则如下:
以资源池化建设为根本;
以分级存储为建设依据;
以San为平台建设核心;
坚持重要数据的复制和备份;
兼顾供电局的数据互联互通;
以分布式存储等新技术为未来发展的重心。
3 存储资源分级管理
数据生命周期
数据生命周期管理通过制定合理的管理制度、组织架构以及对应的技术规范,协调各流程制度、技术规范的有效运行,从而提升数据服务水平与数据使用效率,从而实现降低成本、提高效率的目标。数据存储和备份规范是保障和基础,数据管理和维护是执行方法,通过高效的数据管理和维护效率,从而不断提升数据服务水平。
信息系统的生命周期可以划分为六个阶段:创建、保护、存取、访问、归档和回收。系统在数据创建时就应当获得数据的类型、数据产生时间、数据有效期限、数据对业务的重要性、数据访问的性能要求、数据安全保护级别等相关信息。对数据进行分类,划分价值级别,依照数据价值级别设定数据的存储级别,分配最优化、最具有性价比的存储资源。
数据分级管理
根据数据归类,不同类别的数据有不同的数据特性。数据特性主要包括数据重要性、访问频率、访问性能要求、数据量等。
重要性:在业务使用过程中按照数据的重要程度进行归类,数据分成不同的重要级别。
访问频率:在系统运行过程中,依据数据的访问频率,对数据进行归类。通过不同的访问频率定义不同的存储策略。
访问性能要求:根据业务部门需求,对于不同数据需要提供不同的访问性能支持。通过不同访问性能需要定义不同存储策略。
数据量:在系统运行过程中,数据以月/日为单位,按照数据量的大小,提供不同的存储策略。
数据分级管理策略的制定除了理论上需要正确的指导,更重要的是在制定过程中进行大量实际业务需求、系统现状的调研。在理论指导下结合实际情况制定出符合实际情况的管理策略。
系统分级存储
从应用系统视角,依据业界的相关标准规范,结合云南电网公司存储数据现状,对应用进行级别判定归类。根据系统的业务特点,可以大概分为:重要业务系统数据、服务支撑系统数据与系统数据三部分。
重要业务系统主要分布在业务支撑系统、管理支撑系统,如营销、生产、系统办公等南网6+1系统。该部分数据的归类方式主要参考TMF(电信管理论坛)的SID(共享信息模型)分类标准,为重要业务数据,使用高端存储池资源。
服务支撑型数据是指从各个生产系统收集的数据、经沉淀加工挖掘后形成的信息数据,该类数据主要分布在提供数据服务、数据支撑的IT平台中,如营销分析、数据资源管理、辅助决策等。该类数据存在数据量大,业务系统性能要求较高,使用中端存储资源池。
系统数据是面向IT运行过程所产生的数据,该类数据不直接被业务所需要,但是又占用相应的存储空间。众多系统实际情况表明,该类数据如果不有效管理将会严重影响系统的运行效率。系统数据主要包括:运行日志数据、过程数据和临时数据等,如审计系统。该类数据存在数据量大,系统性能要求相对较低,使用低端存储资源池。
应用级别判断涉及组织架构、流程制度、技术规范、系统支撑组成的管理体系。策略制定只是数据管理中技术规范部分,如何协调相关组织架构、流程制度保障策略有效性才是应用分级管理成功与否的关键。
空间分配管理
空间分配策略就是将不同的数据存放在指定的存储设备上。空间分配策略的制定除了满足业务需要之外,还需要考虑存储成本,制定合理的存储策略。SAN存储为在线存储,又称工作级的存储,存储设备和所存储的数据时刻保持随时响应状态,可以实时读写的,可满足计算平台对数据访问的速度要求。
归档存储又分为虚拟带库和物理带库:数据归档是将不再经常使用的数据移到一个单独的存储设备来进行长期保存的过程,对涉及的数据进行备份,以备非常规查询等,虚拟带库适合数据的周期性存放,使用成本大大低于SAN存储,物理带库:适合归档数据的长期存放,如归档数据等。使用磁带介质存放数据。价格相对低廉。
在数据生命周期管理中,需对数据价值级别进行定期的扫描监测,在时间点、数据价值级别、存储层次三者之间建立对应关系。一旦经过某个时间点后数据的价值级别发生变化,则将数据从SAN存储转移到虚拟带库或者物理带库中。
5 结论
大数据时代背景下,电力企业的快速发展,信息化步伐的加快,使得企业内产生的数据指数级增长。但这些数据的存储也让企业付出了巨大的采购和维护成本。因此,进行存储池化建设,以及对数据的生命周期、数据级别进行管理是非常必要的,通过完善科学的建设管理手段,不仅可以节约企业信息化建设的投入,同时也延长了存量存储设备的生命周期。从而实现存储设备价值的最大化。从而增强电力企业的竞争力,实现快速发展。
参考文献:
[1]粟湘;郑建明;吴沛;;信息生命周期管理研究[J];情报科学;2006年05期
[2]吕帅;刘光明;徐凯;刘欣;;海量信息分级存储数据迁移策略研究[J];计算机工程与科学;2009年S1期
[3]吕帅;基于对象的分级存储系统数据迁移技术研究[D];国防科学技术大学;2009年
论文作者:张敏
论文发表刊物:《电力设备》2015年第10期供稿
论文发表时间:2016/4/22
标签:数据论文; 系统论文; 资源论文; 业务论文; 策略论文; 级别论文; 生命周期论文; 《电力设备》2015年第10期供稿论文;