数据保存策略与生命周期管理,本文主要内容关键词为:生命周期论文,策略论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着数字资源的膨胀,图书馆将面临资源典藏与存储匮乏的矛盾。文章讨论的重点在于,引入数据生命周期的概念,控制资源无限膨胀的趋势,达到利用与保藏的平衡点。目前存储业的热点是信息生命周期管理理论,它提出了数据生命的七阶段:创建、保护/恢复、复制/镜像、共享、迁移/归档和删除。为此,基于不同的理解以及不同的关注层面,产生了各种技术和解决方案。存储设备厂商提出了分级存储的实施与管理;VERITAS等软件商关注数据的实世可用性,将重点放在灾备和镜像;计算机科学家则致力于数据长期可用性的研究,提出了迁移、仿真乃至虚拟计算机等思路。
对于上述的技术与策略,究竟该如何选择,目前讨论甚少。文章讨论了资源评估,即为了帮助数据保存策略的制定,根据定量的分析确定资源的生命周期,对生命周期不同阶段的数据制订相应的保存策略。分级存储、备份和镜像、迁移、仿真等等,表面上是数据保存的技术,实际上则代表了数据保存的不同策略,表达了人们对资源的不同需求。备份和镜像针对的是数据的实时可用性,镜像的实时要求更高;迁移和仿真针对的是数据的长期有效性,自建数据应该更多地关注这方面的进展。而分级存储是一种合理的解决方案,应用于不同档次的设备来获取高性价比的数据服务、备份和长期保存。对应于数据应用的不同需求,可以交叉地采用各种保存技术,比如备份和迁移,以构成完备的保存策略。选择不同的策略基于对数据价值和应用的评估,而建立量化的评估指标是实施数据保存策略的前提。