高校图书馆存储系统建设及其数据安全备份方案研究_数据安全论文

高校图书馆存储系统的构建及其数据安全和备份方案研究,本文主要内容关键词为:备份论文,图书馆论文,存储系统论文,高校论文,方案论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

随着高校图书馆自动化、网络化和数字化的迅速发展,图书馆数字资源呈现爆炸式的增长,图书馆的存储设备也面临着不断地扩容、升级和更新。进入新世纪以来,计算机存储技术取得了长足的进步,单位存储的容量增长迅速,存取性能有了很大提高,架构由原来的直连式存储向网络存储发展。特别是近几年来,存储新技术层出不穷,在存储系统的可靠性、可用性以及数据安全、数据备份和容灾技术等方面有了新的进展,同时,存储设备产品丰富,性能各异,竞争激烈,存储的价格也不断降低。这些都给高校图书馆存储设备的选型与存储系统的构建带来了一定的困惑和挑战。因此,图书馆根据本馆各类数据的特点,在有限的设备投入经费条件下,把握存储技术的发展方向,设计一个既具有前瞻性,又能整合现有计算机网络和存储设备,使之性能稳定、安全可靠、维护方便的数据存储、数据安全和数据备份的建设方案,就显得十分重要。

1 高校图书馆数字资源的特点和当前存储技术分析

1.1 数字资源现状

目前,高校图书馆的数字资源主要包括以下三类:一是图书馆业务管理系统数据,包括书刊目录数据、读者信息数据、借还信息数据等;二是图书馆购买的数字资源数据,包括电子图书、电子期刊和多媒体资源系统等的镜像数据;三是图书馆自建的数字资源数据,包括自建特色数据库数据以及随书光盘下载系统中的光盘数据等。其中,第一类数据约有数十个GB,数据量和每年增量都不大,基本保持稳定,但对数据的可靠性、稳定性、安全性以及存取性能要求很高;第二类数据一般达数个TB直至数十个TB,数据量和每年的增量非常庞大,数据的被访问量、访问并发数很大,但因数据库商存有数据备份,安全性要求相对低些;第三类数据量中等,一般至多可达数个TB,但对安全性要求较高,如果数据丢失,损失也比较大。在图书馆存储系统的构建中,必须考虑本馆各类不同数据的特点和存取要求,选择恰当的存储设备来保存数据。

1.2 各类存储技术性能分析

存储从应用服务器分离出来后,经过几十年的发展,逐渐形成直连式存储(Direct Attached Storage,简称DAS)和网络存储(Fabric Attached Storage,简称FAS)两大类。其中,网络存储(FAS)分为网络接入存储(Network Attached Storage,简称NAS)和存储区域网络(Storage Area Network,简称SAN),存储区域网络(SAN)又具体分为以光纤搭建的存储区域网络(FC SAN)和以iSCSI技术构建的存储区域网络(IP SAN)。目前,DAS、NAS、FCSAN和IPSAN都有比较成熟的产品在市场上供应。下面是各类存储的结构、性能、使用成本和适用性等的比较分析(见表1)。

2 高校图书馆存储系统方案的设计

规模较小的高校图书馆因管理系统使用小型数据库,没有建立大数据量的数字资源镜像和数据库,应用系统也比较少,对储存性能要求不高。这类图书馆投入的设备经费有限,存储设备只能考虑采用DAS和NAS。可以用DAS设备存储性能和安全性要求较高的图书馆业务管理系统数据和某些数据量较小的电子图书和电子期刊数据;使用NAS作为文件服务器,也可用来做关键数据的备份设备。数据量大的电子图书和电子期刊,可采用购买远程访问的服务方式来解决。下面主要探讨经费投入较大的大中型高校图书馆储存系统的设计方案。

2.1 系统设计的原则

图书馆存储系统的大数据量集中管理、高并发数的存取访问,都对系统的可靠性、处理能力、吞吐能力以及扩展能力提出了较高的要求。鉴于存储系统在整个图书馆计算机系统中的重要地位和关键作用,在存储系统框架构建、技术选择、性能分析等方案设计过程中,应遵循以下基本原则:

(1)实用性和先进性。立足采用成熟、稳定、完善的产品和技术,可适当超前配置,以适应更高的数据存储和处理要求。力求系统在一段时期内保持技术的先进,并具有良好的扩展潜力,以适应未来业务发展和技术升级的需要。

(2)高性能。存储系统必须能够承载较大的系统运行负载,提供大并发、高性能的数据存取能力,确保大型数据库和各类应用系统和的高效运行。

(3)安全可靠性。为保证业务应用7×24小时不间断运行,必须提供较强的管理、控制、监控和安全等技术措施来提高系统安全可靠性。如果发生系统宕机、磁盘损坏等情况,应确保数据不丢失,并可在短时间内恢复系统正常运行。系统必须有数据备份、硬件冗余、负载均衡等技术手段来保护关键数据和关键应用服务。

(4)独立性与可扩展性。存储系统应独立于应用系统,保证对数据的高度共享和高速访问,实现系统的集中管理。系统的建设要根据图书馆未来业务发展的需要,使其具备较好的扩展性,能方便地满足扩展系统容量、增强处理能力、调整系统结构、支持多种应用等要求。

(5)开放性和兼容性。具备较好的开放性和设备兼容性,可支持各种不同的操作系统、应用程序、文件系统以及计算机网络设备。系统设备应是业界主流产品,遵循国际开放式标准。

(6)经济性。不盲目追求最新的产品和最新的技术,注重设备的性价比和成熟度,要求较低的系统维护成本。关注新建系统与原有计算机网络设备的融合度,整合新旧资源,尽可发挥原有存储设备的作用和功能,充分保护过去的资金与技术投入。

(7)维护的方便性。存储系统的架构比较复杂,随着应用系统和数据量的不断增加,系统的管理任务将会日益繁重。在设计中应采用智能化的系统设备,使其具备实时监控运行状态、合理分配系统资源、迅速确定软硬件故障等功能。

2.2 系统方案的选用

根据以上原则,分析图书馆各类型数据对存储性能的要求以及当前存储技术的现状和发展方向,得出两套比较适合图书馆应用要求的技术方案,可供选择:一是采用光纤架构的存储区域网络(FCSAN)来构建存储系统;二是采用以iSCSI协议和IP技术架构的存储区域网络(IP SAN)来构建存储系统。

第一套方案采用FC SAN技术,是目前大型高性能存储系统的主流产品,技术比较成熟,性能突出,存储管理、双机热备和容灾备份等可选用的软件产品比较丰富,市场占有率较大。存储区域网络用光纤设备构建,数据传输的速度、可靠性和稳定性都非常高。但相对来说结构比较复杂,包括光纤硬盘、光纤交换机和HBA卡在内的整个系统的建设成本较高。第二套方案采用IPSAN技术,技术较新并逐渐趋于成熟,用传统的以太网构建存储区域网络,整个存储系统成本较低,但存储的管理软件相对缺乏。目前主流的千兆以太网带宽相对显得不够,影响整个存储系统性能。如用万兆以太网,性能虽有较大提升,但目前万兆以太网交换机、网卡等相关设备价格也很高。IP SAN的缺点还在于网络和存储是同一个物理接口,加上TCP/IP传输效率又不太高,协议本身的开销也比较大,需要频繁地将SCSI命令封装到IP包中以及从IP包中将SCSI命令解析出来,造成了服务器主处理器的负担和网络带宽的占用,数据传输的可靠性、稳定性和数据传输效率与FCSAN相比有一定差距。因此,大数据块传输的性能,基于千兆以太网的IP技术与基于4Gbps光纤的FC SAN技术相比还有一定差距。

图1 图书馆FC SAN系统结构拓扑图

比较以上两套方案,第一套方案存储系统的性能更高,技术更成熟,数据传输性能更可靠。特别是针对图书馆业务管理系统的大型数据库如Oracle、DB2、Sybase等的应用和大数据量、大并发数的文献检索和数字资源的浏览和下载,FC SAN技术具有更大的性能优势。目前,随着FC SAN技术的成熟和产品的广泛推广,产品价格也已大幅下降,FC SAN产品与近几年才逐渐发展和成熟起来的IPSAN产品相比,具有更高的性能价格比。

2.3 系统的配置和构建

FC SAN设备具体配置要求:应配有双冗余控制器,每个控制器配4GB高速缓存(Cache),总共4个独立的4Gbps的光纤通道接口,设备的最大IPOS应达到154000次以上。配置15000rpm的450GB光纤硬盘,原始容量为25TB,满配磁盘可扩展到50TB以上,提供包括RAID 1、0、0+1、3和5在内的多种数据保护方式。电源、风扇也双冗余配置,避免设备的单点故障。同时,配置存储管理软件模块,用于对存储局域网络的实时监控和管理。采用2台光纤交换机作为连接服务器和光纤磁盘阵列的桥梁,承担图书馆业务管理系统运行的小型计算机、负责重要数据库镜像服务的数据库PC服务器每台均配置2块HBA卡,通过两台光纤交换机与光纤磁盘阵列相连,防范I/O通道的单点故障。这样,通过光纤存储、光纤交换机和PowerPath软件构建起一个无单点故障的基于光纤架构的高性能存储局域网络。具体拓扑结构见图1:

PC SAN的光纤磁盘阵列除了存储对读写性能和安全性要求较高的图书馆业务管理系统数据外,还存储数据量大、读者访问并发数高的中国学术期刊和超星电子图书数据库等。图书馆原有的存储设备,如NAS设备和一部分性能较好、容量较大DAS设备,可以安装一些用户少、访问量小、数据量稳定、对存储性能要求不高的小型资源库,继续联入LAN相对独立地使用。对其他剩余的DAS设备,用SCSI-FC桥接器作为桥梁,将DAS联入光纤存储局域网络中进行统一管理和利用,并可作为一些重要数据的日常磁盘备份设备。NAS设备还可以安放在异地,联入LAN作为关键数据的异地备份设备。

3 高校图书馆存储系统的数据安全和数据备份方案

图书馆存储系统的构建应充分考虑系统的数据安全,特别是一些关键应用和关键数据。如图书馆业务管理系统及其数据的安全与否,直接影响到图书馆业务工作的运行和整个图书馆的开放。以上基于FCSAN存储系统的构建方案充分考虑了系统数据安全和数据备份的可行性。

3.1 系统的数据安全方案

为了保障系统的数据安全,系统设计采取了以下措施:第一,图书馆业务管理系统服务器采用基于UNIX操作平台的小型机,性能高,安全性好,能在很大程度上排除或降低黑客或病毒攻击造成系统瘫痪和数据丢失的可能。第二,小型机采用双机热备形式运行,其中任何单台小型机故障,都不会影响整个系统的正常工作,避免了意外宕机造成数据的丢失。第三,管理系统的数据存储在FC SAN的光纤阵列中,阵列的RAID5和全局热备盘的建立,保证了阵列柜在同时损坏2块及其以下光纤磁盘的情况下,能保证数据的安全和系统的正常运行。第四,光纤阵列控制器、电源、风扇等的冗余配置,以及配备两台光纤交换机和相应的自适应软件,形成小型机与光纤阵列数据通道的冗余,确保PCSAN内部的无单点故障,保证了系统的稳定和数据的安全。

3.2 系统的数据备份方案

基于FC SAN的存储系统为图书馆关键数据提供了安全、灵活、多介质的备份方案。光纤阵列中的图书馆业务管理系统数据需要每天在闭馆后进行备份,在备份服务器的控制下,系统数据可实现每天晚上定时的自动备份。数据不通过LAN传输,而是直接通过存储局域网的光纤通道,对DAS设备(见图1的DAS1)以及带库进行读写,从而实现了LAN-free备份,在不占用LAN的带宽的情况下,大大提高了数据备份速度。另外,将原有的NAS设备设置在与总馆有一定距离的分校区图书馆或分馆机房中,在晚上网络空闲的时间段,对管理系统的业务数据进行异地的自动备份,可增加关键数据备份的安全级别。如此,图书馆管理系统的数据有了三个备份:一份在DAS设备的SCSI硬盘中;一份在磁带库的磁带中,并可带出异地存档;一份在分馆的NAS设备中,做到了异地保存。这样的备份方案确保了图书馆关键数据的安全,使备份数据丢失的可能性降到了很低的水平。如果将来有更高的系统和数据安全要求,基于FC SAN的存储系统还支持更高级别的容灾备份,如数据的远程异步和同步热备份容灾以及远程的活动备援中心的应用级容灾备份。

图书馆需要进行备份的数据还包括图书馆自建的特色数据库数据和随书光盘下载系统中的光盘数据。这些数据的备份不需每天进行,而可根据数据的新增情况,每周做一至二次备份,或采取完全备份加增量备份的方法进行。备份可根据数据量的大小,存放在DAS阵列、NAS设备或大容量磁带库中。

4 结束语

目前,FC SAN存储系统技术成熟、应用软件丰富,具有更高的带宽、更好的数据访问性能。虽然,IPSAN技术较新,组网方便,但在万兆网应用普及之前,IPSAN还无法取代FC SAN在业界的主流地位。高校图书馆构建基于FC SAN的存储系统,较好地满足了图书馆应用系统对数据存取性能、数据安全、数据备份和系统容灾的需求。

收稿日期:2008-10-04

标签:;  ;  ;  ;  ;  ;  ;  

高校图书馆存储系统建设及其数据安全备份方案研究_数据安全论文
下载Doc文档

猜你喜欢