上海遥薇(集团)有限公司 上海 201802
摘要:数字图书馆从其功用和特征来看,好像翻译为“数字材料库”更为准确。它不是图书馆材料的简略数字化和简略的图书馆信息办理体系,而是一个杂乱的分布式的海量多媒体信息体系。数字图书馆是一个分布式的大型常识库,即以海量数据库为依托,根据智能检索技能和宽带高速网络技能的大型、敞开、分布式信息库群。换言之,数字图书馆是一个分布式的信息空间,能够存储数字化多媒体信息,它供给了信息传播与发布的根底渠道,以电子商务形式安排、传递信息。为用户安排网上海量的数字化信息使其能被有用地拜访,是数字图书馆的终究意图。
关键词:体系集成技能;数字图书馆;使用
1 对数字图书馆的认识
数字图书馆从其功能和特征来看,似乎翻译为“数字资料库”更为准确 。它不是图书馆资料的简单数字化和简单的图书馆信息管理系统,而是一个复杂的分布式的海量多媒体信息系统。数字图书馆是一个分布式的大型知识库,即以海量数据库为依托,基于智能检索技术和宽带高速网络技术的大型、开放、分布式信息库群。换言之,数字图书馆是一个分布式的信息空间,能够存储数字化多媒体信息,它提供了信息传播与发布的基础平台,以电子商务模式组织、传递信息。为用户组织网上海量的数字化信息使其能被有效地访问,是数字图书馆的最终目的。自动化图书馆(AutomaticLibrary)是依托于计算机及通信技术的应用,利用计算机进行辅助查询、检索和管理,强调操作于信息的技术,使检索和管理比传统图书馆更加方便、自动化,用户得到的仍然是印刷型文献。虚拟图书馆(VirtualLibrary),即网上图书馆,提供了比搜索引擎更为有效的检索工具,它类似于电子黄页,只是一种虚拟环境,没有实体的文献空间。复合图书馆(HybridLi-brary)[结合了数字图书馆的优势并对传统图书馆进行延伸,它共存着印刷型和数字化文献,吸收了二者各自的优点,可以满足不同用户的需求。而数字图书馆是一个数字化信息资源中心,是一种强调以用户为中心的电子商务经营模式 。
2数字图书馆根底设施建造
国家数字图书馆建造之初十分重视规范规范的建造。截止到如今,国家数字图书馆现已有34项规范规范,形成了包含数字资本的全生命周期的办理办法,这些规范已在全国各级公共图书馆进行推行和同享。
经过国家数字图书馆的建造,全国图书馆根底硬件渠道加快升级换代,各省级图书馆、地市级图书馆的存储空间和核算才能都有了大幅进步。据不完全统计,“十二五”时期,国家图书馆数字资本总存储量超过了2?270TB,省馆的均匀存储量到达了360TB,地市级的图书馆存储量到达了47.3TB;国家图书馆效劳器集群数量到达900台,省馆效劳器均匀62台,地市馆效劳器均匀9台。
国家数字图书馆不断完善数字图书馆网络体系建造,扩展网络掩盖规模,进步网络传输才能,完结网络的互联互通。逐渐建造了以专网为骨干,以虚拟网为补充,连接国家、省、市、县数字图书馆,掩盖全国规模的公共文明效劳一体化网络体系。如今,全国275家省、市级图书馆接入数字图书馆网络体系,掩盖全国的数字图书馆网络体系根本建成,如浙江省、江苏省、黑龙江省、宁夏回族自治区、天津市等区域已完结省、市、县三级网络连通。一起,各馆的网络条件也有了大幅度进步,国家图书馆网络带宽已达2G,省级图书馆均匀网络带宽533.9M,地市级图书馆均匀网络带宽87.1M。
国家数字图书馆还展开了规范化图书馆事务渠道建造。经过五年的尽力,到“十二五”末,全国各级图书馆完结356个事务渠道互联互通。
期刊文章分类查询,尽在期刊图书馆其间,一致用户办理体系在全国57家省、市级图书馆进行了同享;仅有标识符体系布置了48家省、市级图书馆,完结175万多条仅有标识符的注册与解析效劳。“十二五”时期,国家数字图书馆现已形成了相对完善的全流程事务办理体系和规范化归纳效劳渠道,有用进步了各地公共图书馆的资本建造才能、用户效劳质量和事务办理水平。
3数字图书馆集成需求处理的疑问
对体系进行集成的方针即是要维护已有的出资,减小体系改造和再建的价值。尽也许使现有体系的硬件不变或少变,只需出资或重写软件;使图书馆和各个信息源积累的信息和现有体系完结同享集成,封装已有的体系完结信息体系的重构。在传统图书馆向数字图书馆转变的进程中,面对一些不匹配的疑问。选用恰当的技能处理这些疑问,是完结数字图书馆的要害。数字图书馆的信息源,包含数据库、图画库、网页、电子邮件体系等的数据构造不一样,这取决于它们的存储、安排、办理和依存的渠道。因而,数字图书馆需求供给一个根底渠道,支持信息的生成,便于信息在网络上的传输,并方便用户的有用使用。图书馆的自动化随核算机硬件的开展而开展,由开始的集中式体系不断参加新的核算机和工作站,进而开展为网络体系。这么,就必定一起存在着大型机、PC和Sun工作站,运转着Win3x、Win9x、WinNT以及UNIX等操作体系和Sybase、SQLServer等各种数据库。使用网络互联,就也许共存着以太网、令牌环网、PSTN、FDDI网、ATM网等,以及使用于其上的各种通信协议,包含TCP/IP、IPX/SPX、NetBEUI等。完结数字图书馆就要在异构核算机、异构数据库、异构网络环境下完结交互操作,方便信息的同享和拜访。
4数字图书馆集成的特色
4.1 处理海量数据
数字图书馆的信息是分布式的、跨库的海量数据,需求集成很多信息源,答使用户无限量地拜访。
4.2 存储各种构造的数据
数字图书馆的数据分为构造化、半构造化和非构造化3种类型。构造化数据简单了解,当时的大多数集成体系即是根据这种类型;半构造化数据包含构造化数据没有的目录、异体字、嵌套构造等,比如HTML文档的“〈/BODY〉”符号;非构造化数据的构造松散,例如电子邮件,其主题、签名可有可无。斯坦福(Stanford)大学的目标交换模型(OEM)较好地处理了不一样类型数据的疑问。
4.3多媒体数据
集成多媒体数据可以经过集成元数据来完结,使用指针指向实际的数据。可是从元数据中抽取形式并不简单,尽管一些图画库选用了广义元数据的办法,但很多的多媒体数据,如电子目录、网上广告的图画没有形式元数据。在多个信息源的多媒体目标中建立对应,就靠人工或专用元数据抽取工具来完结。从多媒体数据中抽取形式的办法有很多,可是集成多媒体数据更多地依靠预抽取进程的元数据,这么新生成的多媒体数据就不能当即进入集成体系。
4.4习惯信息源的改动
信息源的改动包含形式和数据。在很多环境中,形式是常常改动的,比如,当有了新的办法和试验进程时,科学数据库就要改动。信息源均匀每年有2~3次形式改动。初始信息源形式的改动也许形成集成块的不正常工作,因而集成块必须具有初始信息源形式的常识,尽管集成块可以人工改动,可是杂乱、贵重。对构造化数据,可经过装备数据库触发器或核算数据库日志进行改动检查。使用树构造来表明半构造化文档;选用图构造来检查这种形式改动。
4.5 投合不一样的用户
体系集成需求投合不一样水平、特色、喜好的用户,需求适使用户的不一样使用(如PC、PDA等)。一般可选用跟踪用户的查询前史的办法来估测终端用户的喜好,一起如今现已有很多办法用于断定客户端的使用才能。
结束语
在数字图书馆中对现有体系进行集成所选用的技能需求具有较好的跨渠道性及较高的功能。与编程言语无关是CORBA的优势,并且CORBA的很多功能指标优于别的技能。从长远来看,中间件、署理、COM/DCOM/COM+和JavaBean等技能与CORBA技能的交融将是数字图书馆集成的极好的处理方案。数字图书馆是一个国家数字化的文明渠道、教育渠道和资本基地,它的建造将为咱们迎候常识经济时代的到来供给强有力的支持渠道。
参考文献
[1]李秀.数字图书馆的互操作与分布式构件技术[J].现代图书情报技术.2002(01).
[2]蔡清万.智能Agent技术在数字图书馆中的应用[J].情报杂志.2001(06).
[3]初景利.复合图书馆的概念及发展构想[J].中国图书馆学报.2001(03).
论文作者:姚剑
论文发表刊物:《防护工程》2017年第9期
论文发表时间:2017/9/7
标签:数字图书馆论文; 图书馆论文; 体系论文; 数据论文; 信息源论文; 分布式论文; 是一个论文; 《防护工程》2017年第9期论文;