PDG应用模式_图书馆论文

PDG应用模式_图书馆论文

PDG的应用模式,本文主要内容关键词为:模式论文,PDG论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

PDG技术体系的意义在于以目前存储产品可以接受的容量实现了基于图像的图文资料数字化。长期以来,整个社会的知识、资料和各类信息都是基于纸张进行记录和传播的,这些资料理应进入现代化的计算机网络中,以便发挥更大的作用。即使是在全球化计算机网络大为盛行的今天,政府部门和企业机构的公文往来还是基于纸张的,办公自动化并没有带来“无纸办公”。所以,在公文流转过程中,电子文本文档和纸质文档的集成化管理仍然是十分迫切的问题。PDG则为解决上述问题提供了可行的方案。

在应用PDG技术解决这些问题的时候,基本上会面临两个问题:一是多年积累下来的纸张资料如何高速度、低成本地进入计算机系统。超星图文资料数字化加工中心就是用来解决这个问题的。二是基于图像的资料信息管理如何与政府部门和企业机构的当前业务有机地结合起来。这个问题比较复杂,因为各单位的业务流程不同,需求也就存在不小的差异。尽管如此,我们还是能够对各种业务流程进行归纳分析,提出可行的解决方案。

目前,图文资料数字化有代表性的应用领域有档案管理自动化、文档流转管理系统、在线图书馆和光盘图书制作。这些应用领域的共性是他们都涉及资料的输入、管理和发布这三个环节。它们之间的差异可以大致这样描述:档案管理强调资料的安全和使用上的权限控制,应体现出用户在使用上的权限控制;应体现出用户在使用权限上的差异,系统应当根据登录用户的工作职责来为其提供不同的功能支持。在线图书馆强调为世界各地的远程用户提供一致、快速、方便的图书资料阅读支持,要求配备功能稳定、吞吐能力大的服务器和方便实用的远程浏览器。光盘图书制作则强调针对不同的文献资料特定的资料阅读附助工具。以下是对PDG图文资料数字化体系典型应用的介绍。

1资料数字化加工中心

图书馆、档案馆和资料室都是纸质资料堆积如山的地方。几乎任何企业、单位和部门都有各种不同规模的文件资料保存、管理机构。应该说,新资料的录入是一项长期工作,而多年积累的资料都是非常珍贵、不可能再次获得的,经过数字化以后,这些资料的原件仍然需要妥善保管,因此在整个工作过程中绝不允许出现任何的丢失、损毁和差错。另外,这些单位大多属于公益事业或者业务保障部门,并不参与盈利活动,所以经费往往比较紧张,资料数字化的费用必须控制在他们能够接受的范围之内。

为了将PDG系统推向实用化,为社会各界提供大规模资料数字化的实例和价格低廉的资料数字化服务,超星公司与国家图书馆合作,于1998年建成了国内第一条大规模数字化扫描生产线,成立了数据加工中心,目前已经形成了日加工量30万页的生产能力,年加工能力则达到了8000万页。这类资料数字化加工中心的服务对象包括:(1)图书馆、档案馆和出版机构的图文资料;(2)工商、税务、银行的票据、凭证;(3)医院的病历、保险公司的单据;(4)政府机关及企事业单位的文件和资料;(5)其他需要以原文原貌形式进行管理的资料。

到目前为止,这个资料数字化加工中心已经为国家图书馆、国家商标局、国家技术监督局、北京市宣武城建开发公司和天津TEDA工商局等多家单位完成了近5000多万页资料的数字化工作,资料内容包括图书、注册商标、工程建设档案、企业注册档案和期刊杂志等多种类型。其中天津TEDA工商局已经利用PDG技术实现工商管理业务自动化和档案与日常文件处理一体化,在此过程中有150万页的原始档案需要实现数字化。类似的工作曾经有不少单位尝试过,终因工作量大、工期无法预计和控制而不了了之。这次由PDG资料数字加工中心承担此项工作,预计工期为3个月,实际工期用了3个半月,实践证明其工程控制是比较成功的。在原始档案的分拆、扫描和重新装订过程中没有发生任何丢失、损毁和差错。

1999年5月,美国加州大学圣地亚哥分校(UCSD)图书馆负责人BruceMiller先生专程参观访问了这个数据加工中心,认为其在规模上已经走在了全世界的前列,并计划以在UCSD建立清朝历史资料库为契机把这种模式介绍到北美地区的图书馆业。

2文档流转管理

基于图像存储的文档管理系统主要是适应一般企事业单位和特殊行业两类用户的需求。

许多企事业机构虽然已经建立了内部公文流转处理系统,实现了基于文本的文档处理自动化,但目前与企业机构以外的绝大多数公文往来仍然是基于纸张的。尽管政府和企业信息化的推进力度很大,但传统基于纸张的公文流转体系并没有改变。不论是机关单位还是个人,在进行重要业务活动的时候总是要留有“文字依据”。文件承办过程从起草到印发都在计算机中进行,但出来的结果却还是要以纸张形式分发、传递。许多业务活动的依据仍然是基于纸张的文件、合同和档案资料,需要经常去基于纸张的文档管理部门调阅,办公自动化系统的效率因此而大打折扣。将这些与企业机构处部往来的文档资料输入到企业内部网之中,必将大大提高工作效率。目前许多单位不得已而采用人工打字的方式将外来文件输入计算机系统,但这样做不仅速度慢,而且发生录入错误的可能性很大。所以在许多单位的电子文档资料库存中每份文档都有“责任录入人”的记录,用来解决录入当中发生错误时的责任问题。这些文档主要是用来作为办事依据,在系统中起备查的作用,不需要、也不允许作任何修改。以扫描方式将这些文档输入到计算机之中,不仅速度快,而且不会出现任何文字错误。为了将基于扫描图像的公文归档查询功能集成到已有的文本文档处理系统中,我们采取了“打补丁”的方法。特别值得一提的是,已经实现了LotusNotes环境中的高压缩比图像文档管理,为原有的办公自动化系统注入了新的活力。

不少单位的业务性质决定了他们的文档中必然有大量的影像信息,必须以图像的形式输入计算机系统。例如公安部门的刑事侦查工作会产生大量的照片资料,车辆管理部门对车辆档案的管理也是如此。医院的病历、保险公司对投保人资料的管理以及银行对客户资料的管理,都需要保存资料原件的影像信息。在这方面,天津经济技术开发区(TEDA)工商管理局应用得非常成功。工商管理局要办理企业成立、变更和注销等业务,必须在各个环节以所填写表格的原文原貌为依据,而且经常要查阅企业不同历史时期的资料。在使用“超星工商档案查询系统”之前,各个部门之间必须来回传递文档原件,特别是在需要查询历史资料的时候更是非常繁琐。1999年3—6月,他们利用资料数字化加工中心将150万页档案资料输入计算机系统,同时调试开通基于图像的网上公文流转查询系统,工作效率得到明显提高。如今,只要拥有相应的权限,在Internet通达的任何地方都可以调阅这里的资料。这个系统的显著特色是高度的安全机制和高效的纸张资料数字化。

3档案管理自动化

档案管理自动化是PDG技术最先得到广泛应用的领域。采用这种方式进行档案管理,具有以下好处:第一,有利于档案原件的保存。光盘存储信息最大,对存放环境要求不高,又方便查阅。这样,原件就不用经常挪动,可以放在更安全的地方。第二,有利于充分发挥档案资源的作用,更加迅速、准确地提供档案信息服务。档案资料进入计算机网络后,查阅的时间和空间限制都被完全打破,这在档案史上是具有划时代意义的。第三,有利于档案工作的规范化、标准化。采用新一代编目标引系统后,档案信息管理的规范化程度得到了明显的提高。第四,有利于实现办公自动化。在传统业务模式中,档案与日常公文办理相互分隔,应用PDG资料数字化技术实现了从文件登记录入、立卷归档到资料管理的全程自动化。PDG档案管理自动化的基本过程是用扫描仪将档案资料以图像方式录入计算机,经过高倍率压缩后存入光盘库。查阅时通过数据库检索,找到相应的资料并以图像方式显示出来。凡是连接在网络中的工作站都可方便地查阅所需的档案资料。我们根据档案信息内容的不同,已经开发出文档管理系统、工程图纸管理系统和声像档案管理系统。全国30个省市已有近千家用户,分别属于政府、军队、邮电、外贸、公安、建筑工程等不同的行业。

4在线图书馆

大规模资料数字化技术的成熟和Internet的迅速普及是在线图书馆的物质基础。一般的档案部门在将多年积累下来的资料数字化以后,新增资料的批量相对较小,对资料数字化加工能力的要求就不那么高了。所以,资料数字化的模式应该是首先借助于数字化加工中心,采取外包的形式突击实现原有资料的数字化,然后再配备一定的数字化加工能力。但图书馆的藏书总在不断增加,所以要求配备较强的资料数字化加工机构。图书馆拥有的文献数量大得多,服务用户的数量和使用频度都比档案馆高,所以对资料编目标引系统具有更高的要求。在线图书馆的最终目标是为读者提供方便的阅读手段,远程图书浏览器是其中最为重要的组成部分。典型的在线图书馆解决方案包括以下几个组成部分:

(1)数字化图书资源制作系统

PDG技术为大规模图书资料数字化资源制作提供了强有力的支持。图书资料以300dpi的分辨率扫描输入,经压缩后每页占用存储空间30KB—50KB。为了改善网络下载速度,在远程浏览时以150dpi分辨率传送到用户端。实践证明这样的分辨率在使用显示器进行阅读时效果还是能够令人满意的。传统图书馆走向在线服务,可先利用资料数字化加工中心完成原有图书的数字化,同时根据自己藏书增加的速度配备相应规模的数字化加工中心。

(2)文献编目标引和资料检索系统

在线图书馆的文献编目采用新一代机读目录SGML格式,按照《中国文献编目规则》进行编目,并可实现图书资料的深度标引,详细准确地描述图书资料的内容,为用户检索提供有效的支持,基于这样的编目标引系统,可以开发出功能完备的资料检索系统,向用户提供指向图书资料标题、目次、章节、摘要甚至特定内容的URL地址。

(3)图书浏览器

自从开发成功那天起,超星图书浏览器就可以从网上免费下载,目前这个浏览器已经发展到3.6版。它在功能上完全兼容普通的Internet浏览器,但主要是用来下载和解码经小波变换算法压缩的图书资料。为了加快下载速度,其中采用了多线程技术,在拨号上网的情况下,每页资料的下载时间一般为2—3秒。这个浏览器还具备个性化图书资料管理功能,可以方便地建立个人的数字图书馆。更有意义的是,它形成了一种新的图书消费模式。过去,我们只能以整本为最小单位买书,现在可以页为最小单位阅读。

标签:;  ;  ;  ;  ;  

PDG应用模式_图书馆论文
下载Doc文档

猜你喜欢