“数字灰色文献”工程建设攻略,本文主要内容关键词为:工程建设论文,文献论文,灰色论文,数字论文,攻略论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
依据1997年举行的第三次国际灰色文献会议中与会者的共识:灰色文献是指不经营利出版者控制,而由各级政府、学术单位、工商业界所产制的各类印刷与电子形式的资料。由于灰色文献包括报告(含预印本、学术会议资料与报告、技术报告等)、博硕士论文集、会议论文文集、技术规范与标准、非商业性翻译、书目、技术与商业文件、非商业出版的官方文件(含政府报告与文件)等,因此,具有内容复杂、信息量大、形式多样、不拘一格、出版迅速、时效性强、隐蔽性大以及收集困难等特点。尽管如此,灰色文献的利用率日趋提高,按照《科学引文索引》(SCI)所进行的研究以及诸如美国国家航空与航天局(NASA)、德国卡尔斯鲁厄专业情报中心和意大利高级卫生研究所编辑部等组织所作出的估计,灰色文献在文献源中所占的比例现在可能已经超过20%,而且还处于上升态势。
1 西方发达国家灰色文献的收集与利用
目前西方在灰色文献的收集与利用上,以欧洲灰色文献利用协会(European Association for Gray Literature Exploitation,简称EAGLE)推动的的合作计划(欧洲灰色文献资讯系统)为代表。在欧洲有17个国家负责收集,涵盖的学科主题有:社会科学、自然科学、人文科学、技术、生物与医学等;种类有:报告、博硕士论文、会议论文集、进行中的研究报告等。并订有相关的合作标准,以便合作收集与管理。该系统可通过STN International、BLAISELINE、ABES及SilverPlatter公司每年的光碟产品提供检索。英国MCB大学出版社下的灰色文献网(http://www.konbib.nl/infolev/greynet/home.html)所提供资料的来源就是上述的欧洲灰色文献利用协会等相关单位。该网提供下列信息:灰色文献会议;灰色文献通讯;灰色文献网上书目;国际灰色文献组织与人物指引;国际灰色文献期刊等,对于推动灰色文献的收集与利用有极大的贡献。
亚洲各国开发利用灰色文献起步较晚,以发展较快的日本为例,至20世纪80年代中期陆续建立了各类型灰色文献数据库,以供联机检索。我国是近几年引进控制论、“黑箱原理”以及模糊理论后才将灰色文献的概念加以明确化。
2 “数字灰色文献”的基本概念
Internet的全球开通,为打破地域界限、实现灰色文献资源共享创造了条件。但也产生了文献载体和存取手段单一的负面影响,从而使文献的灰色度增加。而媒体技术能处理文字、声音、图像等媒体资料,这样,除文字式的灰色文献外,也有可能使以图像、声音为载体的文献变成灰色,这是因为不具备多媒体技术就无法应用这些资料。由于桌面式出版系统及电子计算机编辑系统广泛应用,研究人员可将自己的研究成果直接打印向外交流,从而导致出版物的无序化,给文献收集增加更大的难度。面对这样的形势,要实现灰色文献的网上有效开发,必须首先全面实现灰色文献的信息化,而实现信息化的关键途径是数字化,即建设“数字灰色文献”。
2.1 “数字灰色文献”概念解读
“数字灰色文献”就是借助于计算机网络信息系统、通讯系统等现代化手段及传统手段采集灰色文献的基础数据,通过网络等快捷传输方式,对灰色文献构建一体化的数字集成平台和虚拟环境。在这一平台和环境中,以功能强大的系统软件对灰色文献的开发和管理的各种方案进行模拟、分析和研究,并在可视化的条件下提供决策支持,增强灰色文献开发的科学性。简单地说,“数字灰色文献”就是物理灰色文献的对照体,即通过全数字化数据库平台的构建,建立灰色文献的数字化(虚拟)研究环境。通俗地讲,“数字灰色文献”就是将灰色文献装进计算机,通过网络为收集、分析、研究、开发和管理灰色文献提供科学技术支持。
2.2 “数字灰色文献”工程构建的基础平台
“数字灰色文献”是一个通过全数字化数据库平台构建的过程。一般来讲,其过程包括三个环节,即:数据采集系统、数据传输系统、数据存储及处理系统。
数据采集系统。数据采集系统是“数字灰色文献”工程建设的基础。数字灰色文献的数据采集系统要求的数据第一要具有广泛性、快捷性和时效性。
数据传输系统。根据“数字灰色文献”建设的需要,数据传输系统包括通讯网和计算机网络两方面的建设。首先是通讯网,各应用部门或单位采集的灰色文献信息,包括各种数据、声音、图象等,都要通过一定带宽的通讯网进行传输,在建设“数字灰色文献”的目标下进行全面规划和建设。其次,建立健全的计算机网络,即不同用户层次的局域网。
数据存储及处理系统。“数字灰色文献”的数据和信息都是海量的,其存储目前主要依赖于分布式存储系统,各数据库都需要以字段编码的形式按一定的表结构有效地组织起来,形成“数字灰色文献”数据库。通过海量的数据库存储及处理系统建设,将构建灰色文献数字化集成平台。
3 “数字灰色文献”工程建设内容
3.1 建立灰色文献全文数据库,走联合开发之路
目前我们在因特网上看到的灰色文献数据库很少,有限的数据库诸如学位论文数据库等建设仍停留在题名库和摘要库的层次上。为了提高灰色文献的开发利用率,首先要建立灰色文献全文数据库,并建立多元检索途径,以方便用户通过更强大的检索功能和多种检索渠道获得有关信息;通过计算机网络提供远程查阅,以提高用户的检索速度,同时为用户提供多种检索方式,拓宽检索范围,走联合开发道路,达到资源共享。灰色文献特点决定了它不可能在版编目,也不可能被国家的文献数据库统一标引录入,只有灰色文献收藏单位才能对这类文献进行整理和标引。因此,灰色文献全文数据库建设对于灰色文献的开发利用具有重要的意义。
从灰色文献数据库建设的发展策略来看,必须按照“资源共享、数据一致性和标准性”的原则,建立统一标准和规范的基础数据库系统,走整体化的发展道路,统一规划、统一管理、集中力量、形成优势。要特别注意不同信息来源数据的实时动态采集、整理及入库,将数据以统一、规范的信息格式向“数字灰色文献”工程各应用系统提供。建库要分三个阶段进行。第一阶段,由于全文检索技术涉及到汉语的自动分词、海量数据库快速索引和查询技术、网上资源搜索引擎等许多非常复杂的技术问题。因此,要开发全文检索系统,首先要选择一个较为成熟的商业化全文信息管理系统,在此基础上进行二次开发,完成所需的各种功能。在众多全文信息管理系统中,笔者认为Lotus Notes/Domino和TRS系统功能较为强大,性能较为稳定。第二阶段,首先由灰色文献收藏比较丰富的单位率先建库,总结经验,制定统一数据加工规范。第三阶段,联合其他有关收藏单位共建灰色文献信息网,实现优势互补,减少信息资源交叉收集和重复建库的浪费,促进灰色文献数据库整体化建设,实现资源共享。
3.2 优化灰色文献的信息收集和信息组织与检索方式
灰色文献的存储、获取、使用与传输与传统信息资源有很大不同,如何在网络信息空间中高效、迅速地作到灰色文献信息的高度共享和交换,以及如何提供有效的信息收集和信息组织方式,是“数字灰色文献”建设必须注意的问题。
首先是优化灰色文献的信息收集方式。在进行人工搜集的基础上,加大自动化搜集的力度。自动化收集是指用专用的搜索软件进行因特网上相关信息的搜集工作。其工作原理是:从一个或一组URL开始,访问该URL并进行本地索引,同时记录该URL所指HTML文件中所有新的URL锚链(anchor);然后再以这些新的URL为起点,继续进行本地索引,直到没有满足条件的URL为止,并对新的URL进行分析和判断,去掉不需要的URL。
其次是优化信息组织与检索方式。要从用户信息检索利用全过程来重新审视信息组织的要求和功能,从整体信息交流环境角度来建设信息组织机制和工具。我们知道,数字灰色文献的构成包括三部分:一是将部分纸质载体或其他载体转化为数字化形式,二是由出版商或学者生成的原始数据化作品,三是通过链接Web上相关的信息资源提供一些外部资料。前两部分基本是围绕某一主题构成的一个整体,生成之后可以保持相对稳定,所以,这两类电子文献的分类和主题标引完全可以参考或借用现有的一些词表和类表。第三部分的存在形式与前两者不同,其信息是由Web服务器将信息组织成分布式的超文本,通过HTM和HTTP(超文本传输协议)来描述和组织的。由于网上信息时刻处于更新状态,要对它们进行分类和主题标引而使检索更加方便,要依靠两个关键技术:首先是Metadata技术。Metadata技术通常定义为“关于数据的数据”或“描述数据的数据”。通过它可以使我们了解到某个因特网站的资源类型,某个Web页面的标题、作者、主题及关键词、内容摘要等信息。目前较有影响的Metadata规范有:Dublin core、PICS、Webcollections、CDF、MCF及RDF。这些标准的应用,可使数字灰色文献的组织处理更加趋于合理。其次是搜索引擎技术。目前搜索引擎的网页搜索原理是通过服务器上专门的搜索软件时时刻刻对新站点进行索引,并建立相应的索引数据库,并在此基础上实现网上信息的分类和主题标引及定题检索等方面的功能。
3.3 开发智能管理系统
创新是“数字灰色文献”建设的灵魂。要使“数字灰色文献”工程建设顺利实施,就要积极导入智能管理概念,努力开发智能管理系统。智能管理蕴涵了“知识管理”、“信息管理”的概念,并在两者的基础上加以升华和发展。智能管理有两方面的含义:智能化管理和智能性管理。
智能化管理是人工智能、知识工程、计算机网络、数据通信、信息高速公路、多媒体技术、虚拟现实、智能自动化等新方法、新技术,应用于管理系统、管理过程,以提高计算机管理系统的运行效率和智能水平、改善人机界面、实现人机协调、扩展计算机管理系统的管理功能和应用领域,构成智能化、集成化、协调化的计算机管理系统。在这里,“智能”是管理的方法、手段和工具。其关键技术有:广义管理模型、智能优化方法、多库协同软件、人机智能接口等。
智能性管理是对智能及其宿主的管理。如:对人的智能和人的管理、对机器智能和机器的管理、对集成智能和人机系统的管理。目的是实现人尽其才、物尽其用,特别是充分发挥“智能”作用,合理利用知识力量,有效管理信息资源。智能性管理强调对智能、知识、信息等无形资产、软资产的管理,而不是对机器、设备、材料等有形资产、硬资产的管理;强调对具有智能、拥有知识、掌握信息的“人”的管理,而不仅仅是对计算机、通信设备等“物”的管理。
智能管理的上述两个方面是相辅相成的,所以,“数字灰色文献”建设导入智能管理,意味着采用智能的方法和技术,是对管理信息系统MIS、办公自动化系统OAS、决策支持系统DSS的功能集成与技术集成,并与人工智能、专家系统、知识工程、模式识别、多媒体技术、计算机网络、信息高速公路、虚拟现实、智能自动化等相结合的产物。
3.4 加强灰色文献网上建设著作权法的保护
在全球数字化时代,著作权保护问题特别是数字化技术对著作的影响正在受到人们的关注。灰色文献中的信息大致可分为两类:公共信息和非公共信息。公共信息主要指超过著作权保护期限的文献,包括政府出版物如法律、法规、国家机关的决议、决定、命令和其它具有立法、行政、司法性质的文化及其官方正式译文、时事新闻、历法、数表、通用表格和公式等。对这一类信息,基本不涉及法定许可问题,将允许用户自由复制、存取、传递。更为多数的另一类是非公共信息,包括图书情报机构集中采购或分散采购的各种载体的灰色文献信息资源,以及通过征集、捐赠、交换等多种渠道获得的信息资料等等。对非公共信息网上建设著作权法的保护问题,笔者认为应注意三方面的问题:一是文献数字化中的著作权保护。必须严肃对待作品的著作权问题,尊重著作权人的署名权、作品的完整性等精神权利,不能任意隐匿著作权人姓名,不能任意篡改作品内容的组织形式,此外还要设法获得著作权人的法定许可并支付一定的报酬。二是电子文献传递中的著作权保护。在电子文献传递过程中,要先获得著作权人的授权,并向著作权人支付报酬。三是灰色文献全文数据库开发中的著作权保护。在开发全文数据库时,应考虑数字化转换中的知识产权保护问题。
4 “数字灰色文献”建设的保障措施
“数字灰色文献”工程是一个庞大、复杂的系统工程建设,为使“数字灰色文献”建设得以顺利实施,根据灰色文献工作在世界各国的发展以及我国实际情况,必须采取一系列保障措施。
(1)统一组织,统一规划。面对“数字灰色文献”建设,一方面必须加强统一领导为其提供可靠的组织保障;另一方面,作好统一规划,一定要遵循“整体布局、分步实施、先进实用、共建共享”的原则,以应用为中心,力求高起点,使其具有开放性、兼容性、扩展性,能适应现代信息技术的飞速发展,满足未来功能升级的要求。
(2)确保投入。“数字灰色文献”工程建设,不仅要有一次性投入,而且还要有运行的长期保障,以确保工程建设与运行的顺利实施。
首先,要唤醒对灰色文献重要价值和灰色文献工作迫切性的认识。学术刊物要加大宣传力度,以引起图书情报界的重视;在适当时机,召开全国性或地区性的灰色文献学术讨论会,逐步统一对灰色文献有关问题的认识。
其次,成立灰色文献学术研究组织和工作机构。在中国科技情报学会、中国社科情报学会和中国图书馆学会等学会下设立灰色文献分委员会;在中国科技信息所、中科院文献情报中心、中国社科院文献信息中心、国家图书馆等文献情报机构内设立灰色文献工作部门,负责所主管部门的灰色文献工作,对全国灰色文献工作进行统一规划和协调。
(3)加强国际交流与合作。组织全国的灰色文献学术机构和工作机构参与国际交流与合作,使我国的灰色文献工作早日与国际接轨,加强国际合作和运用新情报技术。
收稿日期:2002-06-07