试论面向数字书目控制和数字资源控制的数字目录学,本文主要内容关键词为:数字论文,目录学论文,试论论文,书目论文,资源论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G257 [文献标识码]A [文章编号]1003-2797(2007)05-0034-08
随着因特网的迅速发展,网络信息资源的飞速增长,使不断增长的海量文献信息量与人们特定需求之间的矛盾日益尖锐。所以社会数字化进程的加速,对传统目录学提出了新的要求和挑战。这种挑战不仅仅是现代社会对文本信息的组织和利用提出了更高的要求,同时人们对网络信息的需求也大大增强,这就要求建立在文献基础之上的书目与书目工作,必须实现数字化、自动化,同时开展数字目录学的研究。另一方面,随着信息技术的进步,目录工作也具备了实现自动化和网络化的条件,现代信息社会对文献信息的处理能力和服务能力大大增强,这也促使目录学理论能够从更宽的视野展望全局,为实现目录工作数字化突破奠定坚实的基础。
1数字目录学研究的现状
1.1国内数字目录学的研究回顾
对于目录学的这个转变,2001年华南师范大学乔好勤等指出:网络信息目录控制是目录工作发展的新阶段,是当代目录学研究最重要、最现实的课题。当代目录学要联系实际,要讲实用,就非研究网络信息目录控制不可。乔好勤认为,对网络信息目录的研究,可叫网络信息目录学或称网络目录学[1]。
在2004年10月第四届全国目录学学术研讨会上,南开大学柯平提出在20世纪文献定位的基础上确立21世纪的信息资源——知识定位,从而形成目录学的三个层面的研究:文献目录学、信息目录学和知识目录学,而目录学的发展重点首要的是数字目录学[2]。其后柯平又系统阐发了数字目录学的思想,他分析了数字目录学的实践来源和理论基础。从实践来源看,数字目录学的基础是文献数字化与书目工作数字化实践。书目情报的数字化过程具体包括书目情报的电子化、书目情报的网络化、书目情报的集成化和书目情报的智能化[3]。为深入研究,一方面探讨数字资源编目,主持完成南开大学社科研究项目“西文电子资源的编目研究”,发表了《数字化环境下编目工作的变化及对策》(《图书与情报》2004年第5期)、《西文文献著录条例(修订扩大版)电子资源编目条款的变化研究》(《图书馆理论与实践》2004年第6期)、《四种西文电子出版物的编目实践探索》(《图书馆论坛》2005年第4期)等。另一方面探讨数字资源管理,发表了《机构知识库的发展研究》(《图书馆论坛》2006年第6期)、《机构知识库——大学图书馆的新平台》(《新世纪图书馆》2007年第1期)等。
对于目录学研究的新情况,武汉大学彭斐章先生曾指出:“如何科学地解决数字时代信息资源的生产、聚集、组织、传播、开发和利用等方式方法的问题,是21世纪我国目录学研究面临的重要问题。可以说,目录学研究正进入数字时代。”[4]。从这句话我们可以看出,面对海量的数字信息资源,数字目录学被赋予了新的使命。彭斐章先生一直领引着中国目录学的方向,他主持的国家社科基金项目“数字时代目录学理论的创新与发展”(05BTQ010),探索目录学的数字化环境及目录学的未来发展,数字环境下书目控制是一个重要内容。彭斐章先生和他的博士生邹瑾在《数字环境下的书目控制研究》中从以下四个角度进行了分析:数字资源书目控制的范畴、标准及目标;数字资源的描述控制及书目组织;数字资源权威控制;数字化书目情报服务与资源共享。特别是南非新的《缴送本法案》改变了过去在规定缴送范围时列详细清单的做法,而是通过对“文献”、“媒体”和“出版”等术语进行重新定义,对缴送范围做出了清晰明确的规定[5]。博士后程结晶与他的导师彭斐章先生的两篇论文《数字时代的目录学发展路径——网络资源导读服务》(《情报资料工作》2006年第6期)、《网络资源导读与信息素质教育构建的新功能》(《中国图书馆学报》2007年第2期)则从另一个角度深化了数字书目情报服务研究。
除上述研究外,关于网络书目控制的研究成果有梅海燕的《网络电子期刊的书目控制》(《图书馆学研究》2003年第12期)、何志兰和蔡宇宏的《论网络环境下的书目控制及实现》(《四川图书馆学报》2005年第3期)、吴志强的《网络信息资源的书目控制与资源整合》(《科技情报开发与经济》2006年16期)等。关于数字时代目录学发展方向的成果有刘青的《数字时代目录学研究及其发展趋势》(《图书馆理论与实践》2007年第2期)等。关于数字目录学相关的数字资源组织与管理、服务与评价的成果较多,在此不作赘述。
1.2国外数字目录学的研究进展
(1)搜索引擎与网络目录。关于Seach Engine、Web Bibliography、Web Diretory,国外有较多的实用工具和研究成果,它们相互借鉴相互影响,出现了相互渗透和融合的趋势。
(2)超大型数字联合目录。国外数字联合目录趋向于大规模并与图书馆联盟相配置。例如,GIL Universal Catalog(http://giluc.usg.edu/)是由Endeavor Information Systems开发的一个对多个图书馆联盟的多种数据库进行操作的集中式联合目录。现已连接乔治亚州大学系统中的35个大学图书馆,拥有近900万条书目记录,为系统用户提供35家成员馆的信息资源存取。
(3)选择性目录。从Emerald、Ebsco和Inspec等国外数据库检索的情况来看,欧美数字目录学现在研究的一个重点就是选择性目录(Selective bibliography)。Michael Fosmire在《超导体:选择性书目》一文中,把超导体书目按超导体概述、超导体历史、超导体技术、超导体政策、超导体理论、超导体期刊索引六大领域若干主题进行了细分,每条书目都附有提要[6]。Elizabeth Birnbaum在《护理:参考资源选择性书目》中,分别从书目、书目性资源、词典、指南、百科全书、名录、手册、统计资源、印刷或电子版索引对护理领域的书目进行了归纳[7]。
(4)开放存取数字目录。欧美数字目录学研究的另一个值得关注的研究动向是对开放存取数字目录(Open access webliography)的研究。布达佩斯开放存取运动提出了获得开放性访问的两个战略:一是学者在个人主页上在正式出版前发表或正式出版后发表,二是在开放存取期刊上发表。开放存取数字目录则进一步提供了一个更为广阔的免费的有价值的网络资源,这些资源包括开放存取期刊、指南、电子期刊、常见问题集(FAQs)、邮件名单和博客,是对同一主题书目的补充。通过元数据获取开放资源协议(OAIPMH)的使用,电子版论文的元数据能被检索到。创造性共同分配认证(Creative Commons Attribution License)实现了最低限度的使用限制,目前几个主要的开放存取期刊出版者使用这种认证作为访问权,学者也用这种认证来实现电子出版(e-print),不过这种认证还没有代表性[8]。
(5)数字目录和传统书目的结合。欧美数字目录和传统书目参考的有机结合从而使其参考检索的范围更详细和全面。宾西法尼亚州Dickinson学院图书馆的人文学科馆员Kirk Moll在《书目指南——非洲裔美国人文献参考著作》中从词典和百科全书、参考文献、网络免费资源、编目记录、主题索引、专业期刊、在线文献订购、学术年度总论、报纸、文选、主要数字站点、主要专业化数字项目、其它站点、图书馆在线目录等各方面全方位地对非洲裔美国人文献的来源进行了归纳,最后又对这些资料来源按小说、诗歌、散文、自传、戏剧和报告等体裁建立了索引[9]。数字目录学以解决数字资源的增长与人们特定需要的矛盾为己任,作为目录学的一个分支学科已初步建立起来,并受到目录学界的广泛关注,国内外已开始了各种有益的探索。然后,由于传统目录学以纸质文献为主要处理对象,而数字目录学主要面向的是数字化环境中的数字资源,这不仅仅是一种环境的变化和对象的变化,而是传统目录学的整体思维到了数字化环境中已发生了改变,因此必须结合数字化环境和数字资源的实际,既要合理利用并改造已有的目录学方法,又要有新的视角和新的开拓。
2面向数字书目控制的数字目录学
书目工作是目录学的实践基础,书目控制是目录学的一个研究重点。随着数字资源的增加,目录工作的范围大大扩展,数据库建设、数据挖掘、知识过滤、搜索引擎的研制和开发、网络资源目录的联合编制等都成为了当代目录工作实践活动的组成部分和发展方向[10]。在数字环境下,不仅整个书目工作要向数字化方向发展,而且书目控制的研究从原来以实体文献对象为中心的控制转移到现在以数字资源对象为中心的控制,主要有以下方面。
2.1以数字资源编目为基础
随着计算机技术、通信技术和网络技术的发展,一方面,传统的编目环境发生了变化,用户对文献信息的查准率和查全率的期望和需求越来越高,希望图书馆提供高效的服务。传统的手工编目已发展为网络编目和新的集中编目,书目信息的共享和编目技术的发展极大地提高了编目工作效率,为书目信息检索提供了基本保障。另一方面,数字信息呈指数增长,新的数字资源类型不断增加,而传统的编目条例和规则又不能适应这些变化,数字资源编目成为迫切需要解决的重要问题。
对元数据和FRBR的研究成为数字目录学的研究重点之一。随着数字图书馆建设的发展,国内外图书馆界兴起了研究元数据的热潮,元数据正成为网络环境下实现资源共享的重要标准格式之一,是对MARC的重大革命,因此,积极开展对中文元数据及其应用体系的研究,是网络环境下目录学发展的需要,更是建设数字图书馆实现资源共享的需要,具有重要的现实意义[11]。广东省立中山图书馆受文化部科技司委托,结合我国实际,制定了《数字式中文全文文献通用格式》标准,该标准采用都柏林核心元数据集1.1版本为基本框架,简化了中文文献的著录和标引,对元数据在数字资源中的应用进行了有益的探索[12]。
1998年IFLA的《书目记录的功能需求》(Functional Requirements for Bibliographic Records,简称FRBR)报告从探讨编目的对象——实体的属性和关系着手,揭示书目记录的功能需求,为探讨书目记录的结构和关系,提供了新的视点和新思维[13]。FRBR最终报告分为七大部分和一个附录。第一部分阐述了编制FRBR的时代背景;第二部分阐述了研究的对象、内容、方法和范围;第三部分初步阐述了三组实体及实体中各对象的关系:作品或创作(work)、表现方式(expression)、表达方式(manifestation)、元组(item),对知识或艺术内容、物理产品责任和传播或监管产品的实体包括个人名称及团体名称两项内容,反映知识或艺术主题的一套实体包括概念、对象、事件和地点;第四部分详细说明了三组十大对象的属性;第五部分详细阐述了各对象之间的复杂关系;第六部分规定并分析了用户的四大任务:发现、识别、选择和获取款目;第七部分以详细的字段的形式按描述元素和组织元素规定了国家书目的基本要求;附录对各对象的属性和MARC字段进行了对比[14]。
自FRBR出台以来,IFLA一直在积极倡导它的实施,已在欧美和澳大利亚的一些图书馆集中应用。最早体现FRBR理念的是澳大利亚国家图书馆的AustLit(Australian Literature Gateway)项目,该项目依据FRBR的概念模型建立了揭示其文学作品的门户;在编目软件方面,丹麦开发了基于FRBR的编目客户端VisualCat(用XML/RDF);在OPAC方面,VTLS公司开发了基于FRBR的OPAC Virtua;在Web联合目录方面,RLG的RedLightGreen项目体现了FRBR的思想;对FRBR研究较深入的是OCLC,OCLC从2001年就开始致力于FRBR及其应用研究,开发了一个基于FRBR的原型系统——FictionFinder,对WorldCat中的250万条小说进行浏览和检索,另外还公布了一个将书目记录转换成FRBR模式的算法“FRBR Work-Set Algorithm”,该算法可免费获取(地址为http://www.oclc.org/research/software/frbr/default.htm),OCLC把这种数据转换称为FRBR化(FRBRization)[15]。
FRBR实质上是MARC的进一步发展,在某些方面弥补了MARC所存在的缺点,代表了未来文本资源和数字资源编目工作的发展方向。与MARC相比,FRBR对信息资源具有更广泛和精确的集成度,更能全面反映信息资源实体各元素之间的关系。
2.2以数字书目情报服务为新方向
书目情报和书目控制是我国20世纪后20年目录学研究的两大热点。前者包括书目情报理论、书目情报系统和书目情报服务三大领域,后者包括描述控制和探索控制两个部分。两者密切相关,在数字环境下出现了融合的趋势。洪光宗在《电子目录服务研究》(《图书馆理论与实践》2002年第5期)中认为,目录学在20世纪历经两次飞跃,随着Internet的发展,目录学在应用方面有了新的发展,即网络目录服务。X500电子目录是目录学知识在网络上的应用,由信息模型、目录模型和安全模型三个模型组成。从网络的角度论述书目情报服务的新形式与方法,成果较多,如邓小昭《网络环境下的书目情报服务》(《情报资料工作》1999年第2期)、韦景竹《网络环境下书目情报用户需求研究》(《上海高校图书情报工作研究》2003年第3期)等。
2.3开发数字书目控制技术
(1)网络化分类控制。在国外,DDC和LCC分别在1993年和1996年推出其电子版Electronic Dewey和Classification Plus,之后经过改进,于2000年和2001年先后升级为网络版的WebDewey和Classification Web。UDC则于2001年直接推出其网络版UDC Online[16]。在我国,《中图法》2000电子版是我国第一部综合性电子分类法,分为单机版和网络版两种,备有编目接口。《中国图书资料法》第四版的电子版于2000年由万方数据电子出版社制作。《台湾中图法》至今已经修订八版,其电子版是中英文检索系统,该系统自1991年开发以来,随着计算机作业平台的演进,历经DOS/倚天中文、Windows95,直至目前最新的单机版Web界面[17]。
(2)智能化检索控制。一般的检索控制是通过增加检索途径、检索策略、跨库检索等实现计算机辅助检索。以《全国总书目2005》光盘检索系统为例,该检索系统2005年的书目数据122942条,最大特点是检索途径丰富,下拉菜单共有包括ISBN、装帧、定价、正文语种、另一作者的正书名、副书名和说明书、第一著作责任者、其它著作责任者、分册(辑)号、分册(辑)名、版次及其他版本形式、出版地、出版社、出版日期、页数及卷册数、开本或尺寸、附件、附注内容、提要内容、正丛书名、丛书著作责任者、丛书编号、附属丛书编号、附属丛书名、主题词、分类号、并列书名、版本责任者、图表、书名原文、书名和全文检索共32项检索功能[18]。相比之下,搜索引擎特别是学术搜索引擎体现了更强大的检索功能并与海量信息检索的复杂程度相对应。Google Scholar是世界上第一个成功用于学术信息检索的搜索引擎,它在多语种技术的支持下,可以过滤出从学术出版机构、专业领域、预印本文库、大学和其他的学术性组织获得的经过同行评议的论文、图书、摘要和文章等。此外,还有Google Book Search(搜索图书全文,提供选购和借阅帮助)、Google Patent Search(2006年12月31日发布,可搜索超过700万的美国专利)等[19]。然而,目前的检索工具都未能真正实现智能化。
(3)自动化文摘控制。国内外试验的自动文摘系统功能是从一篇文本中按任意比例或按指定的最大文摘字数自动生成原文的摘要,因此可以让读者很容易得到一篇文章的中心意思,节省读者的浏览时间。自动文摘系统运用了多项技术,包括中文分词系统,词性标注系统,命名实体识别系统,语义段划分系统。运用这些技术可以使文摘句的选取更科学,文摘的流利度更好。新加坡南洋理工大学欧石燕在2006年完成的博士学位论文《采用一个基于变量的框架进行多文档自动文摘》中,提出了一个基于变量的框架用于信息集成和信息组织。该文摘方法不同于传统的句子抽取法,实际是一种混合文摘法,融合了抽取(extraction)和摘要(abstraction)技术。该方法利用决策树自动解析文档的篇章结构并识别文档中包含重要信息的部分,然后从这些部分自动抽取重要的概念和关系,并将来自于不同文档的相近概念和关系进行聚类和集成,最后采用基于变量的框架将提取的各种不同信息加以合并和组织,显示在一个基于WEB的人机互动界面上成为多文档文摘。
2.4实现数字化国家书目控制和国际书目控制
数字化国家书目是书目控制的重点,也是数字化NBC和UBC的主要工具。一些国家书目实现了网络化,见下页列表。
自从Google提出建立数字图书馆计划,声称要成为世界图书的卡片目录后,这不仅仅是对21世纪图书业的巨大挑战,引起全球图书馆和出版商的强烈反响;而且也将对世界书目控制产生重大影响。2l世纪,图书馆在世界书目控制中的主角地位和无可比拟的资源优势将会被打破,导致书目控制的组织管理模式的变革,图书馆、出版商与搜索引擎的合作将是解决全球海量书目信息控制的重要模式。
2.5发展数字化书目信息产业
国外可供书目有100多年的历史,依据国外可供书目发展,可供书目数据平台步入成熟期后,可依靠对上游信息提供和发布收取的发布费和对下游数据使用收取的使用费的方式赢利,不过我国对于这一模式的具体实施步骤,正在实践中不断探索。2001年,韩国的出版发行业在政府和出版商协会强制推行下,实行国际通用的ONIX标准,信息直接与国际接口,三年时间内整理可供书目数据库400万余条,从而大大提高货源协调、信息交换的效率,市场满足率也大大提高,在此条件下实行对出版上下游信息发布的收费制度也成为了可能。韩国出版业由ONIX标准的推行而实现可供书目的成功运作,对于我国也很有借鉴意义。
部分国家数字化国家书目工具表
国家国家书目名称 网址
说明
英国 British National BibliographyA有联机版、每月CD-ROM
和每周印刷版
加拿大
Canadiana B有联机版、CD-ROM、FTP
检索;印刷版于1991年
12月期后停刊,缩微胶片
版于2000年12月期后停
刊
日本 日本全国書誌 C每周更新一次,公布最新
4期
美国
Library of Congress Catalog D
有联机版、CD-ROM
法国 Bibliographie de la France-Biblio E
有联机版、CD-ROM
德国
Bibliotheksportal Deutschland
F
有联机版、CD-ROM
俄罗斯 Eдииый элeктp
оиный каталаог G
有联机版、CD-ROM
韩国 大韩民国出版物总目录、纳本月报
H
有联机版、CD-ROM
注A:http://www.bl.uk/services/bibliographic/natbib.html;
B:http://www.collectionscanada.ca/canadiana;
C:http://www.ndl.go.jp/jp/publication/jnbwl/jnb_top.html;
D:http://catalog.loc.gov;
E:http://www.bnf.fr/pages/zNavigat/frame/version_anglaise.htm? ancre;
F:http://www.goethe.de/wis/bib/prj/bib;
G:http://www.rsl.ru/index.php?f=339;
H:http://www.nl.go.kr/nlen/search/broad_search/search/search brief.php。
从1997年北京科文信息技术公司推出第一本《中国可供书目》光盘版,因为种种现实原因,我国的可供书目建设未能有突破性进展,但各方也从未放弃尝试和探索。探索赢利模式很大程度上成为中国的可供书目建设发展的导航仪。阚元汉撰文《建设中国特色可供书目体系初探》提出,要依靠政府、企业、第三方各自的资源和优势,综合各种需求,采取强强联合,依托政府倡导、政企合作、市场化运作的方式是中国可供书目数据库的有效途径,赢利模式是中国可供书目数据库建设的难点也是拐点。
3面向数字资源控制的数字目录学
数字目录学不仅仅要控制书目情报,更重要的是数字资源。因此,数字资源成为数字目录学的重要对象,数字资源控制成为数字目录学的另一重要分支。
3.1从资源类型视角进行数字资源控制
数字资源包括网上数字资源和非网上数字资源(光盘、磁带等)两大类;既可以是电子图书、期刊等数字化文献,也可以是一个网页、一个网站,还包括数据库、一个信息系统,甚至是数字图书馆、数字档案馆、数字博物馆等等;既有大量的文本,也有大量的多媒体非结构化数据(图像、音频、视频文件等)。对这些各式各样的资源进行揭示与组织、报道与传播,是数字资源控制的任务。
3.2从业务领域视角进行数字资源控制
从专门业务角度看,数字资源控制包括学科导航、数字资源整合、数字化学习指导、数字参考咨询等方面。
(1)网上学科导航。网上学科导航是当前目录学重点关注的领域。韩松涛认为把网上学科导航纳入到目录学的体系,不仅仅是利用目录学的理论来指导网上学科导航的建设,而且是为目录学的发展找到一个发展方向。把目录学的理论引入网上学科导航最主要的目的是给网上学科导航一个定位。当然由于网上学科导航是一个新兴事物,虽然它有目录学的特性,但不能完全套用原来的目录学理论来进行网上学科导航的实践,网上学科导航需要在目录学理论的框架下发展自己的理论体系。这样的理论研究应该包括导航对象、导航方法、资源组织的分类法的编制、成果的标准以及评估方法等[20]。
(2)数字资源组织。司莉、彭斐章、贺剑峰的《网络信息资源组织与目录学的创新和发展》(《图书情报工作》2001年第9期)从网络信息资源类型特点入手,阐述网络信息资源组织的超文本、搜索引擎、指引库、元数据和图书馆编目几种方式与目录学应用问题。司莉2003年的博士论文《网络信息资源组织与揭示及其优化研究》深入分析了网络信息资源组织与揭示的现状和问题,提出了一系列的措施与方法。过去的索引理论无法解释和包容网络信息环境下出现的“网站索引”、“教案资源索引”、“课件索引”、“数据库索引”、“文件索引”、“地图索引”、“新闻索引”等与索引相关的新概念对象,索引理论需要创新[21]。开发性书目控制方法和评论性书目控制方法在现代网络信息组织中可得到应用[22]。
(3)数字化学习指导。数字资源控制要解决数字资源急剧增长与学习时间相对减少的矛盾,最好的办法是提供读者自学的数字化平台。国外已有较多的数字化学习平台,如爱尔兰WBT Systems公司开发的Top Class,美国Bristol大学的Blackboard,Lotus机构的Learning space,英国Hudders field大学开发的CoMntor Learningcapes,Staffordshire大学的COSE系统,Columbia大学的Web CT等。Top Class是一个运行在因特网上的学习管理系统,作为一个虚拟的网络大学,学生能在全球的任何一台联网计算机上通过输入用户名和密码的认证进入该系统。Top Class包括七个模块:证书/文凭及课程选择模块、信息发送模块、讨论板模块、课堂公告模块、图书馆支持模块、考试模块、作业模块[23]。Blackboard在线教学管理平台是目前市场上唯一支持百万级用户的教学平台,占有美国近50%的市场份额。全球有超过2800所大学及其他教育机构正在使用Blackboard产品,其中包括著名的普林斯顿大学、哈佛大学、斯坦福大学、西北大学、杜克大学等[24]。从图书馆服务的角度看,要建立数字资源导读服务。数字资源导读服务,也称为网络资源导读服务或虚拟导读服务,是以信息资源和文献资源为纽带,以互联网环境、传媒环境、社会环境、生活环境、学习环境等为基础,对用户进行教育、指导和辅导。其内容方法有网络导航、数字资源与摘要、电子书目与提要、著录与注释、文摘与索引、书评与指南、图形标识系统、导读报刊资料、用户教育或授课、名人学者导读与咨询服务台、举办群体性的读书活动等[25]。
(4)数字参考咨询。数字参考咨询除了参考咨询人员回答用户的提问外,还允许用户使用问题答案库自行查找需要解决的问题,为此需建立数字参考咨询数据库,该数据库包括网络版和电子版工具书、附有答案的问题库和疑难问题库等。目前社会科学网络版工具书有汉语大词典2.0版、大英百科全书和加拿大百科全书等。自然科学最负盛名的工具书是德国SpringerLink公司于1883年开始出版的Landolt-Brnstein工具书,该书有网络版[26]。
3.3从控制层次视角进行数字资源控制
(1)粗资源的控制。所谓粗资源就是大量收集到的但未经提炼加工的信息资源,这种信息资源中可能存在着大量无用甚至错误的信息。粗资源中的这类信息必须剔除,因为这些资源不但占用大量的实体空间,而且容易对信息用户产生误导。
(2)精资源的控制。数字资源的过滤是数字目录学的重要任务。一方面是运用信息技术,通过对粗资源进行过滤,提炼出有价值的数字资源产品。另一方面是对精资源进行分类标引加工整理,提高其服务效率。
(3)集成资源的控制。通过资源的系统化整合,形成系统或资源包。从分类或主题角度对所有信息资源建立关联,对同一主题的各种形态的资源互相映射,集成资源的各项元素建立各种关系形成一个有机的统一整体,按关系型数据库原理建立集成资源库,这样即使集成资源容量巨大、资源之间关系复杂,信息资源也能得到很好的控制,产生较为精确的信息检索和集成功能,形成较强的服务能力。
(4)平台资源的控制。平台战略是当前在产品开发中,最流行、最科学、最节省人力、效率最高的一个开发战略。平台资源控制中的资源就是一种产品。CNKI知识网络服务平台的信息资源分为“源数据库”和专业“知识仓库”两大类型。“源数据库”是指期刊、报纸、博硕士论文、会议论文、专利、海外数据库等按文献信息来源分类的数据库,“知识仓库”是指在“源数据库”基础上,按照专业用户群的标准知识结构,从“源数据库”中挑选出来重新整合形成的数据库。“源数据库”因其文献著录格式标准不同具有不同的数据结构,从而“知识仓库”就必然是一个异构数据库。“CNKI知识网络服务平台3.0”简称KNS3.0就是为了便于最终用户检索,便于镜像站点更新、管理数据库而研制成功的可以检索、更新、管理各类异构数据库的统一平台[27]。
3.4从知识资源视角进行数字资源控制
数字资源控制既不能停留在对数据的收集、集合与存储上,也不能停留在对信息的检索、获取与有效利用上,必须上升到知识的角度,通过知识的工作,使数字资源从量变到质变,形成知识资源。
(1)智能化知识资源组织。知识资源组织智能化是数字资源知识化的重要方面,在理论和技术上需要深入研究。张洪元探讨了知识组织智能化的含义,论述了知识组织与目录学的关系,重点讨论了知识组织智能化条件下的目录学发展之道[28]。王友富等论述了知识组织智能化的必然性和可能性,并介绍了两种知识组织智能化方式:超文本方式(hypertext)和专家系统(expert system)[29]。
(2)知识资源加工。柯平曾提出知识加工的三个方面,第一个方面是发挥归纳和演绎功能,将网络信息转化为知识,包括从显性知识到显性知识,从隐性知识到显性知识等知识的相互转化。第二个方面是对网络知识进行系统化的组织,如知识排序、知识分类和知识表示等。已有的各种针对网络资源的分类表、叙词表是知识系统的组织工具,新的组织方法有本体论、语义网和主题地图等。第三个方面是深入到知识层面的知识揭示,将提要、类序、综述、述评等方法与网络和数字技术、智能技术结合起来,发展元知识系统[30]。从数字目录学的角度看,知识加工实质是知识资源加工,这三方面分别是创新型知识资源加工、系统化知识资源加工和元知识资源加工。
4数字目录学研究的展望
对于21世纪数字目录学的发展,我们认为重点应从以下几个方面来实现突破,这将更符合目录学发展的实际情况。
(1)数字书目控制与数字资源控制的有机整合。数字书目控制与数字资源控制是数字目录学的两个方面,它们之间本身就有着必然的联系。FRBR就深刻地反映了这种有机整合,其第一组实体中的work是一个抽象的实体,是一个清楚的知识的或艺术的创造,而同组中的expression、manifestation和item却是具体的,并且都有各自详细的属性,实体和实体之间、属性和实体之间通过各种关系互相关联着,正是通过抽象的实体,work才能将具体的另外三个实体有机地组合在一起,从而将某一主题的各种形态的数字资源在一定时间和地理范围内全面揭示出来,达到数字书目和数字资源整合的目的。
在文献信息的物质空间和数字空间并存的新形势下,出现了多种控制并存的局面。一是前控制与后控制并存。传统目录学对文献信息的控制,是后有文献信息,然后有书目情报,是为后控制。而在数字环境下,在文献信息产生的同时或在文献信息产生之前就有了书目情报,例如网上学术会议先有摘要然后发表全文,网络导航先有关键词后有具体内容,从而有了先控制。二是内容控制与形式控制并存,传统目录学主要是从形式上对文献信息进行控制,虽然也涉及到内容,但并不是内容本身的控制,而是内容线索和揭示的控制。而数字目录学不仅仅要解决文献信息的各种形式问题,如网站、网页、数据库、PPT、图片等,而且还要关注内容本身,进行内容管理。三是一次文献控制与二次文献控制并存。传统目录学主要解决的是二次文献控制问题,无法进行一次文献的控制。在数字空间,这一问题易于解决,数字目录学既要研究数字目录、搜索引擎、数字资源指南等二次文献,更要研究网络上大量出现的海量文献信息。
数字化环境的强化和数字空间的发展使得书目控制和资源控制的严格界限开始模糊,并最终会出现一体化的趋势。由于技术的作用,在许多情况下数字空间不再有一次和二次、内容与形式的区分,数字对象的全文检索、数字资源的超链接既是检索的控制又是资源的控制。这就需要更强大的平台和工具来解决海量的数字资源增长与需求及利用多样化、个性化的问题。
(2)将知识管理理论与方法运用于数字目录学。将知识管理应用于数字目录学有丰富的内容,网络学科导航、数字化学习是其应用领域,联机编目更是知识管理的理论和方法应用的一个典范。按照知识共享的原理,联机编目存在着编目技术、编目知识和文献信息的共享。编目中心拥有大量的书目数据,提供不同的产品和联机实时服务。成员馆不但可以从编目中心数据库实时套录和复制记录,而且可以访问外部数据源库,完成数据下载。少量需要原始编目的记录,在联机编目过程中会得到联机的标准、规则等方面的技术咨询和规范控制,以建立高质量、时效性强的联合目录。将知识管理与书目情报结合起来研究也有重要意义。
(3)运用知识技术进行数字资源系统研究。陆汝今院士在《知识科学及其研究前沿》一文中列出了知识科学前沿的八大领域:知识模型研究;常识性知识研究;非规范知识研究;知识的数学理论;知识获取的理论与技术;基于知识的软件工程;知识用于计算机艺术;大规模知识网络的理论和技术[31]。知识技术是知识科学的一部分,包括智能程序设计语言、知识表示、搜索策略、自然语言理解、自动推理、机器学习和知识获取等技术,知识技术通过知识库系统、专家系统、决策支持系统等智能系统对数字资源进行控制。
(4)数字环境下专科目录学的研究。专科目录学研究需要发展,建立数字专科目录学。一是加强某一学科电子目录、专题数据库和学科门户网站的研究,对各专业信息资源进行数字导航。二是根据经济建设和社会发展的需要,加强经济(金融、财政、外贸、企业、税收等)、文化、科技等专科目录学的研究,使数字专科目录学直接为应用研究和现实服务。
(5)内容产业和搜索引擎产业的国际化研究。随着我国的国际地位日益提高,汉语言文化和中文信息正受到世界各国越来越多的重视,这就给我国的内容产业和搜索引擎产业的国际化提供了很好的机遇。为了做好这项工作,首先我们必须研究国外内容产业和搜索引擎产业在生产、技术和营销方面的优势,找出我国在这方面的不足之处;其次,国家相关部门要制定相关政策和标准,指导和促进这项产业的发展。
(6)人类虚拟知识长久保存和数字文化记忆问题的研究。通录古今、记存记亡、记书记图是目录学的优良传统。与传统目录学面对的有形的、固定的知识资源不同,数字目录学面对的数字资源呈现出不稳定和变异的特征。在数字空间,网站和网页即生即逝,搜索引擎所检出的地址迅速变化,大量超链接变成死链接,网上的大量文献信息被改写或覆盖,数字资源消失的现象十分严重。如果不对所有数字信息及时记录,其中珍藏的有益信息和知识可能永久消失,人类在虚拟空间创造的知识财富和数字文化必然残缺不全。因此,数字目录学应当承担起这一使命,无论何种语言、无论何种形态、无论何种来源、无论按何种标准确定的有益和有害以及是否冗余,都应作出客观的记录与控制,最终实现虚拟世界的一切信息资源特别是知识资源的有效控制,为全球虚拟知识的长久保存和子孙后代数字文化的记忆作出应有的贡献。我们认为,数字目录学只要吸收传统目录学的优点,科学运用现代信息与知识技术,抓住数字资源—控制—用户服务这根主线,在知识社会中就一定能发挥重要作用。