当前文献主题标引存在的问题与解决方法,本文主要内容关键词为:解决方法论文,文献论文,主题论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G254.2[文献标识码]C[文章编号]1003-2797(2002)05-0070-03
随着计算机及网络技术的广泛应用,开展联机编目,更好地实现文献信息资源共享已成为现代图书馆的发展之路,这对机读书目数据的质量提出了更高的要求。主题作为机读书目数据的重要检索途径,其标引是否正确、规范,对书目数据库的质量具有重要的影响。目前,国内许多图书馆在文献主题标引工作中,还存在种种问题。本文结合工作实践,对主题标引工作中存在的一些问题进行分析,并提出一些解决方法。
1 衡量文献主题标引质量的标准
图书情报机构主要依赖检索系统开展文献情报服务,检索系统的质量取决于文献标引的质量。目前,衡量文献主题标引质量的主要标准是:标引的准确性、标引深度的适度性和标引的一致性。标引的准确性是指对文献主题内容分析、提炼和转换为检索标识的准确程度,它是衡量标引质量的首要标准;标引深度的适度性主要是指标引的网罗度要适中,同时也包括标引的专指度要适当;标引的一致性是指标引人员对同一篇文献或相同主题的文献赋予检索标识的一致程度。正确、适度、一致是衡量主题标引质量的三个主要标准。
2 当前文献主题标引普遍存在的问题
目前,我国大部分高校图书馆和公共图书馆已建立计算机检索系统,笔者曾在网上对部分图书馆的主题标引数据作过调查,发现主要存在以下几个方面的问题:
2.1 标引深度不足,停留在浅标引水平
相对于手工检索系统,机检系统的主题标引应适当加深标引深度,这既是充分发挥叙词语言优异性能的需要,又是充分利用计算机检索系统的存储、处理和检索能力,全面提高检索效率的需要。但大部分图书馆,不管文献内容复杂与否,都只对文献作整体标引,且只概括揭示文献的基本主题内容,对于文献的从属主题、局部主题及隐含主题一般不予揭示,通常只用2~5个主题词组配标引。具体表现如下:
(1)漏标文献的局部主题。例如,TP3类有关计算机基本知识的文献,几乎所有的图书馆都标引成:电子计算机—基本知识。如《电脑万用入门培训班》一书,内容包括Windows 98的基本操作、五笔字型中文输入法、WPS 2000与Word 2000的操作技术、上网操作技术及电脑维护等内容,所有被访问的图书馆都标引成:电子计算机—基本知识,这样的标引网罗度太低,忽略了文献中包含的重要主题,几乎没有什么检索价值。因为关于计算机的书成千上万,读者很难从“电子计算机”这一主题找到自己想要的文献,而且上述的标引漏标了有较大检索价值的局部主题,如Windows 98、WPS 2000、Word 2000等,这样既不能充分揭示文献的内容,也不能向读者提供更多的检索点,其结果必然会造成漏检。
(2)漏标文献的隐含主题。隐含主题是指在文献中没有直接加以描述,而是隐含在不同字面形式中的主题。由于隐含主题具有隐含性、相对性及模糊性等特征,往往难以分析与确定,需要通过深入了解文献的主题内容才能挖掘出来。而大部分被调查的图书馆几乎都忽略了含有重要信息的隐含主题的标引,如《经济学家之路》第一辑,介绍了经济学家的成长道路及他们在学术上的贡献,许多图书馆对该书只标引其显性主题:经济学家—生平事迹—中国—现代,对其隐含主题:经济学家—经济思想,没有作进一步揭示;又如《干扰素的临床作用》一书,只标引其显性主题:干扰素—临床应用,而漏标其重要的隐含主题:干扰素—副作用。
(3)对于综合性文集,没有作分析标引。对于综合性的文集,如全集,论文集等,大部分被调查的图书馆只作整体标引,而对于文献中有较大检索和参考价值的内容,没有进行分析标引。如:《中国社会科学院研究生院博士文萃(1996~1997)》,内容包括哲学、宗教、经济学、法学、文学等领域的论文,大部分被访问的图书馆都标引成:社会科学—学位论文—中国,而没有进一步将文中的重点内容如哲学、经济学、文学等析出作分析标引。
(4)没有作关键词辅助标引。关键词一般是指不受词表控制,用于主题标引和检索的自然语词,著录在CNMARC 610非控主题字段。关键词标引可与叙词标引相配合,弥补叙词标引有限的专指度和网罗度,向读者提供更多的检索点。但大部分被访问的图书馆都没有作关键词标引。具体表现如下:①对于词表没能及时收录的、具有较高检索价值的新术语、新概念,如克隆技术、网址、域名系统、Windows、Dreamweaver等,没有作关键词标引。②对于一些专指概念而主题词组配又不易于表达或容易产生歧义的词,没有作关键词标引,如《生物无机化学原理》一书,只在606字段作交叉组配标引:生物化学:无机化学,而没有在610字段作关键词标引“生物无机化学”。③对于某些使用频率高但不是正式主题词的通俗术语,没有作关键词标引,如空调,正式主题词为空气调节器。
2.2 选词不够专指
在对文献进行主题标引时,首先要选用与主题概念的内涵、外延相符的专指词;若没有,再考虑组配标引、上位词或靠词标引,这是文献标引专指性规则的基本要求。而有的图书馆的编目人员在选词标引时,违反了专指性规则。如《二○○○年大趋势》一书,有个别馆标引成:①社会—分析—美国;②社会—分析—世界;词表里已有专指的主题词“社会分析”,用社会—分析进行组配标引违反了专指性原则。又如《当代生命伦理的困惑》,有的馆标引成:生命科学—伦理学,“伦理学”是上位词,用“伦理学”就不如用“医学伦理学”更专指。
2.3 主题标引的不一致
标引的一致性主要是要求对同一文献或相同主题的文献赋予相同的检索标识。一致的主题标引可以使相同主题概念的文献集中在相同的检索标识之下,从而提高检索效率,保证读者在检索时能查全与查准。目前,许多图书馆普遍存在标引不一致的问题,特别是计算机类文献的主题标引显得较混乱。如《Internet上网快易通》一书,有的图书馆标引成:互连网络—基本知识;有的图书馆则标引成:因特网—基本知识。又如《Windows 98中文版从入门到精通》,有的图书馆标引成:操作系统—Windows 98;有的图书馆则标引成:窗口软件—基本知识。从以上两例不难看出,两本相同的书,不同的图书馆主题标引不同,从而导致标引的不一致,这必然会影响读者的检索效率及文献的利用率。
3 产生上述问题的原因
3.1 导致标引深度不足的原因
文献的主题分析,就是通过对文献内容的了解和分析,明确文献中究竟包含有哪些有参考价值的内容需要概括为主题的过程。主题分析是文献标引的关键环节,其质量决定着文献标引的质量。导致标引深度不足的主要原因,是对文献主题内容分析的不全面,也就是说遗漏了文献中论述了并符合检索系统要求的主题概念,如有参考价值和检索价值的局部主题、隐含主题、次要主题等,从而造成漏标。
3.2 导致选词不专指的原因
(1)编目人员对主题词表不熟悉。在对文献主题进行充分分析后,要针对主题概念在主题词表中查找相应的叙词,并将其主题概念准确、适度地表达出来。在叙词表中查找叙词的过程是一个探索过程,通常,由于编目人员对主题词表的不熟悉或查找的方法不当,都会造成选词的不专指。如前述的“社会分析”一词,当在词表中查到“社会”一词后,没有继续仔细、耐心地往下查,结果就查不到预想的专指词。
(2)编目人员对组配规则不熟悉。组配标引是主题词法准确揭示文献主题的主要标引方法,组配标引时应遵循一定的规则,如要使用专指的主题词组配、避免简单的字面组配、不能越级组配等。如果编目人员不熟悉上述规则,标引时就会造成误差,如上例中把“生命伦理学”标引成生命科学—伦理学,就是由于编目人员对组配标引规则不熟悉造成的,它犯了越级组配的错误。
3.3 导致主题标引不一致的原因
(1)主观原因——编目人员的素质问题。造成主题标引不一致的主观原因是编目人员的素质问题。主题标引主要依赖个人的知识水平,如对文献的分析、理解的深度,对主题词表的熟悉程度和标引技术的掌握程度等。编目人员的素质各异,反映在对文献主题分析与选取主题词上会产生很大的差异。如《Windows 2000 Professional实用教程》一书,本来是属于网络操作系统方面的,而有的编目人员却将其理解成是关于网络服务器的知识,导致选词标引的误差。由此可见,编目人员的素质高低是影响主题标引一致性的重要因素。
(2)客观原因。主要有两方面:①缺乏一部详尽的主题标引细则。作为文献标引的主要工具《汉语主题词表》问世十多年来,除了在1983年以国家标准颁布发行了一份《文献叙词标引规则》之外,至今尚没有制定出一部较为详尽的、全国通行的、统一的主题标引细则,对于这样一部规模庞大、结构复杂的主题词表,在使用中仅靠工作人员的自身素质与熟练程度进行标引是不科学的,这无疑是导致主题标引不一致的另一个重要原因。②各馆没有进行规范控制。当前,国内绝大多数图书馆对文献的主题标引没有实行规范控制。如对于《中国分类主题词表》中收录的部分同义及近义主题词,像“应用软件”、“应用程序”等,在实际工作中如何取舍,需要统一规范。又如词间的“用”、“代”关系的选择,反复到馆的同一类图书,如计算机操作系统、计算机应用软件、开发软件类图书的标引,都没有统一的规定,使主题标引具有随意性、人为性,从而导致主题标引的不一致。
4 提高文献主题标引质量的对策
如何将文献主题标引质量控制在较高水平,尽可能达到正确、适度、一致的要求,是值得我们认真研究的问题。笔者从长期的编目实践中体会到,要提高主题标引质量,必须控制两大因素:一是标引人员的素质,二是标引工作的组织管理。
4.1 提高文献标引人员的素质
文献主题标引工作是一种专业性和技术性较强的智力劳动,标引人员的素质对标引质量有直接影响,因此,要提高文献主题标引质量,必须提高标引人员的素质。首先,每个标引人员都必须掌握标引的基本知识,充分了解主题词表的体系结构,熟练运用相应的标引方法和规则。其次,标引人员要具备广博的学科知识和较专的相关学科知识,如具备一定的计算机知识和语文水平,同时对与编目工作有关的各个知识领域的研究对象、学科分支及新学科、新技术等,也要适当了解。标引人员只有具备上述知识,才能在具体的标引工作中正确把握文献的主题,选择恰当的主题词,把文献的主题恰到好处地表达出来。
4.2 加强主题标引工作的组织管理
主题标引是一项环节多、技术性较强的工作,要提高主题标引质量,除了要提高标引人员的素质外,还必须对主题标引的全过程进行科学的组织和有效的质量管理。具体做法如下:
(1)制定明确的标引细则。各馆应结合本单位的专业特点、设备特点、检索用户的要求及文献的特点等因素,制定详细、明确的标引工作细则,作为标引质量控制的依据。其内容应包括:①不同学科专业文献的标引深度。②组配的级别,同义词、近义词的取舍。③自由词标引的使用。④对于反复到馆且标引方法多种多样的某种文献,如计算机类文献等,应规定采用统一的标引方法。
(2)做好定额管理。当前,很多图书馆对编目工作实行定额管理,这对提高工作效率有一定的作用,但往往在完成定额的时候,却忽略了质量的控制。因此,必须摒弃这种片面追求标引数量的做法,合理地规定编目人员的标引定额标准,使标准既不过高,也不过低或过死,将数量与质量控制较好地结合起来。
(3)建立质量检查制度。高质量的校对也是控制主题标引质量的重要环节,为了保证与提高标引质量,严把校对关,建立质量检查制度,开展群众性的质量检查工作是十分必要的。质量检查就是通过自检、互检、专检等形式,对标引结果进行审查与校核,看其是否符合质量要求。通过审查与校核,发现标引中的差错并及时纠正,切实保证文献主题的标引质量。