书目分类检索中需要解决的几个问题_主题词论文

书目分类检索中需要解决的几个问题_主题词论文

书目分类检索中应解决的若干问题,本文主要内容关键词为:若干问题论文,中应论文,书目论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1、书目数据库分类检索存在的若干问题分析

随着网络信息的急速膨胀,信息的筛选、过滤变得越来越困难。传统文献分类法固有的树型结构体系,符合人类认识事物的基本思维方式,在“分类浏览检索”模式中得到广泛应用。使用分类浏览系统,用户不需输入任何检索词就可以按类目逐级查找信息,例如美国的OCLC采用《杜威十进分类法》(DDC)组织其网络信息,而著名的搜索引擎Yahoo采用自建的分类法组织信息等。然而,一直采用分类法进行标引的书目数据库还不具备“分类浏览检索”功能,这不能不引起馆员们的高度重视。

那么图书馆为什么要建立图书分类浏览检索途径呢?

首先,我们知道,书目数据库不同于报刊全文数据库,图书检索是对图书编目著录的各个字段进行检索,只有用户提交的检索词与图书著录内容相同时才可以检出图书。采用“提问式”检索必然存在大量的漏检现象,而分类法是语法信息和语义信息的组合,从学科角度聚集图书,便于族性检索,可以使用户比较系统全面地进行检索。

其次,由于在“提问式”分类号检索中,分类号的理解与选择成为用户检索的最大障碍。《中图法》分类号采用字母数字混合制,分类号代码的含义是隐性的,而且类目体系庞大,要记忆分类号几乎是不可能的。在“提问式”分类检索中,用户很难将自己的需求用合适的图书分类号表述出来,致使分类检索的使用仅局限于极少的专业人员,分类检索功能日趋弱化。

因此,要想发挥分类法在族性检索方面的优势,必须建立书目分类浏览检索途径,用户无须学习分类法,就可以从学科分类和知识分类角度按类逐级浏览图书,鸟瞰全貌。

笔者曾以清华大学的国内上网图书馆导航对400余家图书馆的书目分类检索途径进行调查。结果发现,大多数图书馆联机公共目录(OPAC)的书目检索只有“提问式”分类号检索。具备完善的分类浏览功能的图书馆系统只有三套,分别是:采用Ex Libris公司图书馆管理系统的国家图书馆、北师大图书馆、东北师大图书馆、陕西师大图书馆等:采用重庆图腾信息系统的浙江工业大学图书馆等:采用北京鑫磐鹏图信息系统的贵州财经学院图书馆、四川农大图书馆、成都理工大学图书馆等。其分类浏览的方式和类目级别情况如下:

软件导航形链接书所显示的类目显示及排类目收集类目名称 图书分

名称式目库 类目级别序效果 文献量类统计

EX 专门浏是全部类目类目全显示 比较少 无,分类号含

Libris 览网页 体系庞大级别乱 便于浏览义不理解

重庆左侧导是三级类目类目伸缩显示多,浏览不 有,便于用户

图腾航栏类目简单级别清晰方便理解

鑫磐左侧导是分类简表类目伸缩显示多,浏览不

有,便于用户

鹏图航栏类目简单级别清晰方便理解

从表格可以看出,Ex Libris对图书标引所用的所有类目进行索引,类目体系庞大,排序按类目等级,而且没有类目名称,即使熟悉分类法的专业人员使用起来也很不方便。当用户输入分类号后,系统首先按“前方一致”搜索分类号,然后显示各分类号所集中的“书目数量”,并通过超链接形式根据分类号对总书目库进行查询。

重庆图腾软件和北京鑫磐软件都采用导航栏形式显示所有三级类目,类目体系小,可以逐级展开或关闭类目,同时显示分类号与类目名称,便于用户使用。但由于采用三级类目,每一类目下集中图书往往达到数千种,读者逐页浏览会感到厌烦。此外,没有分类统计数据,检索前用户不能了解各具体类目中所收集的图书数量。

2、书目分类浏览应具的基本功能

分类浏览虽然有了初步发展,从以上分析可知,功能完备的分类浏览系统应包括如下内容:

(1)分类浏览应在《中图法》提供的类目基础上,将分类号和类目名称同时显示,使分类号的含义显性化,用户可以按类目逐级浏览书目信息。

(2)统计各类目以及下级类目所集中的文献数量。使用户系统地了解图书收藏规模和学科分布,在检索前能够对检索结果进行估计。不同的图书馆,由于馆藏规模与特点不同,分类法类目级别的使用也不同。在具体书目库中,并非所有类目都集中了一批相关图书,其中很多类目并没有集中任何图书,属于空类目。因此即使用户查到分类号,用户检索前也很难预料能否检索出结果。

(3)可定制的类目逐级显示方式。能够自动过滤空类目,根据文献量确定类目显示级别。

(4)与书目数据库连接,能够按分类号查询总书目库。

3、分类浏览系统制作实验

为了进一步探讨分类浏览制作中的解决方案,我们以本馆书目数据库为例进行了如下实验,希望能起到抛砖引玉的效果。

3.1 建立分类浏览系统数据库

分类浏览系统采用数据库技术来实现,根据其功能,数据库应包括如下字段:编号、分类号、类目名称、类目级别、本类图书总量、本类图书单量等字段。其中“类目级别”表示《中图法》中的类目级别;“类目图书总量”表示某一类目及其所有下位类所集中的图书数量:“类目图书分量”表示某一类目所集中的图书数量,不包括其下位类所集中的图书数量。

(1)从《中图法》电子版获取类目数据

2001年7月由《中图法》编委会和丹诚公司共同研制开发的我国第一部电子分类法——《中国图书馆分类法》电子版问世,标志着我国文献分类步入电子化时代。如果说《中图法》电子版采用计算机技术建立了友好的用户界面,实现了类目的多维检索和多维显示是其一大贡献,那么其率先研制和使用了《中图法》的机读数据格式CLCMARC,则为《中图法》的开发利用提供了数据基础。因此分类法表的数据可以直接利用《中图法》电子版获得,内容包括分类法全部类目的分类号、类目名称、类目级别三个主要字段。

(2)各类目图书数量统计

分类浏览表用来存储书目数据库中所使用的分类号、类目级别以及各类目的图书统计数量。图书数量来自书目数据库记录的分类统计,以我馆书目数据库为例,首先从图书馆自动化系统后台服务器打开总书目数据库,然后利用自己编制的统计程序,获得本馆使用的所有分类号,再按“前方一致”统计当前类目及其所有下位类所集中的图书数量得到“本类图书总量”,按“完全一致”统计当前类目所集中的图书数量,不包括其下位类所集中的图书数量,得到“本类图书单量”。统计完毕,根据书目数据库实际使用的分类号从分类法表获得对应分类号的类目名称和类目级别。

由于书目数据库是记录不断增长的动态数据库,为保持数据及时更新,可以设定一周内对本周新增记录进行统计,将统计结果加到相应的类目统计结果。如果出现新的分类号,则需要从分类法表获取对应的类目名称和类目级别字段内容。

3.2 可自由定制的类目显示方法

在分类浏览中如何设置下级类目的展开方式是一项关键内容,我们可以采用“不完全”类目显示法,即根据具体数据库中分类号的使用情况决定类目的显示,类目的显示是可自由定制的。其原因有二:

(1)《中图法》是图书分类的标准工具,系统性强,类目完善,在电子版中采用了完全的类目显示方式,可以逐级浏览,到达任一类目。但是分类浏览系统是以《中图法》类目为基础的,是面向具体书目数据库和检索用户的知识导航图,目的是揭示类目总体结构与对应的文献量。完全显示会出现大量的空类目,如果存在过多的空类目,不但会造成类目体系过大,而且会增加用户浏览负担,使用户望而却步。

(2)在书目数据库中,各类目下所集中的书目数量分布很不均衡,尤其是一些专业性强的图书馆。一些类目下集中了大批文献,而另一些类目下却只集中了少量的文献。为方便用户浏览,应根据文献数量设定一个“域值”,文献数量不同的类目采用不同的类目显示级别。

在分类浏览界面中,第一级类目为《中图法》的二十二个基本大类,采用“全部显示方式”;从第二级类目开始,采用“不完全显示”方式。例如,根据我馆设定当一类目的“图书总量”超过100时,显示下位类类目。根据各类目统计结果显示,如果大类聚集文献量低于100条,则不显示其下一级类目,直接链接到总书目库,浏览该类目下的检索结果。如果文献量多于100条,则显示其下级类目:如果下级类目文献量多于100,则再显示其下位类,逐级类推。如果某一类目聚集文献量很多,已经没有下位类,则按主题词或题名关键词进一步细分。这样通过分类浏览图可以非常直观地揭示数据库文献总量及其学科分布。

分类浏览页面中,为了醒目起见,不同的内容采用不同的色彩。例如页面背景采用“白色”;每个类目的显示内容有类号、类目名称、类目图书总量、类目图书分量等,其中“分类号”设计为彩色,采用赤、橙、黄、绿、青、蓝、紫7种颜色分别代表《中图法》中的1-7级类目;当“类目图书总量”超过100时,表示该类目可以显示下位类,“类目名称”显示为蓝色:当文献量不足100时,不能展开下位类,类目名称显示为黑色。“类目图书总量”和“类目图书分量”显示为红色:每一类目后有按钮[浏览]链接到书目数据库,进行分类查询。

3.3 主题词(或关键词)聚类方法的使用

当有些类目下文献记录很多,已经没有下级类目时,采用主题词(或关键词)进行聚类是非常必要的,即当某一主题词或关键词的出现频率高于特定的域值时,我们认为该主题词或关键词具有聚类作用,将主题词及其出现频次列在相应的类目下,使大量同类文献进一步得到细分。

在书目数据库中,如果图书进行了主题词标引,那么选取该类目下主题词,统计主题词出现的频率。当主题词出现频率大于50时,选取为具有聚类作用的关键词,追加到分类浏览表中:当频率低于50时,则继续寻找下一个主题词,直到统计完毕。如果图书没有进行主题词标引,则需要利用专门自动抽词程序自动从书名中提取关键词,并统计出现的频率。

总之,使用分类浏览系统,用户可以方便地按类目浏览检索,一般集中图书数量少的类目只需展开到1-3级类目,集中图书数量多的类目却可以展开到最详细类目,同时显示该类目下主要的主题词。例如,根据我馆图书实际数量与学科分布,类目显示文献量设定为100,在E、J、P、U、V、Z六个大类中图书种数很少,只采用二级类目显示就可以了:而在F、H、O、TP、TQ、TS等几个大类中,收集图书非常多,一些类目需要全部显示,其中30余个类目需要按关键词来进一步细分,如类目F270、F713、H31、TP3等等。为方便有经验的用户直接进入熟悉的类目进行浏览,在分类浏览界面增加“分类号查询”功能。

4、结论

在《中图法》电子版基础上建立的OPAC书目数据库分类浏览系统,是面向具体数据库和检索用户的,是《中图法》走向用户检索服务的关键一步。由于只显示使用类目,大大缩减了《中图法》的类目规模;在最后一级类目下适当增加具有类目属性功能的主题词,大大提高了分类法的分类导航效果。随着分类浏览系统软件的不断开发和逐步完善,为联机公共目录OPAC增加图书分类浏览检索途径是完全可以实现的。

标签:;  ;  ;  ;  ;  

书目分类检索中需要解决的几个问题_主题词论文
下载Doc文档

猜你喜欢