中文社科报刊光盘数据库使用探析,本文主要内容关键词为:探析论文,中文论文,报刊论文,光盘论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
近几年,中国人民大学文科文献中心相继购置了一批社科光盘数据库,其中,几种中文社科报刊数据库深受用户欢迎,使用率较高。但在使用中也存在着一些不容忽视的问题,主要是:这几种数据库在收录范围和时限、检索途径及功能上既有相同之处,又各具特色,许多用户拿着课题首先不知该检索哪种数据库,进库之后又不知该选择何种检索途径;同时,由于使用者对新型检索工具较为生疏,检索技能较差,检索失误时有发生,直接影响着数据库的利用。本文根据检索实践拟对上述问题作一分析与探讨。
1如何选择数据库
1.1 中文社科报刊光盘数据库概况
常用中文社科报刊光盘数据库有以下几种:
(1)《复印报刊资料专题目录索引》。由中国人民大学书报资料中心和北京新北成实业开发公司联合编辑制作。收录了中国人民大学书报资料中心1978~1997年出版的《复印报刊资料》全部复印文献的题录。目前出版了两张盘,一张收录时间为1978-1994;一张为续盘,收录时间为1995-1997.5月。
(2)《复印报刊资料索引总汇》。由中国人民大学书报资料中心和北京新北成实业开发公司联合编辑制作。目前收录1978-1997年《复印报刊资料》全文复印的论文题录和未复印的题录,总计230万条,分为A、B盘。按年更新。
(3)《中文社科报刊篇名数据库》。由上海图书馆文达信息公司《全国报刊索引》编辑部编辑制作。目前收录上海图书馆1993-1998.6月出版的《全国报刊索引(哲学社会科学版)》的全部题录,数据量超过100万条。按季度更新。
(4)《复印报刊资料全文数据光盘》。由中国人民大学书报资料中心和 北京新北成实业开发公司联合编辑制作。该库是《复印报刊资料》的电子版,按年出版。从1995年起每年按学科出5张盘。1997年开始将100多个专题汇集1张盘内按季度出版。
(5)《中国学术期刊(光盘版)》。由清华大学光盘国家工程研究中心学术电子出版物编辑部和北京清华信息系统工程公司联合编辑制作。该库是我国第一个电子全文检索学术期刊,目前已汇集全国2500多种核心期刊和专业特色期刊。自1996年12月起分8个专辑出版,其中人文社科3个专辑。
为满足用户专题检索的需要,中国学术期刊(光盘版)于1998年12月出版了《中国学术期刊(光盘版)·专题文献数据库》。该库连续出版,每年1期。第1期将1997年度的40多万篇文献按学科分类编制了16个系列82个专题,其中社科6个系列31个专题。
1.2 数据库的选择
选择数据库要从三方面来考虑,一是要根据课题的文献需要量,二是要看数据库的收录年限,三是要易于获取原文。
(1)对于检全率不高的课题,可使用《复印报刊资料专题目录索引》,该盘收录的文献学术水平较高,并能在印刷本《复印报刊资料》中查到全文,同时可利用各专题本所附的未复印文献题录获取一批相关文献。
(2)如果文献的检出量不能满足课题需要,或者课题对检全率要求较高,应考虑使用《复印报刊资料索引总汇》,该盘收录的起始年代为1978年,是目前比较全面、系统的人文社会科学二次文献数据库。
(3)如果课题对回溯性要求不高,可使用《中文社科报刊篇名数据库》,该库收录的起始年代为1993年,按季度更新,可获得较新的文献线索。
(4)《复印报刊资料索引总汇》和《中文社科报刊篇名数据库》的收录重点、范围不完全相同。对于文献需要量大、检全检准率要求高的课题,应将两者配合起来查找,可以获得较为理想的检索效果。
(5)如果需查新近的文献,可使用《中国学术期刊(光盘版)》,该数据库和印刷型期刊同步发行,可获得最新信息。使用时,最好掌握该库中本馆未藏期刊,可从该库中获取原文,若是本馆已藏的,从印刷型期刊中去获取则更为方便。
(6)对于未藏《复印报刊资料》的图书馆来说,《复印报刊资料全文数据光盘》非常有用,它解决了查找原文的困难。但对于收藏《复印报刊资料》的单位来说,最好使用《复印报刊资料专题目录索引》光盘数据库,再根据所获线索去查《复印报刊资料》。因为,目前《复印报刊资料全文数据光盘》回溯年限较短,同时看印刷本比看屏幕要轻松得多,特别是在文献量较多的情况下更是如此。
(7)《复印报刊资料索引总汇》、《复印报刊资料专题目录索引》和《中国学术期刊(光盘版)》都是根据学科门类分为若干个学科库,检索时要根据课题类属选择相应的库,但同时也要考虑到社科文献分布离散度较大这一现实,注意相邻学科的检索。
(8)课题检索的最终目的是要获取原文,所以笔者以为,无论什么课题最好先从《复印报刊资料专题目录索引》中试检索,结果满意即可终止检索。如不满意,可再查《复印报刊资料索引总汇》和《中文社科报刊篇名数据库》,剔除《复印报刊资料专题目录索引》中所收的重复文献题录,这样可以节省部分原文的查找时间。
2如何选择检索途径
2.1 主要检索途径
几种社科报刊光盘数据库所设检索途径多少不一,常用的有以下8种:分类、题名、主题词、作者、出处、年份、全文关键词、全文自由词(任意词)。此外,还有一些特殊的检索途径,如《复印报刊资料全文数据光盘》的原刊地名检索、复印期号检索、原刊期号检索;《中国学术期刊(光盘版)》的机构检索、基金项目(课题)检索、中英文摘要检索、引文检索、蕴含和关联检索(因系统未配备相应的词库,蕴含和关联这两种检索途径目前还无法进行有效检索)等。
2.2 检索途径的选择
某种检索途径一般只适应某一种检索要求,检索时,要考虑课题难易和范围,并结合各种检索途径的特点,选择相应的检索口。
(1)以查全为前提的课题,宜用分类检索。选择相应的分类名和分类号,就能检索到与课题相关的全部文献。
(2)以查准为前提的课题,如文献需要量不大,应用题名检索。因其直接采用文献题名词汇为检索标识,故检准率较高。但这里的检准率是相对的,因社科文献题名和文献内容相符率不高,部分文献标题不能充分揭示文献内容,因而具有一定的漏检率。
(3)当文献输出量不够时,可使用主题途径(《中文社科报刊篇名数据库》设有主题途径),主题途径能将题名未包含该主题词但内容涉及该主题的文章检出,可扩大检索范围。如将题名途径和主题途径配合使用,则可达到较高的检全率和检准率。
对于全文数据库,则应考虑使用正文关键词途径。该途径能将文献题名未包含该词而文献内容包含该词的文章检出,检全率较高,但误检率也较高,可带出一批文献内容虽含有该词但对课题却无什么参考价值的文献,同时用于浏览甄别所检文献是否真正有用而花费的时间也相应增多,应慎用。
(4)若要了解课题研究最新成果或跟踪课题发展趋势,应配合年份途径进行限制检索。
(5)若检索某专家的学术成果,则应采用作者检索途径。
(6)多数研究课题一般通过标题、主题途径基本能获得满足,当标题和主题途径检索效果不理想时,方可考虑全文自由词或任意词途径,该途径误检率很高,如果不是特殊需要,研究课题一般不要轻易使用。
3如何提高检索效率
从我校用户的检索情况来看,造成检索失误的主要原因大都是不能准确选择关键词以及不知灵活使用逻辑组配。
3.1 选择合适的关键词
拿到一个课题,不能盲目上机检索,首先要对检索课题进行主题分析,从不同角度将课题划分为若干个最能表达课题内容的概念,找出其核心概念,排除无关概念,然后选择合适的关键词来表达相应的概念。关键词的选择是否得当,直接影响到课题的检索效果。
首先,要注意选择同义词、相关词及下位词。在汉语中,一个概念可能有好几个同义词和相关词,为提高检全率,一个简单的办法就是选择出所有能表达检索概念的同义词和相关词。如博士学位论文“马克思世界历史理论及其当代意义”,以“马克思”和“世界历史”为关键词,检索结果为25篇,若增加“黑格尔”(马克思世界历史思想的理论渊源是黑格尔)和“东方社会”(马克思世界历史理论包含其大量有关东方社会的看法),检索结果为56篇。同时,研究课题不能泛泛而谈,有些观点需要深入阐述,因而要注意选择下位词以保证最大限度的查全率。
其次,要适当控制关键词的内涵和外延。不少用户选择了合适的关键词,但检索结果还是不理想。如硕士学位论文“当代西方法律秩序思想述论”,如以“西方”和“法律秩序”为检索词,结果为“0”个记录,原因是“西方”概念太笼统,应将其具体表述。一般来说,研究西方法律秩序主要是围绕其代表人物来展开的,所以选择对西方法律秩序有过论述的代表人物为检索词,即能检出一批相关文献。
第三,注意和标引词的一致性。《中文社科报刊篇名数据库》所设主题途径是常用的检索途径,但该系统主题标引不完全一致,以至造成大量漏检。如检索“所有制改革”的文章,以“所有制改革”为检索词,通过题名途径检出43篇,而以主题途径仅检出16篇,原因是系统将大部分论所有制改革文章的主题标引成“所有制”和“改革”。如以“所有制改革”、“所有制”、“改革”三个词组配进行主题检索,则检出56篇。所以选择主题词时,要尽量考虑该主题词可能出现的标引形式。
第四,注意使用分类浏览法。如果遇到难以判定或不易选择检索词的课题,可采用分类途径进行专题浏览,在检出记录中选择相关专业词汇。
3.2 灵活运用逻辑组配
一般说来,绝大部分课题的检索概念都不止一个,因而在确定了必要的检索词之后,就需要编制检索提问式,以指明检索词之间的逻辑关系。检索提问式编制的关键是组配,即用两个以上检索词来表达一个复杂的主题概念。几种社科报刊光盘数据库均设置了布尔逻辑组配。检索时,如果文献量过少,应使用逻辑+连接同义词、相关词和范畴词,以扩大检索范围,提高检全率;如果文献量过多,可用逻辑×连接具有包容关系的词,或用逻辑-排除的某些词,以缩小检索范围,提高检准率。
有些课题特别是研究生学位论文,其检索概念可能很复杂,为兼顾检全和检准,可适当使用2-3个算符进行组合检索。先用+算符建立几个概念块,然后用×算符或-算符组配各个概念块。如利用《中文社科报刊篇名数据库》查“国外社会保障制度研究”这一课题,以“社会保障制度+社会保险制度”为提问式,检出911篇(其中有研究中国的),如以“国外×(社会保障制度+社会保险制度)”为提问式,检出19篇(漏掉了诸如研究西方的、西欧的、世界的,以及美国、加拿大、德国等具体国家的)。可调整检索式为:“(社会保障+社会保险制度)-(我国+中国)×(E=1997+E=1996)-G=中国,即标题中必须只能出现第一个概念块中的任何一个词,而不能出现第二个概念块中的任何一个词,同时文章主题不是“中国”,时间为1996和1997年发表的文章,检索结果为129篇,篇数较为适中,且检全和检准率均较高。