查新过程中的文学关联_相关性分析论文

查新过程中的文学关联_相关性分析论文

查新过程中的文献相关性,本文主要内容关键词为:相关性论文,过程中论文,文献论文,查新论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[摘要] 查新过程中的相关性判定是文献分析的一项重要内容。本项研究通过调查查新人员和用户对100个查新课题的2500余篇检出文献的相关性判断,确立了文献与查新课题的相关性和与创新点的相关性,并阐述了各种文献源对查新工作的重要性。

一、背景

“相关性”(Relevance)一词在本世纪30年代由S.C.Braford首次引入信息科学,当时他提到了“与某一学科相关的论文”这一说法,此说法后来被M.B.Eisenberg和L.Schamber称之为“标题相关”(Topical Relevance)。Schamber认为这一说法比较合理,因此他进一步提出了“用户相关”(Userbased Relevance)的概念,他指出,“相关性的核心在于个人对信息和信息环境的感觉,而不在于一篇文献或其他载体所载有的信息。”

较早给出相关性测度的是A.Kent,他在1955年提出了反映信息检索系统和目标交流有效性的两个测度—查全率和查准率,这两个指标从一定角度反映了系统的相关性。

满足提问需求和满足用户需求是两个不同的概念,为了对此进行区分,D.A.Kemp(1974)提出了“切合性”(Pertinence)的概念。他指出:“相关性是对提问,即信息需求表达的评价,而切合性则是用户的主观评价。D.J.Foskett则进一步指出,切合性是由用户头脑中储备知识的性质、结构和内容所决定的。

“逻辑相关”(Logical Relevance),又被称为“效应相关”是由W.S.Cooper首先提出的,他认为效应性不仅包括相关性,还包括质量、新颖性、重要性和可靠性等内容。他认为,信息系统的最终测度应该是效用性,即能满足用户某一兴趣,有助于直接解决用户的某一具体问题,而不仅仅是相关性。

“主观相关”和“客观相关”的概念由Don R.Swanson提出,他把主观相关定义为需求信息的个人的经验性感觉,而把客观相关定义为文献和提问间的逻辑关系。

除以上诸学者的观点之外,P.Wilson还提出了“场合相关”(Situational Relevance),他认为,信息的相关与否取决于个人的观点或状况。Dan Sperber提出了心理相关的概念,他把一条检索结果看成是一心理刺激物,是否相关取决于它是否会导致个人的认知变化。

国内近年开始对相关性进行研究,王知津(1987)提出,“信息的相关性是传递的知识与其结果之间关系的一种测度,系统人员判定相关信息,用户判定适合信息,两者共同判定效用信息。胡明(1993)提出了相关性存在手检、机检和用户判断三种不同情况,不同人的相关性判断有较大差异。

查新是通过信息检索手段,把与某一课题相关的文献全部检索出来,并运用综合分析和对比等方法,说明此课题在技术要点上的新颖性。而查新过程中相关性概念如何定义?查新人员和用户的相关性判定有什么差别?本文试图回答这些问题。

二、方法

与一般文献检索不同,查新检索的服务对象是查新人员,且查新课题的核心论文及其创新点是确定不变的,因而不存在满足用户需求和用户提问表达不确定性的问题。所以查新检索的相关性的实质就是找出与查新课题或其创新点相关的文献。我们选取了100个查新课题及其2500余篇外文检出文献,首先由查新人员按不同查新课题确定出“相关文献”。再将这些“相关文献”交用户再一次进行相关性判定,以确定查新人员和用户对相关性判定的异同,然后由查新人员和用户共同判定相对于查新课题创新点的相关文献数量。同时为了考察各种文献源在查新工作中的作用,还按不同文献源统计了查新人员判定的相关文献数量、用户判定的相关文献数量、相对于查新课题创新点的相关文献数量和是否有最早相关文献报道等内容。这些课题均来自农业科研和教育部门,内容涉及农学、植保、土壤、畜牧、兽医和食品等专业,文献数据库为CABI、AGRICOLA、AGRIS、WPI和BA。

三、结果

1.专利文献

专利文献是实行专利制度的国家在接受申请和审批过程中所形成的官方文件和有关出版物的总称。专利文献的主要特点在于其新颖性和技术要点的详尽性。一共有30个查新课题检索了专利文献,16个课题从中查到了相关文献,查新人员判定的相关文献52篇,用户判定的相关文献31篇,直接与创新点相关的文献26篇。这16个课题的最早报道文献均在专利文献中。

2.会议文献

会议文献指国内外召开的各种会议上发表的论文,报告和会议期间形成的纪要等多种文献。100个课题中,有30个课题从这类文献源中查到了相关文献,查新人员判定的相关文献217篇,用户判定的相关文献205篇,由于会议文献的摘要介绍均较笼统和简单,而80%以上的农业国际会议文献国内图书馆目前又未收藏,因而,它们与创新点的相关文献数量未能统计。有6个课题的最早报道文献在会议文献中。

3.科技报告

科技报告是对科技研究和研究进展的记录。100个课题中,有30个课题从这类文献源中查到了相关文献,查新人员判定的相关文献64篇,用户判定的相关文献60篇,与创新点有关的相关文献37篇。无最早报道文献。

4.学位论文

学位论文是研究生为取得学位向学校或研究机构提出的研究论文。100个课题中,有15个课题从这类文献源中查到了相关文献,查新人员判定的相关文献80篇,用户判定的相关文献76篇,与创新点有关的相关文献50篇。无最早报道文献。

5.专著

专著是对某一学科或某一课题进行全面系统论述的著作,由于它的内容相当广博,因此,许多查新课题的主题仅仅是其中的一部分内容。100个课题中,有40个课题从这类文献源中查到了相关文献,查新人员判定的相关文献113篇,用户判定的相关文献106篇。由于80%以上的国外专著国内图书馆尚未收藏,而介绍这类专著的摘要介绍相对简单,它们与创新点的相关文献数量未能统计。无最早报道文献。

6.期刊文献

期刊文献内容上分为普及性、学术性和技术性、信息资料等。在100个课题中,有86个项目在这类文献源中查到了相关文献,查新人员判定的相关文献1600余篇,用户判定的相关文献1300余篇,与创新点有关的相关文献610篇。查新人员和用户对相关文献判定的主要差异在于,相当一部分用户不愿将科普类文献定为相关文献,他们认为这类文献无创造性内容。有74个课题的最早报道文献在期刊文献中。

四、讨论和结论

本文研究表明,查新过程中的相关性应具有两层涵义:一,查新课题本身与文献间的相关性;二,查新课题创新点与文献间的相关性。二者属不同概念,前者应覆盖后者。并且前者的判定可因人而异,例如,查新人员和用户对一篇文献的相关性判定可能就不同,而后者的判定标准—创新点,多很确定又比较简单,判定结果因人差异不大。

与前人的研究相符,相关性判定受判定人的知识、经验、心理和专业水平的影响。查新检索中起作用最大的因素是心理,对查新人员而言,他们总是希望将相关文献查全,在相关性判定上,倾向于把较多的文献定为相关文献。对用户而言,他们总是希望相关文献少一些,以突出自己的成果,在相关性的判定上自然严格一些。

本项研究还表明,报刊文献、专利文献和会议论文是查新检索的主要文献源,它们的相关文献检出数量较多并有最早报道文献。而科技报告、学位论文和专著的作用较差。因此要搞好查新工作,完善文献源支撑条件,首先应加强期刊、专利、会议文献文献源的建设。

标签:;  

查新过程中的文学关联_相关性分析论文
下载Doc文档

猜你喜欢