互联网学术资源评价的标准与方法_互联网论文

互联网学术资源评价的标准与方法_互联网论文

因特网学术资源评价:标准和方法,本文主要内容关键词为:因特网论文,学术论文,评价论文,标准论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

从1969年美国国防部的阿帕网(ARPAnet)到1983 年的美国国家基金会网络(NSFnet)、1989年的因特网(Interner),可以说网络的起源和发展都出于对科研和教学的需要。虽然近几年因特网的迅猛发展归功于商业推动,但是尽管处于各种商业行为的巨大冲击之下,科研和教育仍处于比较重要的地位。因特网的普及在很大程度上改变了旧有的科学研究方式和信息交流方法,打破了地域限制,为科研人员提供了一个全新而高效的手段和工具。

但是,网上信息查找困难、质量不一、真伪难辨却成为科研人员有效利用网上资源的瓶颈问题。因此,对网上学术资源进行评价和选择的工作越来越迫切地摆在我们面前。本文从印刷型文献和现有的网上信息评价方法入手,力图找到合理的评判标准和一套切实可行的方法。

1 因特网学术资源的特点和评价意义

1.1 因特网学术资源的特点 网络信息同其它媒体信息相比, 具有很多特色。这里笔者仅就与学术研究关系最密切的几个特点进行分析比较。

1.1.1 信息发布自由,信息来源广泛。 因特网的特色之一就是帮助人们实现自由出版之梦。任何一个人都可以很容易地在因特网上发表论文和观点。因此,因特网上的信息发布者既有大学、研究机构、政府部门,更有大量公司、行业协会和个人爱好者。而且信息发布过程大都没有严格的审查程序。

这与报纸、杂志等印刷型信息有着极大区别。后者一般经过投稿、审校、出版、发行等环节,质量控制严格。

1.1.2 信息量极大,传播范围极广。网络已成为继报纸、期刊、 广播、电视等传统的四大媒体之后的第五大媒体。它的信息量之大、增长速度之快、传播范围之广是其它媒体无法比拟的。

1.1.3 信息内容庞杂、质量不一。信息内容无所不包, 除了商业、学术和各种实用信息之外,也不乏色情、暴力内容;信息质量参差不齐,既有国际水平的研究成果,也有难登大雅之堂的涂鸦之作和不少虚假信息。

1.1.4 具有多媒体和超级链接特性以及交互性。 比印刷型媒体表现力更加丰富、灵活、查找方便。网上信息还具有很强的交互性。

1.1.5

网络信息的使用与提供的信息的站点的软硬件和服务有关。网络本身为提供新颖、及时的信息提供了必要条件。但是并不是说所有网络信息都是及时、准确的。信息的好坏最终取决于信息提供者的服务。站点的连通性、速度、界面等因素是进行网上信息浏览的客观条件。

同时,网上每时每刻都在产生大量新站点,也有很多站点出于各种原因而改变、停滞甚至消亡。稳定性较差的站点所提供的信息缺乏连续性。

网上信息的更新和维护可以24小时随时进行,这为网络信息的及时性提供了可能。但是也有很多站点长期不进行更新和维护,导致信息陈旧,并有很多无效链接。

1.1.6 网站是信息活动的单位,页面是信息发布的基本单位。 网站作为信息活动的单位常常集娱乐、学术、商业信息为一体,具有很强的包容性。

1.2 评价意义 因特网打破了传统媒体对时间、空间的限制, 以全新的方式为科研人员提供了大量信息,极大地提高了科研工作的效率。但是信息量过大也使科研人员无从选择。目前利用网上的搜索引擎可以进行信息检索,这些搜索引擎使网上信息有序化达到了一定程度。如Yahoo!、Alta Vista、Excite、Infoseek、Lycos等是网上冲浪者最常使用的检索工具。然而,有上网经验的人都知道,搜索引擎经常会将成千上万、甚至几十万、上百万条满足检索条件的网页地址呈现在检索者面前,令检索者无所适从。

更重要的是,因特网改变了信息发布和评价的程序,使由出版者、读者、评论人员共同完成的信息评价工作变为由后两者承担,缺少了编辑出版这一至关重要的质量控制环节。因此,出版自由一方面能使大家看到大量传统媒体上看不到的灰色文献,另一方面又导致网上信息膨胀速度加大、信息污染程度加深、信息内容良莠不分、真伪难辨。如果研究人员不加分析地直接使用,科学研究就会失掉其科学性;如果逐一进行分析考证,又要花费巨大精力,现代科学技术带来的优势和效率就会大大削弱。网络信息的自由性与科学性、网络信息的巨大规模与研究人员有限的精力之间的矛盾再一次令科研人员感到无所适从。随着因特网规模的进一步扩大,网络信息的急剧增长,这些矛盾不但不会消失,反而会愈演愈烈。

这些问题已经引起了人们的重视。专家们提醒大家警惕网上虚假信息[1],并认为解决这种矛盾的方法之一就是进行网络信息评价, 从信息海洋中经过分析甄别,挑选出有学术价值的精华部分。 The World -Wide Web Virtual Library(WWW虚拟图书馆)提供了这方面的一些研究目录[2]。很多网上图书馆,如The Internet Public Library[3] 和The World-Wide Web Virtual Library[4]等, 已经根据一定标准和方法对收入内容和连接的链进行了控制和筛选。同时也出现了一些专门评价网络信息的站点(见本文第五部分)。有人甚至认为应当通过设立“网络编辑(neteditors)”和“网络评论员(netreviewers)”,对网络信息的质量进行控制[5]。

但是,无论从评价标准、评价方法和评价范围上来看,目前的工作还不够成熟,远远不能满足广大科研人员的需要。还要从理论上进行深入探讨,并开展更具规模和系统性的分析和评价工作,形成权威的评价站点,为科研人员提供参考。

2 印刷型文献的评价方法和准则

网上信息与印刷型信息相比尽管有很多新的特性和不同点,但是网络与书、刊、报纸、广播都属信息载体,从信息内容来讲,并无太大分别。因此,尽管不能完全按照传统的评价印刷型文献的方法和标准进行网上信息的评价,但是仍然可以在很大程度上借鉴印刷型文献的评价标准和方法。

印刷型文献评价的出发点基本上以内容为主,外在特征被作为鉴定内容的辅助手段。评价方法主要有定性评价和定量评价两种。

2.1 定性方法 首先利用外在特征,如作者的知名度、 著作的出版年代、版本信息、出版者情况和期刊名称等进行初步判断。然后进行较深层次的内容分析:如分析该出版物面向的读者层面、材料的客观性、新颖性、著作的写作风格。最后,再参考相应的书评或综述[6]。

定性方法需要对文献资料有较深的了解,内容分析一般应由学科专家完成。

2.2 定量方法 利用各种统计数据,形成不同的指标体系, 对出版物进行评估。定量方法主要有:引文法、图书流通数据分析和其它数据分析方法。目前,人们经常将几种定量分析方法综合使用,如《中文期刊核心要目总览》[7]中就同时采用了引文法、文摘法、 索引法评价期刊。定量方法要求评估人员了解文献资源的特点,有一定的专业知识并具备数据统计分析能力。

3 目前因特网学术资源的评价工作

目前,因特网学术资源评价工作受到了一定重视,一些机构和个人用各种方式开展了这项工作。但是,无论数量和质量都远远不能满足实际需要。基本评价方法主要有以下三种:

3.1 凭借个人对网上资源的了解和主观认识进行定性评价

很多WWW站点都有诸如“热门站点推荐”、“站点精选”、“最佳站点”、 “信息资源荟萃”等栏目。其它媒体也有类似的内容,包括各种书刊对网上信息资源的评价和介绍,对热门站点的推荐等。

这些栏目中,有的只罗列了站点名称和地址,有的有一些简单描述或摘要,基本上没有实质性的评价意见。而且提供的站点数量较少,没有分类,缺乏系统性。反映的主题也以大众感兴趣的居多,学术资源较少。这些资料的来源基本上是Web管理员或报刊编辑、 作者从其它站点或资料上看到的内容,再加上个人对网上资源的主观认识而形成的。

严格说来,这些都不能称之为对网上资源的评价,只能认为是对站点的简单罗列和描述。但是,由于这种方法的简单易行,对一般的上网者也有一定的参考价值,因而是目前最常见、数量最多的一种评价方式。

3.2 通过统计访问次数或简单的问卷调查等方式, 选出热门站点 这种方式的评判标准一般为“酷(cool)”,即以用户的兴趣为核心。

同前一种类型相比,它们有的分几个大类,如Yahoo! 的“What'sCool”,有的不分类,推荐站点的数量有多有少。 这些评价一般带有较浓的商业色彩或大众娱乐性,除了一些新闻类、工具类、综合性站点之外,一般对学术研究不具有太高的参考价值。

进行这种评价的站点也较多,例如:

Netscape 的What's Cool〈URL:http://www.netscape.com/〉列出了有趣的站点。

Cool site of the Day〈URL:http://cool.info.net/〉评选当天最“酷”的站点。

The Useless Pages〈URL: http: //www. go2net,com/internet/useless 〉评选最差网页,

每年给最差网页颁发"Bobbie"奖。

3.3 按照一定的评价标准和方法进行较为系统的评定

评价标准一般为以下几方面:范围、内容、用户对象、图形和多媒体设计、易用性、价格等。

这些评价工作从不同侧面反映了被评站点的质量,而且一般进行了大致分类;涉及的范围或者为单一学科和专业,或者类目较广、综合性强,对学术研究和信息管理人员具有较大的参考价值。

但是这种方法目前尚在探索阶段,基本以专家评议等定性评价方法或简单的调查问卷统计方法为主,人为因素较强,还没有形成一套公认的方法和客观原则;缺乏大型、全面、有影响的评价站点,评价结果也远不能满足人们的需要;评测时较重视站点的设计、易用性等特点,而对于内容评测的重视程度则不够。 此外, 有的评价缺乏持久性, 如Infofilter的评测工作已于1997年4月停止。 几个比较著名的评价站点为:

·The Argus Clearinghouse〈URL:http://www.clearinghouse.net/〉由Argus Associates公司制作。根据站点或页面的客观描述、 主观评价、设计水平、材料组织形式、资源指南本身的信息等进行评价。侧重于对资源指南的评价。

·Best of 1996 Social Sciences,Humanities & Asian-PacificStudies

WWW

Resources 〈URL: http: //coombs. anu. cdu .au/SpecialProj/QLTY/BEST/Method96.html 〉为澳大利亚国立大学的研究成果。从1994年开始,每年一次,从站点的质量、结构、外观等方面进行评价,有明显的学术倾向。

·CyberStacks 〈URL:http//www.public.iastate.edu/ ~CYBERSTACKS/〉是美国依阿华州立大学的一个实验性的站点。用于评价科学、技术方面的网页。它按照美国国会图书馆分类体系编排,主要评价标准与美国图书馆协会Reference

Collection

Development: aManual的标准相同,即权威性、内容的准确、清晰程度、内容的独特性、新颖性、相关评论和社区需要。没有网络易用性等与网络有关的评测。

·Infofilter。为一些志愿者所建立。评价标准是权威性、内容、组织形式、通用性、搜索引擎的情况、图形设计和媒体的创新等方面。该项目已于1997年4月停止。

此外,还有一些虚拟图书馆在信息资源选择方面也遵循类似的原则或标准。

4 网上学术信息的评价标准及评价方法

4.1 评价标准 通过以上分析, 考虑到印刷型文献的评价标准和网络信息的特点,综合现有的网上信息评价准则,因特网上学术信息的评价标准一般可以从以下几方面考虑:

·信息质量。包括学术水平、可信度、时效性、内容的连续性等方面。这是评价网上学术信息的最重要、最基本的标准。尤其目前网上信息鱼目混珠,水平参差不齐,信息的真实性、有效性都需要进行鉴别,防止以讹传讹。

·范围。提供信息的广度、深度也是一个重要标准。

·易用性。易用性表现为连接速度快、界面友好、无空链、死链。这是访问者使用网络信息所需要的最基本的客观条件。

·稳定性和连续性。目前为网络的发展时期,大量新站点如雨后春笋般涌现,同时,也有相当数量的站点或改变URL,或停滞不前, 甚至消亡。因此,站点的稳定性和连续性至关重要。一般说来,大型机构由于有充足的资金及人力支持,一般比较正规、稳定,个人站点相对而言稳定性、连续性较差,生命周期也较短。

·评价单位为网页或站点。评价时应以信息质量评价为主,具有较强的操作性,最好将定性和定量方法相结合。

4.2 定性评价方法 定性方法主要依靠评判者的主观判断。 在评定过程中,要尽量做到客观、全面。由于网上信息量太大,无法也无必要将所有信息搜集齐全,逐一进行评价。所以最好通过各种方法确定一定的研究范围,然后对这个范围内的站点进行进一步的评价。

前面谈到因特网的“出版自由”改变了信息发布和评价的程序,这也导致了网上信息评价方法的转变。由于缺少出版编辑者的控制,造成信息污染程度急剧增加,出版自由又使得信息大规模膨胀。在这种情况下,信息评价人员不可能像出版编辑者那样将网上信息进行逐一审查评定,挑选出好的站点和页面,只能充分依靠一些评价工具和他人的评价结果以及用户的反馈信息进行初选。首先缩小范围,对有价值的内容再进行进一步的审核。

定性评价可以从以下几方面考虑:

·充分利用印刷型文献评价工具。网上电子出版物中,如果有相应的印刷版本,可通过对印刷型文献的评价工具了解其学术价值。学术价值高的,再进行进一步的评价。

·查找网上著名的资源评价站点。尽管目前各种评价站点的标准、方法不一,但毕竟是从网上众多的站点中筛选出来的。单独的某个站点的取舍标准和方法可能会有失偏颇,但将几个著名站点的结果汇集起来,综合考虑,可以弥补单一评价站点的缺点。因此,可以这些站点作为进一步评价的基础。

·查找相关学科著名机构的站点或页面。这些机构在相应学科都颇有建树和影响,它们在网上发布的信息也值得参考。

·浏览搜索引擎的评价结果并进行补充。搜索引擎收录站点范围广、类型全面、系统,而且还有一些搜索引擎具有一定的评价功能。如果认为前几种方法的初选结果不够理想、全面,可以利用搜索引擎进一步扩充初选范围。

·对初选站点(页面)进行易用性、稳定性和连续性评价。剔除不符合要求的站点(页面)。

·聘请学科专家根据信息评价的标准对初选站点(页面)进行深入的内容评测,包括信息质量、范围等方面,从而从根本上保证站点(页面)的学术水平。

4.3 定量评价方法 定量方法为人们提供了一个系统、客观、 规范宏大的数量分析方法,结果更加直观、具体,是评价网上信息的发展方向。近几年,国外有些学者已经开始探讨定量研究网络特征的方法[8、9],但目前对网络信息进行定量评价的实例还较少,而且一般局限于对访问次数、登录情况的探讨。笔者分析了传统文献定量评价的方法、网络的特点以及目前可获得的数据,认为可以利用定量分析方法评价网上学术资源,至少可以利用定量分析方法为定性分析提供参考依据。

因特网的基本成分是网页,网页与网页之间由关系相互连接,由此组成了这个覆盖世界的巨大网络。链是网页之间相互关联的纽带,它反映了网页之间的各种内在联系。那么,通过对链的数量进行统计和分析,就可以了解到网页乃至站点的情况。同引文法相比,因特网是一个无所不包的真正的网络,在范围、数量方面,美国的《科学引文索引·(SCI)》、《社会科学引文索引(SSCI)》、 《人文与艺术引文索引(H&ACI)》等都不可与之同日而语。

利用搜索引擎可以检索到部分相关数据。例如,可以用DEC 公司开发的搜索引擎Alta Vista[10]检索某站点(页面)被其它页面“引用”的情况。如果在Alta Vista中输入检索式link:www.yahoo.com 可检索到Alta Vista收录的网页中,有多少页面同Yahoo!相连, 也就是 Yahoo!站点“被引”多少次。这样就可以比较各站点(页面) 的“被引”次数,进而了解站点(页面)的影响力。一般情况下,影响力大的站点(页面)提供的信息水平和可信度也较高。还可以利用这些数据,确定某些领域的核心站点(页面)。

还有些数据不能直接得到,需要开发特定的Web 机器人或从网上下载一些免费统计工具。如果没有合适的工具而且数据量不大,可以考虑进行手工统计。

利用定量方法可以进行以下几方面的评价工作:

·统计某学科站点(页面)的分布情况,确定站点(页面)收录的方向和重点,从总体上把握核心站点(页面)的数量和分布比例。例如某学科站点顶级域名的分布中,某一类(如edu ——教育类)或某一国家(如uk——英国)站点(页面)数量较多,那么正常情况下,核心站点(页面)中这类或这个国家的站点也相应较多。可以通过这种分布研究确定核心站点(页面)中各类的大致比例。

·分析站点(页面)被其它站点“引用”的情况。也就是对其它站点指向某站点(页面)的链的数量进行统计分析。一个站点(页面)被其它站点连接的次数越多,就说明它的影响力越大。如果对同一类站点(页面)按被其它站点连接次数从大到小进行降序排列,就可以看出各站点(页面)之间影响力的差异。可以取定一个合适的值作为阈值,大于阈值的站点作为核心站点(页面)。这与引文的原理相同。

·对某类站点的特点进行分析,可作为它是否入选核心站点的辅助依据。这些站点的平均页面长度、站点的年龄、访问次数以及平均每个页面有多少个链,都在一定程度上反映了站点的质量。可以作为站点是否入选核心部分的辅助依据。

例如,如果对某站点的定性评价介乎核心与外围的边缘。那么,假如该站点的平均页面长度较长、访问次数较多、平均页面连接数量也较多,这时,就可以考虑将其作为核心站点看待。

但是,进行定量分析时应当注意统计单位的差异,如网页与站点在某些方面具有不可比性。一般情况下,在被引情况统计中,网页的被引次数要比站点少得多。此时,将一个页面与一个站点的被引次数进行比较是没有意义的。另外,值得注意的是,由于网上信息变化快,统计数据的获得具有不可重复性,在利用数据进行分析时,一定要注意数据的时间、范围。而且由于目前网络处于发展初期,变化既多且快,稳定性差,通过定量方法得到的结论只能代表某一阶段的状况。切忌只根据少量数据进行盲目推断,最好能够将定性、定量分析相结合,进行时间序列分析,以研究网络信息的发展进程。

标签:;  

互联网学术资源评价的标准与方法_互联网论文
下载Doc文档

猜你喜欢