网络信息质量评价指标体系与可达性研究_评价指标体系论文

网络信息质量评价指标体系及可获取性研究，本文主要内容关键词为：指标体系论文,评价论文,质量论文,网络论文,信息论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

网络的海量信息及方便的获取使得网络成为我们获取信息的重要来源。但互联网改变了传统文献发布和评价的程序，缺少编辑审核出版这一至关重要的质量控制环节。并且互联网出版成本极低，许多网站都提供免费空间供个人发布信息，这极大地丰富了网络信息来源，但同时加剧了网络信息质量的分化。例如Beredjiklian PK等［1］对网上整形外科信息进行了调查与评估，被评估网站内容质量平均得分只有28.4（总分100分），其中23％的网站提供的信息不正确甚至是误导的，需要对网络信息进行评价以便更好地利用网络信息。

网络信息极其丰富，不仅表现在数量上，也表现在形式上，如网络信息的创建目的、信息源类型与涉及专业都极其多样，很难制定一个普遍适用的网络信息质量评价标准，只能提取一些共有的特性对网络信息质量进行评价。本文主要对网络信息内容质量评价指标国外最新研究进展进行总结，并深入探讨这些评价指标在WWW网页中的可获取性，归纳出切实可行的网络信息质量评价方法，以帮助人们更有效地利用网络信息。

1 网络信息质量评价指标体系

对网络信息进行内容分析难度大，通常需要同行专家才能进行。同行评价主观性较大，较耗时间，实际操作中常常是利用一些外在指标对网络信息内容进行评价的，现在编译国外有关WWW 站点内容评价标准的基础上，提出以下网络信息内容评价指标体系［2－13］：

1.1 权威性（Authority）有的也称为可信度（Reliability Credibility），是网络信息最基本、最重要的评价指标。主要通过作者、网站主办者、引用资料来源、质量控制证据、超级信息几个方面进行验证。

a.作者。是否标明了作者；作者在文献涉及专业领域受教育、培训及工作经验；有无作者联系方式；作者的同行声誉；是否发表其他相关论文；作者所处位置（工作职能、头衔等）；是否被著名和有声誉的组织颁发资历证书或吸收为成员；作者所在机构在专业领域声誉如何。b.网站主办者。主办机构在该领域是否有名；战略联盟、重要投资者声誉等。c.引用资料来源。是否明确指出引用资料来源，以及该来源是否具有权威性。d.质量控制证据。不同于传统印刷资料，网络信息没有严格的审核出版程序，但有质量控制的网络信息应该更为可靠。质量控制证据主要表现在三个方面：来源于权威网站；经过编辑审核的在线期刊：须列出编辑审核的过程与方法，编委会名单；信息来源于有质量控制过程的图书和期刊。e.超级信息（meta－information）。信息工作者对该文章作出的评价，主要包括信息工作者对该文章作出的概述与评价两部分。

1.2 准确性（Accuracy）或称之为科学性，是信息内容质量中最重要的部分。准确的内容是建立在事实或试验依据基础上，并已经得到确认。文章应该完整清晰地显示出所依赖的数据和依据，充分表达信息的准确性。信息的科学性需要同行专家才能作出准确评判。公众在决定专业信息准确性上有一定的困难，但应该高度怀疑那些“令人吃惊结果”的“伟大突破”，可留心文章内容是否违反了基本的科学准则。作为佐证，可检索文章有无拼写与语法错误，文字是否通畅。另外如果文章中统计表格或图片清晰易读，没有含义模糊的词语（如可能、大概等）可以提高该信息的准确度。

1.3 新颖性（Curreny）美国健康卫生信息研究所将医药信息的新颖性定义为与目前医学研究或临床应用的现状保持一致［2］。新颖性主要是从文档的创建日期、发布日期、最后修改日期等方面进行大致判断。如果找不到文章的相关创建与修改日期，则可以从网站的更新频率、版权有效期等相关信息进行推测，每日更新的网站内部的文章应该也是比较新的。网站主页标明“Copyright 1997”其内部文章最后修改日期肯定是在1997年或以前。

1.4 客观性（objectively）客观公正的态度是内容准确的一个重要保证。客观性主要可从以下几个方面加以判断：

a.利害关系。网站主办者、主要投资者、作者所属机构利益与文章内容是否有关联，如降压药生产厂家主办网站发布有关高血压治疗信息的公正性就值得怀疑。Suarez［3 ］对网上有关风湿性关节炎治疗信息进行调查发现，51％的信息是由赢利性质的企业发布，有明显的经济利益考虑，认为此类信息与其说是传授病人知识，不如说是欺骗病人。

b.完整性。对一个论题的论述应该是全面的、均衡的，包括正反两个方面的依据，不应该遗漏一些关键的信息，如药物的副作用、负面的实验结果等。

c.适中。论文陈述应保持一种理性而克制的态度，不偏激，不过分强调文章的意义。

d.偏见（bias）。偏见是主观上并未意识到的系统误差。偏见可能是个人智力投资的结果，倾斜于自己多年从事或研究的思想和理论，有资格甚至是有声望的专家容易走入这个误区。

1.5 针对性（Purpose）有的也称目的性。网络信息有不同的创建目的和面向对象，信息内容是否针对其目的与面向对象采取了相应的措施也是网络信息内容评价的一个重要方面。Gardois［4］指出如果是一个专业门户网站首先就应该对收集的每一个资源提供一个注释性的链接，其次是给出一个完整的描述，最后应该说明评价该资源所采用的特殊方法。AMA［5］提出如果一篇网页文章面向对象为其它国家（如中国），还应提供相应的语种（如中文）译本。

1.6 覆盖面（Coverage）指文章的广度与深度。主要可以从以下几个方面衡量：a.形式的完整性。是文摘，还是论文全文。b.内容的完整性。是否论述了该主题所涉及的各个方面。c.相关资源链接。WWW组织网页的方法灵活而方便，可以在任意两个网页之间建立链接。许多网站充分利用了这一特性，在网页上建立了许多站点以外的相关资源链接，以扩大自身信息的覆盖面。这也可以作为判断网络信息内容覆盖面的一个指标。同时站外链接资源的质量与链接的有效性也是网络信息评价的一个重要标准。d.内容的原创性。内容是作者深入研究创造的结果，还是别人结果的简单罗列。

1.7 切题性（Relative）

一些有明确收录范围的站点通常将相关性也作为一个评价指标。如Growth House公司网站专门收集与评估死亡相关信息，它的第一条标准就是被评价信息必须与该主题相关［6 ］。与检索提问词的相关程度是搜索引擎对搜索结果进行排序的重要依据。搜索引擎是通过搜索提问词出现的位置与频率来决定搜索结果的相关程度的，从而按相关程度高低输出检索结果。［7］

1.8 设计与美感互联网提供了图像、声音、动画、互动性等丰富的手段，可以将网站设计得有声有色，因此有些文献也将与美感列为网络信息评价的一个标准。Kim P［8］归纳出的165 个评价指标中有22个就涉及设计和美感，主要包括版面设计、互动性、代表性、吸引力、图形、多媒体手段的应用等方面。

2 网页评价指标可获取性调查

上文构建了一个网络信息质量评价指标体系，但在WWW 真实的网页中这些评价指标可获取性如何？哪些指标在网页中出现次数较多？利用哪些指标评价网络信息内容质量更为切实可行？这都需要深入的研究。

2.1 评价指标可获取性与站点性质有关

不同的网站创建的目的与面向对象是不同的，网络信息面向的对象有研究人员、专业从业人员、学生、普通大众等。对象的不同直接影响到信息的表述方式，如美国国立癌症研究所的PDQ 数据库有关某一种的普查与防治信息就分为病人与医学专业人员两个版本，病人版语言力求通俗易懂，文后不附参考文献，医学专业人员版通篇专业术语，力求准确，以角标形式详细给出每处资料来源。这直接影响了网页中评价指标的可获取性。Jiang YL［14］对WWW上300多个畸齿矫正网站进行了访问与评估，结果发现越是面对卫生从业人员、提供的信息越专业的站点，其评价指标可获取性越高；相反地，越是为一般公众提供卫生保健信息的站点，评价指标的可获取性越低。

2.2 网页中标明作者的比例较小，难以利用作者来判断网页内容质量在印刷型出版物中，通常都标明了文献作者是判断文献质量的重要标准，但在WWW网页文件标明作者的并不多，只有20％～31％的网页标明了作者［15－17］。Shon［15］1999年利用通用与专业搜索引擎查找网上有关乳腺癌治疗的文章，对网页文字及网页源代码中元数据出现情况进行了抽样调查，发现只有20％的网页可找到作者；同期Hoffman－Goetz L［16］对网上有关乳腺癌的136个站点出版相关评价指标的调查情况表明，网页中作者出现比例也不高，只有31.6％。Hersh［17 ］报道31％网页可找到作者，20％网页给出了作者资历说明。超过2／3的网页不能找到作者，因此难以利用作者资历来判断网页质量。

2.3 利用机构标识判别网页内容质量更为切实可行

与网页作者低的获取性相反，90％的网页标明了主办机构，一般可能的解释就是网站主办机构标识、版权或者是资助者等相关信息表明了著作权［15］。例如由宾州大学癌症中心主办的肿瘤学方面权威站点Oncolink大部分内部网页都没有给出作者，但在每一个网页都标明了版权，并有“The Trustees of the University of Pennsylvania”字样，表明宾州大学对此网页具有著作权，同时也意味着对此网页质量负责。

正如企业追求拥有统一的企业标识（CI）一样，许多网站也追求拥有自己的标识，具体表现为各个页面之间拥有统一的主题标识以识别网站。网站内部每个页之间具有统一版式设计、色彩规划，即使没有图形，内部网页在视觉上仍具有一致性。如搜狐公司的标志红色长尾狐造形就出现在搜狐网站的每个页面；Dialog集团所属各个网站、各个页面都采用统一的白底黑字蓝色图形框的色彩规划，版式设计简洁、明快，首页长度控制在一屏之内，版权声明可见于每个页面，令人印象深刻。相对于网页文本中常见的出版相关事项评价指标出现频率，网页文字中出现最多的元素是机构标识，因此利用网站主办机构专业领域的名望来判断网站内部信息质量比利用其他评价指标更为可行与可靠。

2.4 网页文件的新颖性难以判别

已有的一些调查显示网页文件新颖性判别指标如文件创建与修改日期等可获取性也较低，难以判别网页文件的新颖性。Hersh［17］报道只有18 ％的网页能找出文件创建或更改日期；Hoffman－Coetz L［16］报道33.1％的网页有文件修订日期，小于14％的网站能找到网站创办日期；Shon［15］认为利用版权声明中的年份可以大致判断文章创建时间，Shon在调查中发现有47％网页有版权说明，但36％的网页既无版权声明也无创建日期报道。

网络信息内容质量评价指标体系主要可由权威性、准确性、新颖性、客观性、针对性、内容覆盖范围与深度、切题性等7个方面构成。研究发现在实际网页中作者等重要评价指标可获取性并不高，但网站一般都列出了主办机构，且主办机构在某种程度对网页具有著作权，因此利用主办机构的声望对网页内容质量进行评估更为可行。网络信息内容评价方法目前主要采用同行专家评审法等定性方法，但同行评议方法主观性大，较耗时间，需要与其他评价方法（如链接分析法等定量方法）有机地结合起来，构建一个综合评价体系，对网络信息作出一个更为全面和准确的评断，以便更好地利用网络信息。

标签：评价指标体系论文;

网络信息质量评价指标体系与可达性研究_评价指标体系论文

猜你喜欢