超链接分析方法及其测评方法—指标体系研究,本文主要内容关键词为:方法论文,指标体系论文,超链接论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
修回日期:2009-10-02
中图分类号G35 文献标识码A 文章编号1002-1965(2010)02-0080-05
网站或网页之间的超链接加强了网络上人与人的交流,并相互影响,一些学者首先将其与引文分析法进行了比较分析,从而引发网络信息计量学的兴起,然而超链接和引文有很多不同的特点,引文分析的理论方法应用于超链接得出的结果是否可靠,受到人们的质疑。因此学者们进行了大量的实证研究,从中抽取出可行性的指标。随着研究的深入,还发现超链接本身的一个特点,即它们相互交织形成的网络并不是混乱的,而是在较大的范围内具有良好的结构,可能遵循某些数学规律,于是,超链接网络分析产生了,它是运用社会网络分析的技术和方法对超链接形成的网络进行研究,总体上说,超链接网络分析是从宏观结构上研究超链接模式,而网络计量学中的超链接分析是具体的、微观的。
目前,超链接分析方法大致可分为超链接网络分析方法(Hyperlink Network Analysis,HNA)和网络信息计量学(Webometrics)两种[1]。这两种方法的目标及特性有相似之处,在于它们都采用量化的方法对超链接数据进行揭示,而二者也有重要的差异,超链接网络分析源自于社会网络分析,网络信息计量学源自于情报学,二者在研究所针对的问题及研究方法的使用上有所区别[2]。
1 理论研究
1.1 网络信息计量学中链接分析法的理论基础 网络信息计量学的典型方法有:链接分析法、网络内容分析法、Web挖掘法、信息可视化法、图论方法等[3]。
链接分析法是网络计量学的最主要的研究方法,它可以看成是文献计量学中引文分析法在网络环境中的应用,是在将网络相关信息资源内容链接起来形成新的信息链或信息集合的基础上,融合了参考文献链接功能,并通过引文关系来分析链接。可以按照引用程度和引用权威信息源来分析,从而达到优化网络信息的组织、检索和评价网络信息资源的目的[4-6]。
1.2 超链接网络分析理论基础 超链接网络分析是将超链接看成是网站或网页之间的社会性和传播性桥梁,将社会网络分析的技术和研究方法应用于这种新形式的资料来源。与其他的网络研究方法(如内容分析法)相比,这种方法的优点在于:它能发现网站之间通过超链接建立联系的这种方式,为研究网站或网页提供全面的信息,如许多网站是由于共同的主题而动态链接在一起,通过研究超链接结构,可能会发现哪些网站是网络中相互依赖的实体,而内容分析法就不能审视这种结构特征。
2 超链接分析方法及其主要测度指标的评析
超链接分析包括超链接网络分析方法和网络计量学中的超链接分析方法两种,下面分别对这两种方法的主要原理、优缺点及涉及的测度指标加以分析。
2.1 网络信息计量学中链接分析法评析
2.1.1 相关概念和术语。
a.超链接概念。Charles F.Goldfard和Paul Prescod在《XML》一书中给出的定义为:“链接就是简单地声明两个(或更多)事物之间的关系。”
国内齐建玲认为:“所谓超链接是指从一个网页指向一个目标的连接关系,这个目标可以是一个网页,也可以是相同网页上的不同位置,还可以是一个图片、一个电子邮件地址、一个文件,甚至一个应用程序。”
从以上定义来看,超链接概念并不难理解,它实际上就是一种文件的指针,提供了相关联文件的路径,实现网页或网站的导航,从文本或图像指向本网站的其他页面或指向互联网上其他页面或文件。总而言之,超链接的实质就是指针,通过它反映出社会行为人之间潜在的联系。
b.链接术语。网络信息计量学的起点便是尝试将引文分析应用到网络环境中,既然引文分析法能够在某种程度上追溯学术传播的过程,那么,通过计算超链接的数目可以测度网页制作者之间网上传播程度。另外,引文分析法还能够通过引文的计算来评价作品的好坏,那么,通过超链接数目的计算,可以作为网上影响力的有效测度方式。同时对超链接的动机也有所了解[1]。
超链接分析与引文分析密切相关,那么它们使用的术语也会有相似之处,学者们众说纷纭,曾一度出现术语混乱的现象,但Lennart Bjrneborn和Peter Ingwersen在“网络信息计量学基本理论框架探析”一文中总结了国外大多数学者较为认同的术语,如图1[7]。
图1 链接术语[1]
Outlink类似于文献计量学中的reference,相对应地,inlink类似于文献计量学中的citation。如果一个超链接超越了网站的,就相应的称为a site outlink或asite inlink。术语out-neighbor和in-neighbor在图论研究中也应用了。
Self-links比self-citations的范围要广。Page self-links是指在同一个网页中从一个部分指向另一部分;Site self-links(也称为internal links)是指在同一个网站中从一个页面指向另一个页面。
网络中会经常出现reciprocal links(互链),这在文献引文中不常出现。互链并不是完全对称的,可能两个结点中某一方向的链接数多一点。有的时候,互链可能是两个网站创建者串通起来共同作弊造成的,为了在搜索引擎排序中得到高的排名。
Triadically linked nodes(三方互链的结点)对应于社会网络分析中的术语triadic closure。而这种triadic structures(三方结构,三方群体)会阻碍社会结构的扩展。
图1中C和D拥有co-inlinks类似于文献计量学中co-citation(同被引),而B和E拥有co-outlinks类似于文献计量中的bibliographic coupling(引文耦合)。
基本的链接术语都有与之相对应的文献计量学中的术语,但也有一些是超链接特有的标记法,如reciprocal和transversal等,而且其他对应的术语中有的在范围上也有所不同,如self-links与self-citations。同时,在动态的网络环境下,链接动机也是不同的,许多情况下,导航动机是普遍的,我们在计算和分析时要加以阐示。
国内研究晚于国外,多是引用国外术语,在翻译时仁者见仁,智者见智,尚未达成统一的认识。在本文的研究中暂且使用上述国外的说法。
2.1.2 测度指标。
a.出链数。出链数是指网站中outlink的数量,是指向站外其他资源的超链接的数量,常常带有参考、推荐的作用,一般它的值不会太大,若值很大,则表明它可能是门户网站或网络目录。
b.自链数。自链self-link包括两种:page self-link是指在同一个网页中从一个部分指向另一部分;site self-link(也称为internal link)是指在同一个网站中从一个页面指向另一个页面。这两个值可以分别计数,再求和得到self-link的值。自链在形式上与期刊文献的自引相似,但它们的目的却是不同的,文献自引是学术研究的需要而引用自己以前的研究,而网络自链是为了更好地组织网络信息,系统地揭示信息。
c.总链接数。总链接数等于outlink与self-link数量之和,用来衡量网站链接数量特征,反映网站的组织情况,其数量越大,表明网路的信息组织体系越完备、信息揭示的程度越高。
d.被链接网站数。被链接网站数是网站的出链指向的网站,也就是将出链数中指向同一网站不同部分的数量去重后的结果,它可以作为研究网站出链特征的辅助指标。若一个网站的出链数值较大,而被链接网站数较小,则该网站的开放性值得怀疑,它与其他网站的关联程度则较高。通过出链数与被链接网站数结合考察可以某两个或几个网站创建者之间的潜在关系。
e.入链数。入链数是指网站的inlink的值,是网站被其他网络信息资源链接的次数,它是评价网站影响力和价值的重要指标,但由于数据收集手段还不完善,导致该值的可靠性存在争议。
f.网络影响因子。1998年,Peter Ingwersen在“The Calculation of Web Impact Factor”[8]一文中给出了网络影响因子的定义:“在某一时间,来源于外部和自身内部的指向特定国家或网站的网页数与该网页或网站中的网页数之比”。具体来说,我们可以计算如下三个网络影响因子(Web Impact Factor,WIF):自我链接web影响因子:测量web空间自身页面之间的链接,其值为self-link/网页数;外部web影响因子:测量外部链接到该web空间的链接,其值为inlink/网页数;整体web影响因子:测量到web空间的所有链接,其值为(self-link+inlink)/网页数[9]。网络影响因子的计算是借鉴期刊影响因子的方法,但是自链与自引的目的是不同的,自引和他引的作用是一样的,而自链对网络影响因力测评影响不大,因此上述三个网络影响因子中,外部影响因子在评价网络影响力中更有效。
g.链接密度。1997年Almind和Ingwersen提出了链接密度(Link Density)的概念,用来测量网站内链接出现频率,单位是bytes/link。链接密度值越大,表示网站中链接出现的频率越低,分布越稀疏;反之,值越小,表示链接出现的频率越高,分布越密集。同时链接密度越大,也说明网站的信息含量越高,对信息的揭示深度越大。
h.页面平均链接数。页面平均链接数是平均每个网页中链接的数量,单位是links/page,还可以根据不同链接指标计算出各种类型页面平均链接数,如页面总平均链接数,页面平均自链数,页面平均出链数等。
页面平均链接数克服了文件格式的影响,但会受到网站风格及组织技术的影响,如有的网站动态网页较多,页面平均链接数的值就较小[10-11]。
链接密度和页面平均链接数都是用来揭示信息组织程度的测度,且各有缺陷,建议同时使用,以便综合科学评价。
i.总点击率、总点通率。一次点击就是浏览器对服务器发出的一次请求,总点击率(total hits)指点击的总数,不论是否获得成功。总点通率(total successful hits)指的只是成功获取文件的点击数。
j.页面浏览数。页面浏览数(page views或page impression)指浏览的页面数,其中不包括图表类型文件。这里页面是指以.htm,.html,.asp为扩展名和少量其他类型的文件。按照这个定义,页面浏览数总是比上述的总点击率的值小。例如,一个网页中包含5个图,那么每访问该网页一次会产生6次点击和1次页面浏览。
k.用户登录数。用户登录数(user sessions)是对一段时间内唯一访问者数量测度。测度用户登录数是比点击率和页面浏览数更复杂的过程。对用户登录数的统计可以等同于唯一访问数。
1.网站不同部分的访问数。这一测度是针对一个网站而言的,目的是确定哪一部分受欢迎、哪一部分点击率低,以便改进网站,这一测度要具体根据网站的设计而定。
2.2 超链接网络分析方法评析
2.2.1 社会网络分析概述。超链接网络分析(HNA)的理论框架是基于传统的社会网络分析(SNA)理论的,所以在这里有必要将社会网络分析加以概括介绍。
社会网络分析(Social Network Analysis,SNA)是社会学的一个分支,兴起于20世纪30年代,是在人类学、心理学、社会学、经验研究、数学以及统计学领域中发展起来的,20世纪30年代到20世纪70年代末,美国的哈佛大学和英国的曼彻斯特大学对社会网络分析的发展作了重大贡献,这门学科兴起的较早,但早期未得到广泛地关注,直到20世纪80年代才进入主流研究,现在已经形成了基本的理论体系。国外发展比较成熟,近些年来,国内也开始重视,但研究还相当薄弱[12]。
社会网络分析研究的是存在于人与人之间、组织之间以及国家之间的各种关系。社会关系一般是根据社会行动者之间的交换而存在,交换的内容可以是看得见的,也可以是不可感触的,包括产品、知识、政治权利、社会支持、媒体内容或信息等,如果单独地分析这些成员,它们之间交换的模式和规则就不能被发现。成员之间的交换关系被表示为描述相互作用的网络纽带。
2.2.2 测度指标。
a.中心性指标。中心性是对权力的量化分析,也就是对权力的形式化定义,社会网络中普遍存在权力关系,处于中心位置的行动者影响力较大,影响网络中知识的扩散,影响组织的效率等,具有重要意义,“中心性”是社会网络分析中的重点之一。此指标应用到超链接分析,可以确定核心网站及其在网上信息传播中的作用。
中心性指标表示围绕中心网站的超链接的范围,中心网站一般起到轴心、经纪人或权威性网站的作用。
中心性指标包括:点度中心度、中间中心度、接近中心度、特征向量中心度和伯纳西茨权力指数以及与之对应的多种中心势指数。
b.密度(density)。密度是为了汇总各个线的总分布,以便测量该分布与完备图的差距有多大。密度指示了网络的总体水平。
c.对等性测度方法。对等性思想,即社会网络分析中讨论的“网路位置”和“网络角色”,“网络位置”对应于社会位置,“网络角色”对应于社会角色,在超链接分析中,如果可以假定一个站点代表一个社会中的行为人,那么通过对超链接网络中结点的网络位置和网络角色进行分析,就可以间接地了解到网站创建者所扮演的角色以及他们之间的潜在的关系。对等性测度包括三类测度指标:结构对等性、自同构对等性以及规则对等性。
3 建立测评方法-指标体系
3.1 测评方法-指标体系 目前,超链接分析研究主要还是单方面研究,一些研究者从量的角度即网络信息计量学角度进行研究,一些学者从超链接网络结构的角度进行分析研究,笔者认为,要综合地、科学地评价网站、网络信息资源以及反映网上学术交流情况,应综合这两个角度的分析方法进行对比分析研究,因为无论什么事情都不是绝对的。因此笔者探索性地提出以下测评指标体系。
这一测度方法-指标体系分微观和宏观两个层次。微观层次是从超链接的数量着手,针对具体的网站分别进行计算分析,再将结果进行对比研究;宏观层次是从链接结点之间的相互关系着手,对其形成的超链接网络进行分析,能分辨出网络中心性趋势、相互关联的密度以及各结点在网络中的相对位置等,从而发现网站创建者之间的潜在关系,对于网上著者之间的联系、网上信息的地域分布和语种分布等有很好的揭示作用。
微观方面又包含两类:一类是静态分析,是将其他网站或网页的地址写入了本网站的源文件中,通过本网站的一段文字或一个图片的点击可以直接进入其他网站;另一类是研究动态的超链接,就是从用户使用的角度来考察,属于网站流量分析,这一类的分析较为灵活,可以根据不同的分析需要从更多不同的角度对原数据进行整理分析。前者主要用于分析网站间固定的链接关系,通过指标反映出网站的权威性,揭示网站的信息组织程度;后者是对网站使用情况的研究,研究一段时间网站受关注的程度,即“热度”,以及网站各部分比较、使用者的地区分布等,以便于更好地改进网站。总体看,前一类是研究较为稳定的关系,更适合于应用于学术网站的研究,掌握学术交流在网上的引用情况,评选核心网站;而后一类研究网站被用户使用的各种情况,更适合于应用于商业网站,通过链接分析帮助它们改善网站,更好地吸引用户,增加点击率,增加收益。
宏观方面目前主要有三种测度方法,还有一些方法在超链接网络中的应用还不够成熟,但随着社会网络分析研究的不断进步及其在超链接分析中应用研究的不断深入,将会有更多的方法加入。
3.2 测评方法的局限性
3.2.1 从量的角度测评的局限性。
a.数据的有效性的问题。获取超链接的数量,最普遍的方法是使用搜索引擎,但即使是最好的搜索引擎也不能覆盖整个网络,显然会影响所得数据的可靠性。Lawrence和Giles的研究指出1999年主要搜索引擎的覆盖率只有16%,那么搜索引擎覆盖学术信息的能力就更加有限。另外,搜索引擎具有不稳定性,同一搜索引擎在不同时间段的搜索结果可能相差很大,导致数据可信度低。再有,搜索引擎不能同时获取多个网站或网页的链接测度,使得获得的数据不具备同时性,分析的结果难免有偏差。
b.链接动机的问题。链接动机也会影响分析的结果,肯定的链接会提高网站或网页的价值,否定的链接显然会削减网站或网页的价值,虽然许多学者对链接动机进行了大量的研究,而且具体分了很多类,但在进行数据统计与分析时无法完成对其细分研究,因此目前链接分析大多数都是在假设链接是肯定的前提下进行的,而实际情况包含多种链接动机,因此结果的可靠性值得怀疑。
3.2.2 从结构角度测评的局限性。上述的数据有效性的问题在超链接网络结构分析的数据收集中也存在,除此之外,从结构角度测评的另一主要局限性是;分析个体的选择问题,即选择网络结点层次的问题,分析的个体可以是顶级域(TLD),二级域或网络文件(如HTML格式网页、PDF文件或PowerPoint文件等),在研究网络拓扑结构时,要注意选择和加以声明,例如,顶级域适用于检测国际交流和全球化时代的跨民族知识流动,因为顶级域多数代表国家,但有些顶级域被一些组织使用,在分析时可能会发生相关错误。也就是说,即使我们以同一级域名的网站或网页作为分析的结点,分析的个体并不一定是同一类的个体,对研究超链接网络中的各种关系带来影响。
3.2.3 测度指标的科学性和全面性问题。其实更为科学的测评指标体系应当对各个测度指标分配适当的权重,但这是较为复杂及困难的事情,一方面是由于目前尚无较为统一的测评指标体系,而且随着研究的不断深入,还会陆续有新的测评方法补充进来,另一方面是由于研究者根据侧重角度不同会选取不同的测评方法及指标,即不存在所谓的“正确”方法。
4 小结
此测评方法及指标体系仅作为阶段性的研究成果,为从超链接角度评价网络信息资源、评选核心网站及研究网上信息交流情况提供参考,也为相关专门应用软件的开发提供一定借鉴作用。希望有共同志向的研究者在以后的研究中对其进行补充和完善,以发挥更大作用。