链接分析:网络信息计量的一种研究方法_搜索引擎论文

链接分析:网络信息计量的一种研究方法_搜索引擎论文

链接分析法——网络信息计量学研究方法,本文主要内容关键词为:计量学论文,分析法论文,链接论文,方法论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 网络信息计量学

1.1 网络信息计量学产生背景

20世纪90年代,以数字化技术、多媒体技术、网络通讯技术综合而成的现代信息技术,引发了人类社会的第二次信息革命,随着Internet的普及,越来越多的信息来源于网络。网络信息呈动态性、实时性、不可预测性发展,且网络信息与传统信息相比有很以下特点:①从传播方式看,网络信息凭借计算机通信网络将信息从一台计算机传送到另一台计算机,其传播速度、质量明显高于传统信息,传播的时间、次数亦不受限制。因此信息量巨大,类型多样,呈膨胀式不规则发展。②从存储方式看,网络信息存放在网络计算机上,是一种形式分散、实质集中的存储方式。信息源分散和无序,并且难以预测,缺乏合理的组织③从呈现方式看,差异更为明显,网络信息以网页的方式通过浏览器呈现给用户,网页包含的交互式多媒体极大地增强了信息表现力。④从信息传播方式看,网络信息发布和传播具有周期短、更新及时的特点,但是具有很大的随意性,信息污染问题严重。面对浩瀚的网络信息资源,传统的文献计量学方法就显得力不从心,相应地网络计量学(Webmetrics or Cybermetrics)就应运而生,网络信息计量学采用新的技术和方法如链接分析法来描述和组织网络信息。

1.2 网络信息计量学理论

网络信息计量学是在信息网络环境下迅速形成和发展起来的,作为信息计量学的一个新的发展和重要的研究领域,是一种新型网络计量分析工具。这一术语是最早是由T.C阿曼德(T.C.Almind)和英格维森(Peter Ingwersen)1997年在《Informetric on the world wide web:Metholodogical approaches to webometrics》一文中提出的。他们认为文献计量学的各种方法完全可以应用于网络的信息计量分析。实际上,随着网络文献的日益增多,信息计量的研究对象和范围必然要扩展到网络领域,这是该学科发展的客观要求和必然趋势。可以认为,网络信息计量学是采用数学、统计学的各种定量方法,对网络信息的组织、存储、分布、传递、相互引证和开发利用进行定量描述和统计分析,借以揭示网络信息的数量特征和内在规律的一门新兴学科。它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科。

1.3 网络信息计量学应用

在日益扩展的网络环境下,这门学科具有广阔的应用前景,它不仅能在图书情报工作、信息资源管理、科学学、科学评价、科学管理与预测等领域中发挥重要的作用,而且能够在网络信息资源的评价与检索、引文分析、搜索引擎研究、网络文献的搜集与处理、网站建设、评论与网络管理等应用领域中产生重要的价值。主要应用在:1.促进网络信息资源的合理组织与管理;2.指导网站建设,完善搜索引擎功能;3.方便网络信息资源检索;,网络信息检索为用户提供海量信息多媒体数据库,采用超文本技术使检索空间比传统的信息检索范围更广泛,以结点为单位组织,以超级链接的方式链接和特定内容,更加符合人们的思维方式,打破了线性存储的限制,真正实现多维检索。另外,网络计量关系语言(WRL)的研究也是网络计量学的应用范围。

网络信息计量学无论从其研究对象与研究目的,还是从其研究方法与内容体系来看,都是适应网络信息环境这一要求的,它能够对网络环境下的网络资源管理进行科学的指导,并提供定量依据。网络计量学通过对网络信息资源分散规律的研究,能使人们准确把握网络信息分布的状况;同时对网站、数据库等信息组织机构进行定量分析评价,可确定出网络核心信息源,方便用户检索与利用网络信息资源。

2 链接分析法研究现状

2.1 链接分析法的内容

链接分析法是网络信息计量学中一个重要方法,它可以看成是文献计量学中引文分析法在网络环境中的应用。网络超文本通过链可以将结点链接起来,一般使用两种方法索引链和结构链进行链接,它既可以表示信息之间的关系,又是构成网络的手段。在将网络相关信息资源内容链接起来形成新的信息链或信息集合的基础上,融合了参考文献链接功能,并通过引文关系来分析链接网络信息资源的方法。可以按照引用程度和引用权威信息源来分析,在网络信息组织、检索、评价、服务等方面起着重要作用。

2.2 链接分析法应用

2.2.1 链接分析法在网络信息组织方面的应用

网络信息资源生产者如网页创作者使用链接分析,创建一些对访问者有用的链接,可以链接到不同主题或相同主题质量更优秀的网页,一般来说链接类型大致有:合作链接(被链接网站和链接网站之间存在合作关系)、友情链接(网站之间可能由于在资源或其它相关方面有关系,相当于影视术语中的友情客串)、推荐链接(被推荐网站由于质量好、人气旺、访问用户多或是热门网站等原因链接)、内容链接(被链接网站和链接网站在内容上存在着互补或相通关系等),可以起到网络导航的作用,大大方便用户在网上冲浪。Google还通过链接分析来确定网络上的权威信息源来进行相关的排名。Google认为网页制作者仅创建他们认为重要的网页的链接,链结到另外的网页就像一本书的引文,网页之间的这种引文关系“像是对网页进行评论的过程”。例如,网页的制作者们创造了几千个Yahoo的链接,困此Yahoo被当作一个重要程度点:如果许多重要的网页都指向Yahoo,则其重要程度会更高。 这种方法的好处是网页制作者不可能误导网站的排序,并且扩展性极好-当网络增长时,产生更多的重要网页的链接,自然更能确定该网页是否是权威的信息源。

2.2.2 链接分析法在网络信息检索方面的应用

链接分析主要应用于网络信息检索方面,如搜索引擎收集信息,检索结果的排序等。网络信息检索为用户提供海量信息多媒体数据库,采用超文本技术使检索空间比传统的信息检索范围更广泛,以结点为单位组织,以超链接的方式链接相关内容,更加符合人们的思维方式,打破了线性存储的限制,真正实现多维检索。Web 信息检索系统可以利用链接信息来优化对相关文献的查询,能够极大地提高检索结果的相关性。在搜索引擎收集信息的过程中,J.Kleinberg认为搜索引擎的Robots 直接访问Web提取出权威页(Authority Page)。 但是如何提取出权威页?这需要一个原始积累和评价过程。先给出一批起始网页,Robot 从这些源网页开始收集,可以按照深度优先或广度优先的算法进行。当网页提取回来后,采用链接分析技术(具体用递归算法)来计算出权威页。有了权威网页,Robot在收集Web信息时,就有针对性地、高效率地访问Web网页。搜索引擎检索结果排序方面也运用了链接分析技术, 由于索引数据库容量大,若用户输入一个关键词,有可能会有成千上万条记录相匹配,搜索引擎对如此庞大的结果如何排序,如何把最相关的几十条记录显示出来?搜索引擎按记录号的顺序提取结果集中的前几十条记录,再按邻近图(Neighbor Graph)算法对这几十条记录排序,最先显示给用户。这种检索结果排序就是利用链接分析技术,大大减轻了搜索引擎的负担,Yahoo、Google 等搜索引擎就采用了超链接分析技术来对检索结果排序。

2.2.3 链接分析法在网络信息资源评价方面的应用

传统的引文分析法在学术方面衡量学术期刊重要性的指标之一是“影响因子”(IF),哪家期刊和论文被引用次数多,影响因子就高,谁就被认为是权威,论文也就是优秀论文。在互联网上IF对应于统计指向某一网页的链接数目后对该网页作出的排序,网站引用分析对应的是某个站点网页被其它站点引用的情况的统计分析,也就是网页可能被其它网站搜索提问命中的结果数的多少,采用计分法和线性代数方法对中心网页和权威网页分数进行迭代求和,以确定权威网页和中心网页。这与百度搜索引擎的创始人李彦宏1996年提出的搜索引擎的第二定律:“人气质量定律”相一致。根据这一定律,用链接分析法进行统计网站被链接和访问次数,可以作为评价网站和网络信息资源的质量的一个指标。再加上相应的链接文字分析,就可以用在搜索结果的排序上了,对搜索结果进行的按相关性排序,不完全依赖于词频统计,而是更多地依赖于超链分析。在Internet上链接关系反映的是网页在全世界范围内、同一学科类属的影响力,评价范围是很广的、甚至全球性的,目前主要利用搜索引擎工具在网络上检索网站和网页的链接情况,并按相关性对检索结果进行排序,大大方便了用户在浩翰的信息海洋中迅速准确地获得有用的信息,易于操作、实用且可以节省用户的时间,在一定程度上可以弥补同行评议等定性方法的缺陷。

2.3 链接分析法目前存在的问题

在文献计量学中,传统的引文分析法只要统计参考文献数据就可完成引文分析的任务,一般用于对学术的评价,不同学科有不同的适用性和差异,如对社会科学和一些前沿学科、边缘学科适用性就比较差。在互联网上,链接分析法的研究对象是网络信息资源,网络信息资源覆盖范围广、动态性强,具的信息量巨大、不确定性、缺乏合理组织、难以预测等特点,且信息过载(Information Overload)和信息污染(Information Pollution)现象严重:引用与被引用关系也变得十分复杂:链接分析法的适用范围也是有限的;Internet是在一个商业化的环境中发展起来的,一个网站的被链接数量还与它的商业推广有着密切的联系,因此这种评价体制在某种程度上缺乏客观性。因此,在使用链接分析法时要充分考虑以上问题,尽大可能保证其结果的可靠性。(杨涛.链接分析法存在的问题及改进方法.图书情报知识,2002.03:62-63)引用分析的复杂性。

2.4 链接分析法的发展前景

由于链接分析法借鉴了引文分析法的方法和思路,是情报学研究方法在网络环境下新应用,目前链接分析法主要实验工具是搜索引擎,但随着网络信息技术如人工智能、网络信息检索、计算机网络、知识挖掘、自然语言处理等的发展,必将为链接分析法的研究和开发应用提供更为有力的支持。

标签:;  ;  ;  ;  ;  

链接分析:网络信息计量的一种研究方法_搜索引擎论文
下载Doc文档

猜你喜欢