我国省级政府网站的影响评价--网站链接分析与网络影响因素测度_商业分析论文

我国省级政府网站的影响评价--网站链接分析与网络影响因素测度_商业分析论文

中国省级政府网站的影响力评价——网站链接分析及网络影响因子测度,本文主要内容关键词为:因子论文,中国论文,省级论文,政府网站论文,影响力论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引言

政府网站作为电子政务的基础和电子政务发展程度的主要标志,不仅是宣传政府形象的窗口,也是政府发布信息、服务于社会的主要渠道,更是实现社会公众与政府沟通互动的载体。自从1999年我国开展“政府上网”工程以来,政府网站建设发展迅速,全国绝大多数县、市级以上政府都建立了自己的网站。截止2001年5月,政府机构网站数量已达到20490个,占全国238249个网站的8.6%[1]。另根据CNNIC的统计,截止到2004年1月,以gov.cn结尾的英文域名总数已达11770个,占我国域名总数的3.44%,比去年同期增长了30.93%[2];在这一背景下,政府网站的评价越来越受到人们的关注。其中,省级政府网站由于在中央和地方的电子政务建设中起着承上启下的作用,能在一定程度上反映一个地区的电子政务发展状况和信息化发展水平,对其建设状况和服务效果进行评价,对推动我国电子政务的整体发展具有重要的意义。

在政府网站的评价方面,有的学者从政府网站信息量出发,提出了政府网站信息资源计量的指标体系[3];有的学者从整个网站的综合水平出发,提出了综合评价政府网站的指标体系[4]。而目前很有用、且应用广泛的评价方法则是从网络信息计量学出发的链接(Link)分析和与之相关的网络影响因子(WIP:Web Impact Factor)测度。链接分析通过网站被链接的次数(尤其是外部链接数)反映该网站的质量。其评价依据是,一个网站被另一个网站所链接是对该网站的赞许和利用,而且两者的内容是相关的;一个网站的外部链接数越多,其影响力越大。网络影响因子测度以链接分析为基础,以网络影响因子的大小来反映网站的影响力大小。Ingwersen在《网络影响因子的计量》(The Calculation of web impact factor)一文中提出了网络影响因子的计算方法:假设某一时刻链接到网络上某一特定网站或区域的网页数为a,而这一网站或区域本身所包含的网页数为b,那么其网络影响因子的数值可以表示为WIF=a/b。[5]显然,网站的网络影响因子越高,其影响力和知名度越大。Ingwersen同时区分了外部网络影响因子和内部网络影响因子概念,指出外部网络影响因子在评价网站方面具有更为重要的意义。本文运用链接分析方法和网络影响因子测度方法,对我国省级政府网站的影响力进行评价;同时将链接分析结果和网络影响因子测度结果与各省市自治区信息化水平测度结果进行比较,探索它们之间是否存在有意义的相关关系,以便对链接分析和网络影响因子分析在网站评价方面的应用效能和边界条件进行验证和探讨。

2 研究方案的设计

2.1 研究对象的选择

研究对象的选择包括省级政府网站的确定和与省级政府网站评价相关的比较对象的选择。

我国31个省市自治区的省级政府网站原则上应为本文的评价对象。但在研究过程中发现,江苏、山东、西藏、宁夏、青海5个省区的省级政府网站要么打不开,要么链接在其他站点上,并不是省级政府的主站点,因此,本文将未包括这5个省区的其他26个省市区的省级政府网站作为研究对象。但在访问量指标的研究中,由于收集的数据有限,只以其中的12个省级政府网站为研究对象。

目前,与省级政府网站评价最相关的评价体系要数国家信息化水平总指数(L.I: Index of Informatization)测评体系。该体系根据信息产业部公布的《国家信息化指标构成方案》,从信息资源开发利用、信息网络建设、信息技术应用、信息产品与服务、信息化人力资源、信息化发展环境6个方面,综合评价国家和地区的信息化水平,由国家信息化测评中心(NIEC)定期公布测评结果。由于这是我国目前最全面和最具权威性的信息化水平评价体系,能综合反映各省市区信息化发展的总体水平,因此可用于同省级政府网站的评价结果进行比较。本文采用NIEC2002年完成的对2000年中国31个省市区信息化水平总指数的测评结果[6]。

2.2 研究指标的确立

网络影响因子测度需要选择衡量网站大小的指标。我们在选择此指标的过程中,发现除了测度网站的网页数量外,其他指标的测度意义较弱。例如,各省市自治区设置的行政机构几乎一致;从各网站的网站地图或网站导航中可知,各省级网站一级导航栏目一般都在6-10个之间,个别网站多于10个;而二级导航栏目的分类各式各样,没有统一的划分标准,没有可比性。因此,无论是各省级政府行政机构的数目还是一级、二级导航栏目,都无法准确衡量网站的大小和规模。所以,本文采用网站网页数来衡量网站的大小。

为了更好地测度网站链接的影响,除了站内链接(inlink)、站外链接(exlink)和总链接(totallink)外,我们还测度了其他政府网站(以gov.cn结尾)对省级政府网站的站外链接量,叫作政府站外链接(govlink);测度了商业网站(以com或com.cn结尾)对省级政府网站的站外链接量,叫商业站外链接(comlink)。此外,本文还引入了一个特殊的指标——访问量(visit),用于衡量网站的受欢迎程度和反映省级政府网站的知名度。

各指标代码及含义如下:

webpage:网站网页数

totallink:总链接(包括站内链接和站外链接)

inlink:站内链接(指定省级政府网站指向自身网站的链接)

exlink:站外链接(其他网站指向省级政府网站的链接)

govlink:政府站外链接(除指定省级政府网站外的政府网站指向该省级政府网站的链接)

comlink:商业站外链接(商业网站指向省级政府网站的链接)

WIFtotal、WIFin、WIFex:各类网络影响因子(以上链接指标分别与webpage的比值)

visit:网站访问量

I.I:各地区信息化水平总指数

2.3 搜索引擎的选择和检索方法

由于我国省级政府网站基本上都以中文为主要语言,因此选择搜索引擎的标准之一是收录中文网页的数量大,而且数据库覆盖面广。常用的搜索引擎中,百度和google收录的中文网页较多,但不具备测度站内链接和站外链接的功能,因此无法满足本研究的需要。Altavista虽具有链接测度功能,在国内却无法使用。因此,我们选择的搜索引擎是Alltheweb。在研究过程中,我们对其性能稳定性进行了测试,具体方法是选择不同时间(相距一周)的两组数据,将两组数据(表2)中的webpage和totallink进行偏差分析,webpage偏差率=(webpage-webpage[*])/webpage,totallink偏差率=(totallink-totallink[*])/totallink。结果发现,两组数据的偏差率都特别小,大多数在0.05以下,totallink的偏差率更小,说明Alltheweb的性能具有较好的稳定性。

Alltheweb高级检索中测度指标及其检索方法如表1所示(以北京市政府网站为例):

表1. 指标检索式

指标检索式

网页数(webpage)

Word Filter:must iclude www.beijing.gov.cn in thehost name

总内链接(totallink)

Word Filter:must include www.beijing.gov.cn in the link to url

站内链接(inlink) Wor Filter:must include www.beijing.gov.cn in the link to url and Domain

Filter:include result from www.beijing.gov.cn

站外链接(exlink) Word Filter:must include www.beijing.gov.cn in the link to url and Domain

Filter:exclude result from www.beijing.gov.cn

政府站外链接(govlink) Word Filter:must include www.beijing.gov.cn in the link to url and Domain

Filter:include result from gov,cn exclude result from www.beijing.gov.cn

商业站外链接(comlink) ①Word Filter:must include www.beijing.gov.cn in the link to url and Domain

Filter:include result from com exclude result from www.beijing.gov.cn

②Word Filter:must include www.beijing.gov.cn in the link to url and Domain

Filter:include result from com.cn esclude result from www.beijing.gov.cn

2.4 数据的收集

用Alltheweb搜索引擎搜索得到研究指标的原始数据。Comlink是表1中①和②两种检索方法得出的结果之和。这是考虑到我国商业网站的域名有以com作为结尾的,也有以com.cn作为结尾的。

在测度访问量(visit)时,采用省级政府网站主页上设置的计数器所提供的数据。计数器上的访问量大部分都没有说明起始时间,所以计数器上显示的访问量只是一个相对衡量指标。因此,我们以不同时间点测度的访问量之差表示网站一段时间内的总访问量。

3 数据处理与分析

用Excel作为数据统计工具,用SPSS作为相关性分析工具,采用spearman等级相关分析来研究网络影响因子、网页数、链接量、访问量和信息化水平总指数之间的关系。

各指标数据的测度结果如表2、表3所示。

表2 各指标数据

省份 I.I webpage*Totallink*webpagetotallink

inlinks exlinksgovlink

comlink

北京市 149.50 496 40029 49540029

94539873 27899 11803

上海市

96.869947 26244966126244 732226205 12329 10164

天津市

74.181143

80601104 806017 8021894 1876

天津市

66.08 251 12343 249123433812226

1056 2060

福建省

64.28 174

1333 176 1343 1 1342175

262

湖南省

60.09 194 11798 19511798 227111136309 5975

陕西省

53.34 111

9656 111 9656 4842 8722652

292

广东省

53.081915 17288185917288 129715341

1081 5777

辽宁省

50.77

19077

7614

20003 7963 20372 6697668 1359

山西省

48.98 287

8293 298 8293 8 8293 49 4136

浙江省

48.42 236

6113 244 6113 0 6113437

361

吉林省

47.0215018101587 811

547 655390

140

湖北省

45.17 900944 951 95716 916102

215

黑龙江省 45.00 381

6658 368 665834 6580144 1292

新疆自治区

41.85

1

1940

1 2061 1 2061652

962

海南省

41.84 77

5996 80 5996

126 1380144

228

贵州省

37.941463

67751436 6775 7 6697101

489

江西省

36.795500

76705314 767011 7632916 1997

河北省

36.57 193

1374 190 1457 1 1454160

172

内蒙古自治区   34.86 432

1403 417 1463 2 1463

132663

安徽省

34.84

15428 12071

1617912071

71811642

1737 3362

河南省

33.86 782

1317 824 135591 1072 98

251

四川省

33.112698

14422927 1469 4 1460 73

897

广西自治区

32.30

20099

8717

21123 9014 19688 7982

1008 1664

云南省

25.451063 13316105513027 182712200154

726

甘肃省

24.361609

60351670 603579   5607106

278

说明:webpage*、totallink*的测度时间是2004年3月8日上午8:30-10:00

webpage、totallink、inlinks、exlinks、govlink和comlink的测度时间是2004年3月15日上午9:00-12:00点。

表3 网络影响因子和访问量数据

省份 WIFtotalWIFinWIFexvisitVisit*

北京市 80.8661.909

80.551

上海市 2.7160.7572.712

天津市 7.3000.0157.265

重庆市 49.5700.152

49.100

福建省 7.6300.0057.625

湖南省 60.502

11.646

57.107

陕西省 86.991

43.621

78.57627003

51946

广东省 9.2000.6978.25223809

64669

辽宁省 0.3981.0180.33411847

24607

山西省 27.8280.026

27.828

浙江省 25.0530.000

25.053

吉林省 0.5110.3440.142 9130

21979

湖北省 1.0060.0160.963

黑龙江省

18.0920.092

17.88026480

53246

新疆自治区2061.000

1.000 2061.0009297

19285

海南省 74.9501.575

17.2508059

16983

贵州省 4.7170.0044.66314297

30958

江西省 1.4430.0021.436

河北省 7.6680.0057.652

内蒙古自治区3.5080.0043.50844789658

安徽省 0.7460.0440.719

河南省 1.6440.1101.300

四川省 0.5010.0010.498 5356

11710

广西自治区 0.4260.9320.37724752

54657

云南省 12.3471.731

11.563

甘肃省 3.6130.0473.357 8441 16702

说明:visit=2月29日上午10点测得的访问量-2月22日晚上10点测得的访问量

visit*=3月7日晚上8点测得的访问量-2月22日晚上10点测得的访问量

网页数是衡量网站大小和规模的重要指标。网页数和站内链接数量共同反映了整个网站的规模。但从webpage和inlink的测度结果来看,有些数据的差异比较大,出现了一些异常情况。例如,新疆自治区测出的网页数只有1个,各项链接量指标都非常高的北京市政府网站,其网页数却只有496;从站内链接来看,有8个网站的站内链接不到10个,而2个网站的站内链接却超过了总链接数。究其原因有以下几点:(1)有些网站的制作采用了flash技术,使用了框架网页结构,增加了搜索引擎爬行器深入的难度。(2)有些网站可能有病毒,如蠕虫病毒,使搜索引擎爬行器难以爬行下去。(3)近几年随着电子政务的深入发展,政府网站加速了网站版面的更换。如北京市政府网站从1998年7月至今就推出了4个不同的版面。(4)有些政府网站在研究期内处于测试阶段,比如浙江省网站;还有些网站很不稳定,时而可以打开,时而不能打开。(5)另有一种原因就是Alltheweb收录中文网站的网页规模还不够大。上述因素影响到对政府网站网页数的测度,也在一定程度上影响到对网络影响因子的计算。

站外链接(exlink)不仅反映网站的可访问性,而且对浏览、使用网站资源有一定的导航作用,是衡量网站外部影响力的重要指标。从测度结果来看,北京市、上海市政府网站居前两位,而且具有很大的优势。此外,广东、云南、重庆、安徽、湖南和陕西的省级政府网站的站外链接数也相对比较多。考虑到北京是我国的政治文化中心,上海和广东分别是长江三角洲和珠江三角洲区域经济带的龙头且开放程度高,云南省的省会昆明被誉为“春城”并成功举办了世博会,陕西是我国的文物文化大省等因素,说明省级政府网站的站外链接量与该地区政治、经济、文化、历史或其他方面的发展特色及这些特色的影响力有关。总链接量(totallink)的测度结果与exlink分布基本一致,排在前几位的也是北京、上海、广东、云南、安徽、湖南、重庆、陕西等省市的政府网站。主要原因是exlink对省级政府网站的totallink具有重要贡献,大部分省级政府网站的exlink占totallink的90%以上。可见,在省级政府网站的影响力评价方面,exlink较totallink具有更重要的意义。

为了更深入地分析省级政府网站在政府网站内的影响度和在商业网站的影响度,我们测度了政府站外链接(govlink)和商业站外链接(comlink)。govlink是反映省级政府网站在中国所有政府网站中受欢迎程度的指标。由数据可知,北京和上海的政府网站最受欢迎,两者在政府网站内最具影响力。指向省级政府网站的govlink,很大一部分是省市自治区内的市级政府网站、县级政府网站或专业、部门网站,因此,govlink的数量在一定程度上还反映了该地区内其他政府网站的数量规模以及与该省级政府网站的沟通程度。comlink表示工、商、金融等商业网站指向省级政府网站的链接量。从数量来看,北京、上海仍具有很大的优势。从总体上看,comlink比govlink的数量稍稍多些,但这并不表明省级政府网站在商业网站中更受欢迎。根据CNNIC的统计,以com.cn结尾的网站占总网站数量的41%,而以gov.cn结尾的网站只占3.44%[7],商业网站远比政府网站的数量多。按照被链接频率来说,省级政府网站在政府网站中更受欢迎。

将网页数和各链接指标分别与I.I进行相关分析,结果如表4所示。可以看出,Webpage与I.I没有明显的相关关系,inlink和totallink与I.I亦无明显相关关系。考虑到有几个数据的异常性,我们将新疆、辽宁、广西等几组异常数据去掉,再与I.I进行相关分析,仍表明这些指标与I.I无关。Webpage与I.I没有明显的相关关系的原因可能是,各网站的网页设计方式不一样,有的网站的网页信息量大,有的网站的网页信息量小,有的网站的网页甚至是空白,而研究中却将这些信息量不同的网页看作是等同的。totallink与I.I不相关,可能受到inlink数据异常的影响。exlink与I.I的相关系数为0.394,P值小于双尾检验值,说明exlink与I.I具有明显的相关性。govlink、comlink与I.I也具有明显相关性。可见,exlink、govlink和comlink等指标对省级政府网站具有评价能力。

表4 网页数和链接量与信息化水平总指数的相关系数和P值

webpage totallink

inlink

Exlink

govink comlink

相关系数-0.2590.359 0.1490.394*0.397

0.450

P值 0.2010.071 0.4680.0470.0450.021

(*表示其双尾检验P为0.05)

WIFtotal和WIFex表明网站总的影响力和外部影响力,两个指标的数值分布基本一致(见表4)。出现的异常情况是,网页数、总链接量和站外链接量都具有优势的上海市政府网站,其网络影响因子却显示不出优势,数值还非常小。为此,我们对比了上海市和北京市政府网站的网页设计,发现同一主题信息量相当的内容,上海市政府网站用多个网页显示,而北京市政府网站只用一个网页显示。例如,上海市政府网站中“上海概览”下的“历史沿革”用了4个网页显示,而北京市政府网站中“北京风貌”下的“历史沿革”只用了一个网页显示。而且上海市政府网站中许多栏目都采用这种方式设计网页。可见,上海市政府网站这种网页设计方式,使网站在没有增加信息量的前提下,增加了网页数,从而影响了网络影响因子的计算。网络影响因子明显异常的网站还有新疆自治区政府网站和辽宁省政府网站。新疆自治区政府网站的网络影响因子最大,其原因是Alltheweb测度的网站的网页数只有1个,从而使网络影响因子的计算结果异常偏高,实际上该网站的网页数远远大于1。辽宁省政府网站的网络影响因子最小,与实际情况也不相符。其原因有二:(1)Alltheweb将其数据库中存有的辽宁省旧版网站的网页也算成新版网站的网页,使辽宁省政府网站网页数异常的多。(2)辽宁省新版网站中有一部分网页是空白,没有实际内容,将与其他网页等同起来,弱化了整个网站的总网络影响因子和站外网络影响因子。

将WIFtotal、WIFin、WIFex与各省市自治区信息化水平总指数进行相关分析(见表5),结果表明,WIFin与I.I不相关,WIFtotal和WIFex与I.I具有明显的相关关系,WIFex与I.I的相关性更强。可见,WIFtotal和WIFex对评价省级政府网站具有重要的意义,特别是WIFex具有更强的评价能力。

表5 网络影响因子与信息化水平总指数的相关系数和P值

WIFtoalWIFinWIfex

相关系数0.404*0.265 0.431*

P值 0.041 0.191 0.028

(*表示其双尾检验P为0.05)

访问量(visit)是一个政府网站利用效果和社会效益的主要指标,同时又是政府网站改进的主要依据。它不仅反映网站的知名度,还反映人们利用省级政府网站的积极性以及网站信息量对公众需要的满足程度。因此,访问量是一个非常重要的评价网站影响力的指标。为验证访问量的稳定性,我们测度了连续两周内的访问量,发现每周的访问量基本持平。这说明一段时间内的访问量具有一定的稳定性。由于数据样本不是很多(见表3),很难直观看出visit的分布趋势,我们将visit与其他指标进行了相关分析(表6)。结果表明,访问量与webpage的相关性不明显,而与网站的totallink和exlink有很强的相关性。这说明省级政府网站主页上计数器显示的访问量很大程度上是链接量带来的,而与网站本身的大小或规模无关。visit与I.I无明显相关关系,但这并不能否定访问量在评价省级网站中的重要性。这可能受到以下两个因素的影响:(1)visit的样本量过小,显示不出访问量的分布趋势;(2)本文测度的访问量具有局限性:其一,省级政府网站主页上计数器显示的访问量可能是访问该网站主页的访问次数,也可能是访问整个网站的访问次数;其二,人们访问网站的动机是各种各样的,而本文将不同动机的访问量等同起来,赋予了相同的权重。

表6 访问量与其他指标的相关系数和P值

Visit-totallink Visit-webpage Visit-exlink Visit-I.I

相关系数 0.790** 0.021

0.788** 0.510

P值 0.002(0.001)0.9480.002(0.01) 0.090

(**表示其双尾检验P为0.01)

4 结论与讨论

(1)省级政府网站的总链接量和站外链接量与该地区政治、经济、文化、历史或其他方面的发展特色及这些特色的影响力有关,这说明省级政府网站的总链接量和站外链接量的很大一部分是由该地区某方面的发展特色及这些特色的影响力带来的。这部分链接量与该网站的内容和质量无关,说明链接量和网络影响因子只是评价省级政府网站影响力的一个方面(即网络空间影响力)的重要指标,而不能综合评价和反映省级政府网站。

(2)WIFtotal、WIFex和exlink、govlink、comlink与各地信息化水平总指数具有明显的相关性,是评价省级政府网站影响力的重要指标;exlink、govlink、comlink比、totallink,WIFex比WIFtotal更具有评价能力。比较其他研究所得出的结论,可以认为,站外链接和外部网络影响因子指标在网站评价方面具有比较普遍的意义[8],但对于不同类型的网站,站外链接、网络影响因子的评价能力是不同的。例如,有研究得出的结论是,大学网站的站外链接量与大学排名最相关,网络影响因子不适合评价大学网站[9]。而另有研究的得出的结果是,期刊网站的站外链接量与期刊影响因子最相关,网络影响因子对期刊网站更具有评价能力[10]。

从今后的发展方向来看,要更有效地利用这些指标评价省级政府网站,至少还需要在以下两方面进一步加强:其一,在govlink和comlink的分析中,可以对这些链接进行细分,以更好、更全面的说明该地区的政府对政府和政府对企业的电子政务情况;其二,由于网页设计的形式不一致,我们可以对不同的网站的网页赋予不同的权值,然后再重新对网站的网页数进行测算。

(3)网站的访问量是评价网站影响力的一个重要指标,访问量影响因子(访问量影响因子=网站总访问量/网站网页数,表示网站每个网页的平均访问量)也是一个重要的网络影响因子。本文采用省级政府网站主页上设置的计数器所提供的访问量数据虽然具有较高的稳定性,但同时也具有明显的局限性,主要是不能准确反映整个网站的访问量,并将所有的访问动机等同看待。在以后的研究中,可以用多种方法对其局限性进行修正:①利用网站服务器日志文件得到访问该网站的确切访问量;②对日志文件进行细致分析,得出访问者的访问路径,分析访问者的访问动机,从而对不同动机的访问量赋予不同的权重。

(4)搜索引擎的发展对链接分析和网络因子的测度有着非常重要的作用。搜索引擎的数据库覆盖面的大小及其性能决定了测度出来网页数和链接量的准确性、全面性和稳定性。现阶段搜索引擎还不够完善,在很大程度上影响到链接分析和网络因子测度的发展,影响到从网络信息计量学角度对网站进行评价和管理。从今后的发展来看,一方面,希望搜索引擎的设计能更大程度地扩大其数据的覆盖面和增强爬行器的爬行能力;另一方面,则需要研制一些专用于网络信息计量学研究的专门搜索引擎或爬行器。

标签:;  ;  ;  ;  ;  

我国省级政府网站的影响评价--网站链接分析与网络影响因素测度_商业分析论文
下载Doc文档

猜你喜欢