共链分析在企业竞争情报中的应用研究初探,本文主要内容关键词为:企业竞争情报论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 共链分析概述
链接是网络中重要的基本构成要素,是将网络信息资源有机整合的工具。网络链接在一定程度上体现了网页之间形成的“参考”、“引用”关系,这与传统文献的引证关系相似。也正是由于网络链接与科学文献引文之间天然的相似性,文献计量学家找到了文献计量和网络的契合点[1]。于是学者将传统文献计量学中的引文分析的方法延伸至网络链接分析中,形成网络计量学中的链接分析方法。其中对网络链接的分类,国外学者从不同的角度进行研究,得到不同的结果。1998年,Ingwersen提出可以根据网络链接的指向将其分为链入链接(Inlink)和链出链接(Outlink)两种,链入链接是指进入(或指向)某一个Web页面的链接,而链出链接则是指一个Web页面中指向其他Web页面的链接。为了更好地理解网页链接间的关系,可以通过表1说明。
通过表1的分析,可以清楚地看出Co-inlink是指两个网页同时被其他网页链入,这就与传统文献计量学中的“共引”(Co-citation)概念类似,因为“共引”就是指两篇文献同时被其他文献引用。而Co-outlink则表明两个网页同时链接了其他网页,这便与文献计量学中“引文耦合”(Coupling)的概念类似。正是基于Co-inlink与共引的相似性,许多学者提出了将共引分析理论(Co-citation Analysis)应用到网络链接结构分析中,揭示网络结构和挖掘网络空间潜在信息的研究思路,从而产生了共链分析方法(Co-link Analysis)。
共链分析的假设前提是:如果网页C和D同被引,则它们之间可能是相关的,同被引强度越大,相关度越大;如果网页C和D耦合,则它们可能是相关的,耦合度越大,相关度越大。于是可以认为共链分析(Co-link Analysis)其实就是指两个网页同时被第3个网页链接或两个网页同时拥有指向第3个网页的链接[2]。其基础就是认为同时被其他网页(网站)链入的网页(网站),在主题上或多或少都具有一定的相似性或相关性,利用网页共被链入的次数(共链频次),可以测度网页内容的相关度或相似度[3]。
2 共链分析应用于企业竞争情报的研究现状
竞争情报(Competitive Intelligence,CI)是商业情报的关键组织部分,是分析企业竞争对手和竞争环境的重要情报,对企业在市场中保持竞争力发挥着至关重要的作用。国外学者的早期研究发现,网络链接包含了有用的商业信息[4]。企业网站链接的数量与企业的经营收入、利润等经营业绩指标是相符的[5]。而Vaughan等人通过对企业网站间链接动机的研究发现,企业网站上的大部分链接是出于商业目的而设置的,因此,链接可以作为企业竞争情报挖掘的工具。但是,绝大多数企业网站都不与其竞争对手的网站相链接,它们却往往同时被第三方网站链入[6]。由此可见,企业网站间直接的链接关系并不能为企业竞争情报提供有价值的信息,但是,企业网站间的共链频次却可以用来度量这些企业在经营范围、产品种类等方面的相似性,从而揭示企业间的某种竞争关系。Vaughan于2004年夏季对32家电信公司在“Yahoo全球”和“Yahoo中国”上的共链情况进行了分析,利用多维标度分析法(MDS)描绘出这些公司在电信业各个领域中的关系分布图,从而揭示出32家电信企业在中国和全球市场中的竞争地位[7]。从MDS聚类关系图的描述中可以看出,相似的企业聚集在一起,而这些相似的企业正是存在竞争关系的企业,这就有力地证明了共链分析应用于企业竞争情报研究中的假设前提。从一定角度检验了Web共链数据应用到企业竞争情报研究中的可行性。
随后,Vaughan、Justin等人在共链数据描述企业竞争格局的基础上,加入了网页内容挖掘技术(Web Content Mining)和网页结构挖掘技术(Web Structure Mining),对企业网站的内容和结构进行分析,从而更详细的描述企业在某一个特定细分市场的竞争态势。他们选取了电信行业中的WiMAX业务部门,分别用单纯网络共链分析和内容辅助的网络共链分析(Content Assisted Web Co-link Analysis)进行对照的实证研究。在研究过程中,他们选取一个关键词代表一个细分市场,并把该关键词(WiMAX)加入到共链搜索的语句中。这就意味着,不存在该关键词的共链网页将被排除在最终的共链数据中。然后通过SPSS对纯共链数据和过滤的共链数据分别进行多维标度分析得出两张不同的企业聚类关系图。通过两张图的对比,研究者发现通过内容辅助的共链分析法得到的细分市场竞争格局图与该市场的实际状况非常吻合。由此可见,通过关键词过滤,将企业间非业务行为产生的共链加以排除,加大了共链数据和企业竞争行为的密切度,提高了共链数据分析对特定业务市场的针对性和准确性。此外,该研究还引入了“共链数的减少量”这一概念。具体来说,共链数的减少量=(A-B)/A,其中A为没有添加关键词的共链数;B为添加关键词过滤的共链数。研究者认为,“共链数的减少量”可以作为共链分析效果与特定业务市场的关联性的度量单位,也可以作为判断企业在某一细分市场竞争力强弱的实用方法[8]。
中国学者周秋菊和周在峰也选取了PPI杂志2006年全球纸业企业营业收入排在前36名的公司,通过对它们在“Yahoo全球”和“Yahoo中国”上的共链数据进行了收集和分析,并利用多维标度分析法描绘出这些公司在纸业各个产品组中聚类关系图,结果表明相似的公司聚集在一起,并可依据主营产品不同分组。研究还采用凝聚子群分析中的K-核分析法,绘制出K-核社会网络图,揭示出各竞争企业间的凝聚子群以及哪个企业是各个竞争组的核心[9]。由此可见,共链数据能够揭示相关企业的竞争关系以及各个企业在不同市场的竞争地位。
3 共链分析在企业竞争情报中的应用
3.1 共链分析的方法
(1)聚类分析。共链分析中使用的聚类分析技术,是文献计量学中同被引聚类分析的延续,其理论基础依然是文献计量学中的聚类分析。同被引聚类分析是文献计量学的主要方法之一,可以用来表示某一学科或专题的研究结构和状况。同被引又称共引,指两篇文献同时被别的文献引用的现象。它们被共同引用的次数称为同被引强度(Co-citation Strength)。同被引强度越大,说明它们之间的关系越密切。据此,可以认为,如果两个企业网站同时被第三方网站链接,则这两个企业网站资源具有相关性,而利用他们共被链入的次数,即共链频次进行量化测度则可以揭示共链数据与企业产品类型和市场间的相关性。
(2)多维标度(Multidimensional Scaling,MDS)是指通过某种非线性变换,把高维空间的数据转换成低维空间中的数据,变换后的低维数据仍能近似地保持原高维数据间的关系的一种技术。通过MDS可以在较低维空间中直观地看到一些高维样本点相互关系的近似图像。共链分析中经常使用的是克拉斯卡尔的非度量(non-metric)多维标度技术。该技术已经成为SPSS软件中的一个分析模块。通过调用该模块可以将分析对象散列到低维空间(一般是二维),并且用低维空间中的散列点表现出原n维数据之间的位置关系和亲疏程度,最后形成的低维图形可以用来分析对象之间的关系。因此,将相关企业间的共链数据进行多维标度等多元统计分析,可以把各企业间错综复杂的共链关系简化为数目相对较少的若干类群之间的关系并直观地表示出来,从而提供这些企业由链接关系形成的相对关系的亲疏程度,以揭示这些企业间的竞争关系。
(3)k-核分析。k-核分析是一种社会网络的分析方法,社会网络分析(Social Network Analysis,SNA)就是要对社会网络中行为者之间的关系进行量化研究,是社会网络理论中的一个具体工具,以社会网络关系作为基本分析单位,其实质就是关系数据的分析[10]。共链矩阵呈现的是企业网站间的共链数据,代表了企业网站间共链关系网络,可以通过社会网络分析方法来研究网络在顶点的相互作用下的分布情况。在企业关系网络中,可以根据产品、服务、经营范围进行分类,将关系特别紧密的企业结合成一个次级团体,即凝聚子群。通过对各凝聚子群的分析揭示群体内部的子结构。其中,k-核网络就是这样一种凝聚子群,在这k-核网络中每一个顶点在给定的核内最少有k个连接点。通过改变k的值,就会得出不同的k核图。随着k的增加,k核的集合成员会逐渐减少,而成员之间的联系会更紧密。k-核分析就是对网络图中的成员进行凝聚子群分析,以揭示群体内部的子结构,并反映出每个凝聚子群的核心。k-核分析已经成为UCINET软件中的功能模块,通过模块调用实现凝聚子群分析。由此看来,对企业网站间共链数据进行k-核分析可以显示竞争企业间的凝聚子群以及在每个凝聚子群中处于竞争核心的企业,从而揭示出各企业在市场中的竞争地位和竞争格局。
3.2 共链分析的步骤
(1)分析领域的确定。目前企业竞争情报的研究主要集中于某一行业内部,分析某一行业内各企业间在产品和市场上的竞争格局,这种分析领域的确定在搜集和处理数据时相对较为简单,而对于较复杂的跨行业的综合性企业的竞争格局的分析还有待进一步深入研究。因此,往往选择一个特定的行业,例如Vaughan选择的是电信企业,而周秋菊和周在峰则选择了纸业企业作为研究的行业领域。
(2)分析对象的选择。为了避免共链矩阵过于庞大,在选取分析对象时要确定标准。虽然不同的行业选取标准各有差异,但总的来说应该满足以下几个原则:第一,营业收入排在前列的公司;第二,分布在全球不同地区、有较高声誉的公司;第三,尽量覆盖该行业不同领域,并具有代表性的公司。
(3)共链数据的获取。考虑到链接搜索和分析的需要,针对全球市场和中国市场进行不同的分析,可以分别使用“Yahoo全球”和“Yahoo中国”作为工具进行数据的采集。获取某一企业网站主页中链出链接的查询语句为:(link:http://www.company1.com site:companyl.com);获取两个企业网站主页共链的查询语句则为:(link:http://www.company1.com site:company1.com)AND(link:http://www.company2.com site:company2.com),其中company1、company2代表不同公司的名称。
(4)共链数据处理与分析。第一步,构造一个对称矩阵来存放采集到的共链数据。矩阵的行和列都代表公司的“URL”。矩阵中第x行、第y列的元素表示网页URLX和URLY的共链频次,也就是同时具有指向URLX和URLY链接的网页数。需要注意的是,共链矩阵的元素——共链频次不能准确地度量两家公司的关联强度[5]。例如,当两家公司各自只有8个链入链接时,6个共链对它们来说已相当多了,但是当链入链接达到80个时,6个共链就显得很少了。因此,需要对原始矩阵进行数据规范处理。
第二步,采用Jaccard索引法中的相似度系数对原始矩阵进行规范化处理,得到一个规范化矩阵。规范化共链频次公式为:
第三步,将规范化的矩阵输入到SPSS(12版)的多维标度分析程序中,得出企业聚类关系图。其中,共链频次是两个企业相似性的度量标准,可以通过输入相似矩阵的PROXSCAL选项完成。
第四步,将规范化的矩阵输入社会网络分析工具UCINET6中,利用Netdraw绘图,在TIES对话框中选择GE的数值,表示当两个节点的关联强度大于或等于该数值时,显示节点间的连线,形成社会网络图的节点连线结构。并利用k-核分析功能对社会网络图中的成员进行凝聚子群的分析,得到两个数据集的k-核社会网络图。
(5)结果分析与解释。通过MDS聚类关系图显示企业间在产品类型、市场上的相关性和竞争关系,分析各企业在不同市场的竞争格局,找出位于市场竞争核心的企业。并且可以根据主营产品或市场范围等要素的相似形分成不同的组,通过k-核社会网络图可以分析并解释竞争企业间形成的凝聚子群,以及哪个企业是各个竞争组的核心。
3.3 共链分析存在的问题
(1)共链分析理论基础不完善。虽然说共引理论发展得已经比较成熟,但共引理论运用于网络环境产生的共链分析法还需要完善。一方面,对于共链结果图谱的解释等方面,没有既定的、得到学术界广泛认可的方法或步骤。另一方面,共链分析作为一种表示网站间关系的方法,其有用性与适用性等在学术界也未达成共识[11]。
(2)大量的非实质性链接影响共链分析的准确性[11]。与科学文献中的引文不同,互联网中的链接可分为实质性链接和非实质性链接:实质性链接包括表示推荐和引用的链接等,非实质性链接包括表示结构、通信或广告的链接等,且后者数量远大于前者。因此,在针对实质性链接和非实质性链接的全共链分析中,样本数据里充斥着大量非实质性链接,这使共链分析的假设前提难以成立,揭示和识别企业间竞争关系的准确度降低,共链分析时应将这部分加以辨别并剔除。国内学者邱均平、李晔君等在“实质性共链分析”领域做出了尝试,他们以我国图书情报领域的学术博客为样本,进行全共链分析与实质性共链分析的对比研究,证明实质性共链分析较之全共链分析更具有效性,得出共链分析的有效程度是与链接本身的有效程度密切联系的结论[11]。
(3)缺少专业的链接分析工具,降低了链接分析结果的可信度。文献的共引分析有许多发展成熟的分析工具,如SCI、SSCI、Dialog、CSSCI等。但是链接分析却没有专用的分析工具,目前主要通过商业搜索引擎获取原始数据。而商业搜索引擎在测定链接分析的各种指标值时都有严重缺陷,例如检索结果“不一致”、收录范围不同、网页覆盖能力不足等,这些直接导致了链接分析结果可信度的降低。所以,缺少专业的、通用的链接分析工具致使当前的共链分析在数据获取时不够准确,这是共链分析的主要缺陷之一。
(4)可视化工具的技术局限,不能全面反映群体结构和关系。一方面,目前使用的可视化工具SPSS,STATISTICA,SAS等往往会产生不同的结果,即便是相同的可视化工具,采用不同的方法与过程也会产生不同的结果。而且不同的软件产生的可视化图谱的侧重点有所不同,很难判断哪种可视化工具能够最好地体现现实中的群体结构和关系,因此,学者们据此进行观察和评价共链分析结果就存在诸多的不确定因素。另一方面,目前研究中使用的共链数据只能生成一幅二维图,而且Inlink数据只是用于对竞争地位的辅助解释与理解,希望将来使用Inlink数据在这个二维图上添加一个第三维,即增加一个高度维,体现出公司的相对实力[7]。
(5)共链分析用于描述企业竞争地位的广泛适应性还有待检验。正如Vaughan等学者所指出的,尽管有研究证实能够将共链分析用于企业竞争地位的描述,但只局限于一两种行业,因此还需要在后续研究中针对其他商业领域来测试并检验这种方法[5]。此外,对于共链分析能否适用于综合性的企业集团的竞争情报研究仍然存在疑问。
4 未来研究的前景
综上所述,共链分析方法作为一种重要的网络链接结构分析方法,其在企业竞争情报中的应用已得到许多学者的关注。同时,我们也注意到与共引分析相比,共链分析方法与技术仍处于起步的阶段,有许多方面还不完善。未来的研究应着重于以下三个方面。
第一,建立共链分析方法自身的理论体系。目前共链分析中的许多思路与概念都取自共引分析,但由于传统文献与网络空间、链接与引文的本质区别,导致共引分析的一些思路与方法在共链分析中不适用,完全的照搬移植可能会误导研究工作。因此,我们应该努力建立适应于网络环境自身特点的共链分析基础理论与方法体系。
第二,加强共链分析方法与其他方法的结合。在企业竞争情报研究中,将共链聚类分析与k-核社会网络分析相结合就是共链分析方法与其他方法结合使用的有益尝试。加入网络数据挖掘技术的共链分析方法也极大地提高了企业特定业务市场竞争情报分析的针对性和准确性。此外,Ortega也提出同时利用基于向量空间模型和基于共链分析两种方法可以更好地展示美国国家实验室之间的相似性与合作关系。
第三,结合搜索引擎和定量分析工具,开发具有通用性的链接分析工具。考虑到现有的商业搜索引擎的缺陷,需要开发出专业的链接分析工具,研发规范的链接自动识别机制或程序来解决现有共链数据搜集过程中诸如网页覆盖能力不足、收录范围不同、无法区分实质性链接和非实质性链接等问题,并通过对共链数据的定期搜集与分析、企业竞争格局的变化的监测,对竞争对手的行动做出预警等。
收稿日期:2009-07-24