一种城市网络算法及其实证比较_网络模型论文

城市网络的一种算法及其实证比较，本文主要内容关键词为：实证论文,算法论文,城市论文,网络论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

DOI：10.11821/dlxb201402003

1 引言

全球化和信息化正深刻影响和重构着全球城市体系，对于地理空间而言则主要表现为不断加剧的空间差异性和不断增强的空间联系性这两种对立统一的复杂变化特征[1-3]。因此，城市和区域间的联系在这样的新背景下被重构，形成了在不同空间尺度下(可以是区域、国家甚至跨国)相互联系的大、中、小城市间组成一种网络型空间组织结构——城市网络[4-5]。作为新背景下对社会行动者之间复杂关系结构的最佳隐喻，“网络”也成为了近年来社会经济领域十分流行的术语[2]。一方面，全球化与地方化相互作用导致全球生产网络化，另一方面则是信息化作用下的“地方空间”与“流动空间”的共存促使地域空间网络化[6-8]。人文地理学中，分别以全球生产网络研究和世界城市网络研究为代表，两大分支学科经济地理和城市地理近年来也都出现了网络研究的热潮[9-11]。对于城市网络研究而言，按研究尺度的差异大致可分为“世界城市网络”和“多中心城市区域”两大学派，分别研究全球尺度和区域尺度下的城市网络链接与关系[12-13]。由于行为主体的不同，城市网络的类型也十分丰富，在实证研究方面，主要包括企业组织[14]、基础设施[15-16]和社会文化机制[17]等三条实证路径，其中企业组织路径是目前的主流研究方向，而基于生产性服务业企业组织数据的城市网络研究则是目前西方城市地理研究领域中的前沿[18]。

生产性服务业的区域重组已经成为经济全球化最重要的表现形式之一。Sassen认为，在跨国公司的生产活动越来越趋于全球扩散的同时，更加要求管理功能的空间集聚，而全球城市就是全球经济网络的管理中心，高级生产性服务业(APS)则是这些城市的全球主导功能的核心产业，全球城市在全球生产中的核心控制作用是通过高级生产性服务业的跨国公司来体现的。这一观点与Hall、Friedmann等学者的世界城市理论有着密切的关联[19-21]。在世界城市研究小组(GaWC)基于生产性服务业的世界城市网络(WCN)的研究中，Taylor及其相关研究团队作了大量的实证研究，并提出了连锁模型的算法(IWCNM，国内也有学者译作联锁模型)，这一方法的提出为定量地揭示世界城市网络的特征提供了有力的分析工具[22]。而在国内，尽管诠释性的引介在全球城市理论甫一面世就层出不穷，但是对生产性服务业网络联系的实证研究直到近几年才出现：赵渺希和刘铮、唐子来和赵渺希、谭一洺等，路旭和马学广等基于生产性服务业分别对全国、长三角、成渝地区、珠三角地区进行了城市区域层面的网络研究[23-26]；2012年Taylor、Ben、倪鹏飞等人则对中国城市网络的生产性服务业进行了实证研究[27-29]。以上研究主要是基于GaWC的连锁网络模型开展的中国城市生产性服务业网络的探索实证研究，并没有涉及到深层次的网络模型和算法的探讨。

近两年来，对Taylor城市网络算法模型的探讨和反思成为了新的理论热点，不少学者对这一连锁模型提出了质疑：Neal率先深入剖析了Taylor关于多区位公司分析的算法模式，并指出这一算法实质上是按照社会网络的二模网络转置计算形成的一模网络[30]；Derudder和Liu系统归纳并比较了现有的相关城市网络算法[31-32]；Henanman则从可视化的角度进行了城市网络的图形表达探索[33]；Henanman和Derudder还进一步指出，连锁模型算法忽略了企业联系的地理特征，并在综合考虑了地理空间性和公司层级性两大因素后提出了一种替代算法[34]。

基于当前西方学术界对生产性服务业城市网络研究方法的前沿性探索，本文在Henanman和Derudder的替代算法的基础上进行了算法改进，遵循着模型假设——实证比较的研究思路，以长江三角洲和珠江三角洲这两大城市群作为主要的实证研究区域，对生产性服务业城市网络的算法进行探索，力图实现社会网络分析工具在城市网络研究的拓展运用，这也是本文研究的主要创新点。

图1 二模网络到一模网络的转换过程

Fig.1 The transformation of one-mode network from two-mode network

2 城市网络的主要算法

2.1 连锁模型算法

基于生产性服务业数据开展城市网络的计算最早由Taylor于2001年提出，一般称之为连锁模型(INWCN)[22]。Taylor关于生产性服务业网络连接的计算假设是，在n个城市中有m个生产性服务业企业，城市a的服务值被定义为在该城市的公司办公点在其办公网络中的重要程度，并具体地用

来表示j公司的办公地点在a城市的服务值，所有服务企业n×m就构成服务值矩阵V。根据Neal等学者的研究，Taylor的生产性服务业数据数据库是由城市和企业组成的一种二模网络，若要将其映射为城市—城市的关系则必须将其转置为一模网络[30-32，34]，Taylor的计算过程实质上就是矩阵的转换计算(图1)。在Taylor的连锁模型中，服务值矩阵V中最基本的转换计算关系表示为：

每个城市最多有n-1个这样的联系。网络内每个城市a的点度Ca则可以表示为：

连锁模型虽然实现了二模网络向一模网络的转换，但是导致了城市间大量的无效联系；更加重要的是，这一计算过程忽略了城市联系的空间特征和企业架构的层级特征，不可避免地对原有数据库造成了信息损失，致使城市网络结节性的扁平化[30-32，34]。另外，从网络分析的一般统计工具来看，囿于模型假设的局限性，连锁模型难以反映邻近性、中间性、出度、入度等网络统计量，导致了全面、深入分析生产性服务业城市网络的技术缺失。

2.2 分区核心算法

鉴于连锁模型算法的缺陷，Henanman和Derudder于2012年提出了一种新的模型算法，相较于连锁模型，该方法具有明显的层级特征和地理空间特征，根据其特征可以命名为分区核心(城市)计算模型。

分区核心计算模型主要在两方面尝试做出了改进：首先，在计算过程中纳入了企业在全球布局的层级信息，即考虑到APS企业办公网络的空间组织性，通过对APS企业在全球办公组织的区域划分，在每一个区域中选取区位价值最大的城市作为对外联系的门户，低区位价值的生产性服务业企业依靠门户城市链接更高等级的城市，这一方法体现了网络链接中公司层级和地理邻近的重要性，且与现实中的生产性服务业网络链接更为贴近。其次，两位研究者构建了一个网络链接的基准模型，以保持网络基本结构的参数分布特征(如度分布)。为此，Henanman和Derudder采用“洗牌”的方式(shuffling approach)对节点链接进行数次随机置换迭代(社会网络中谓之permutation或bootstrapping)，经过这种“门户指向”(upper-level directed)的随机变化，网络节点间链接的路径方向得以保存，进而可以进行节点中介性的计算分析。分区核心算法的基本过程可以简略表述为：对于任意j公司，先找出该企业所属的第k个区域中的区位价值最大值所在城市a，并考虑两种情形：(1)若j公司在同一区域的两个城市a、b的区位价值均大于0且互不相等，其中一个的区位价值为区域最大值，那么将j公司网络在a、b之间的“报告”型链接值

记为1，否则为0；(2)若a、b不属于同一个区域，但都为各自区域中的最大区位价值所在城市，将城市区域之间“报告”型链接值

可以记为1，否则为0。

对于单向的

计算公式可以表示为：

通过上述公式还可以计算每个节点城市的点度(入度、出度)，其中入度可理解为某一城市分支机构受到外地总部控制的全部联系，出度为其总部发往分支机构的全部联系。进一步地，基于

的向量型特征，

可以用来表示城市a、b之间链接的全部联系，而以城市a为考察对象、对

分别对符合链接方向的b求和，则其结果分别表示了节点a的出度和入度，根据Alderson和Beckfield的研究，出度反映了总部所在城市的控制地位，入度则反映了城市吸引投资的声望[35]，而分区核心算法得到的出度、入度两者之和则为城市a的点度。

3 分区核心城市算法的主要不足及其改进

如前文所述，连锁模型对网络结构往往很难进行更深层次的探索性分析，如社会网络分析中接近性(Closeness)、中间性(Betweenness)等重要的分析指标无法在连锁模型中计算。中间性的计算最早是由Freeman提出来的[36]，Henanman和Derudder用其来分析节点城市在网络中的重要性。就城市网络而言，理论上应先计算城市之间的所有最短路径数量，再分析其中节点城市被不同城市之间最短路径穿越时所包含的次数。Henanman采用了随机网络的间接度量方法，但是这种计算方法仍然是一种近似方法，并不是完全的路径搜索计算。更重要的是，由于这一算法并不逐一对企业的可能路径进行计算，而采用了全部企业合并后形成的关系型城市联系矩阵的路径分析，因而其实际的测试计算公式为：

上述公式中Henanman和Derudder的算法规避了社会网络链接的真实性问题。根据Rozenblat对城市链接的机理的深入考察[37]，采用公司链接来分析城市联系必须注意企业链接与城市链接的层次关系，这是因为两个在同一地点的公司之间并不一定存在业务关系(社会网络链接)。如图2所示，分析3个公司(1、2、3)在4个城市(a、b、c、d)间的网络链接过程，假若有公司1拥有a-b城市链接，公司2拥有b-c城市链接，公司3拥有d-b、d-c城市链接，简单将3个公司进行叠加后将形成1个三角形另加1条边的拓扑结构，仅看叠加后所形成的结构图，b充当了a、c和a、d之间的中间点，似乎Freeman所提的路径、步长、中间性等统计量在数学上都是可行的，但是就链接的实际含义来说，这一计算过程混淆了公司1、2、3在城市a、b、c、d之间的链接问题，分析结果忽视了存在假性链接的风险，因为从社会网络的角度来看，若公司1、2以及公司1、3之间没有联系时，则最右侧叠合图中城市b不能视为a、c和a、d之间的中间节点。事实上Neal，Alderson和Beckfield的研究[30，35]也并没有注意到企业链接与城市链接的区别，因此其企业合并后计算的中间性同样面临着假性链接的风险。

图2 公司链接在城市间的叠加过程

Fig.2 The overlying process of enterprise's network in cities

鉴于将全部企业合并转制形成城市网络在计算中间性过程中的假性链接问题，本文将对中间性的计算做出改进，按照每一个公司j的链接情况先以

的形式予以分别计算，即在公司—城市的二模网络中对各个企业逐一进行中间性的度量，最后再将各个企业在网络中的中间性进行平均值计算，由此通过全过程的单一企业计算，能有效地避免中间性计算的真实性问题，其相应的计算公式为：

类似地，研究还进一步引入邻近性的计算方法。邻近性同样来自于Freeman的研究，起初始定义是节点i与网络中其余所有节点最短路径的步数之和的倒数，相对于企业网络其计算公式可以表述为：

式中：

表示任意一个节点城市i的邻近性指数，dai，j为j公司网络中a、i之间的最短步数，邻近性公式刻画了网络节点对信息流动的影响力，在城市网络中则反映了一个城市连接其他城市的便捷性程度。需要指出的是，部分节点在某一企业网络中与其他节点的链接可能不存在，因此对这种情况特别定义其邻近性为0。

4 实证比较研究

4.1 研究数据与研究区

任何理论模型的算法改进需要在实证案例中接受检验。城市网络链接是考察区域空间组织的重要途径，同时考虑到数据处理的可行性，本文的实证案例参照了欧洲多中心城市区域的网络研究。在相关研究中，Hall和Pain采用了GaWC关于生产性服务业的关联网络分析方法(Interlocking model)，以生产性服务业跨国公司的相关数据为基础，对欧洲巨型城市区域的空间联系加以测度，揭示了高级生产性服务业(APS)网络在巨型城市区域这一高级空间形态的组织过程[13]。

基于西方学术同行的经典性研究，本文选择了我国东部沿海发育水平较高的长江三角洲、珠江三角洲的地级以上城市为研究对象，其中长三角地区包括上海、南京、镇江、苏州、南通、扬州、常州、无锡、泰州、杭州、湖州、嘉兴、宁波、绍兴、台州、舟山16个城市；珠三角地区包括广州、深圳、佛山、珠海、东莞、江门、惠州、中山、肇庆9个城市。

具体的生产性服务业的企业数据方面，在参照我国相应的行业企业排名的基础上，对在2个或2个以上的城市有分支机构的生产性服务业企业的网站进行登录访问(数据收集时间为2010年5月，校核时间为2012年8月)。研究选取了48家银行、38家保险公司、30家律师事务所、33家会计师事务所、31家管理咨询和建筑设计公司、25家广告公司、85家证券公司，总共290家企业进行数据采集，并借鉴GaWC的APS企业服务值赋值方法，按照公司的等级分别赋值为0，1，2，3，4，5等6个数量级别。0代表该公司未在该城市设立办事处或机构网点，5为设立公司总部的所在城市，2为设立标准(一般典型意义上的)办事处或机构网点，次一级或高一级的办事处和机构网点分别为1和3，区域性总部为4。在此基础上，以在290家企业中至少拥有2家跨地级城市分支机构为甄选标准，由此得到189家生产性服务业企业，最终形成了189×25的矩阵作为研究的数据库。

4.2 结果分析

4.2.1 城市网络的链接值分布鉴于连锁模型在分析生产性服务业网络方面的权威性，研究先按照这一方法计算25个城市的链接值(图3)，并重点分析连锁模型点度在前10位的城市之间的网络特征(表1)。可以发现，连锁模型得到的结果是一个对称矩阵，其中上海—广州、上海—深圳的链接值均超过了1000，且明显高于上海与长三角区域内其余两个省会城市杭州、南京的链接(上海—杭州为677，上海—南京为576)。同时，连锁模型的计算结果在空间层面更加突出了非核心城市跨地域之间的联系。这种忽略层级特征的分析视角甚至可能出现奇异现象，例如两大城市群中经济实力最弱的城市浙江舟山与江苏、广东部分城市也有着明显的网络联系，甚至超过其与浙江省内城市的联系数量。

图3 连锁模型、分区核心算法对长三角、珠三角生产性服务业城市网络的计算结果

Fig.3 Results of intercity producer servicing network in YRD and PRD by interlocking network method and regional core cities calculating method

继续运用分区核心算法，分析长三角、珠三角城市区域的总体链接(表2)，可以看出，计算结果是一个不对称的表，这一点与连锁模型结果有着本质的区别，当然这也源自于分区核心算法的下级企业机构向上级机构“报告”的链接假设。在具体的链接分布中，前三位的链接依次是：上海→杭州(25)、上海→广州(23)、上海→深圳(23)、深圳→上海(22)、上海→南京(20)，这同样显示出上海、深圳、广州、南京、杭州在两大城市区域生产性服务业网络的强势地位。另外，分区核心算法的不对称表更加反映了生产性服务业区位分布不对等的情况：观察数据表的每一列可以发现，上海、深圳的生产性服务业总部(或者区域型总部)数量全部大于0，而最右一列中佛山生产性服务业的总部数量为0，这一方面反映了Hall、Friedmann关于世界城市假说的总部集聚特征，也与Sassen的全球城市理论相吻合，即在生产活动趋于区域扩散的同时，管理、控制功能的集中反而会得到强化；另外，由于研究的企业数据采用的是Taylor分类企业排行的抽样方法，分区核心算法针对的则是生产性服务业的区域性总部，因此这一情况在最后两列数据中得到了反映，说明以制造业为主的城市东莞、佛山其外向型的生产性服务业控制能力明显较弱。

通过图3的直观比较可以观察到，分区核心算法的计算结果将连锁模型中部分城市间的生产性服务业联系进行了“擦除”，这一结果使得城市联系的空间格局更为清晰，也避免了连锁模型计算过程中忽略地理特征导致的不足(如舟山的链接就更为符合常理)。从企业内部网络的联系过程来说，低等级的分支机构在联系区域外部的其他机构时，通常会先与所在区域的高等级管理机构进行沟通，毕竟高等级的办公机构掌握了更多的内部信息，能指导下级企业机构更便捷地联系当地的目标机构，由此高等级企业机构更有可能充当跨区域低等级分支机构之间的网络桥节点。

在城市联系的内、外部关系中，Taylor、Hoyler、Verbruggen提出了Town-ness和City-ness两种城市联系模式[38-39]。其中前者是以内部的腹地联系为表征，并与传统的中心地理论密切相关，后者则是与区域腹地之外的城市联系，经济全球化即属于这种跨地域的外部联系。Taylor还详细引述了Jacobs的观点来说明城市与区域腹地外部联系的重要性[40]，一个城市若仅仅依靠与区域内部腹地的联系是无法支撑其地区经济发展的。具体到本文中，考虑到分区核心算法其出发点即在于对区域进行划分，因此有必要研究城市连接区域内、外部其他城市的强度。按照地理范围分割出区域内部的节点集合，则节点i与其所在区域内的城市节点的连接情况可以用平均连接度k[，si]进行度量，对应地k[，ti]则用来表示i节点在全部网络中的平均连接度，由此可以简便地计算节点i的区域内联系相对于整体网络的区内联系比值：

式中：

分别表示节点i所在区域内部、整体网络的节点数量，若

大于1表明节点i的联系主要体现为区域内部的联系，

小于1则表明其联系体现为区域外部。

运用上述公式分别计算两种网络模型算法中长三角、珠三角各个城市的区内联系强度(表3)。可以看出，在长三角区域的生产性服务业联系中，连锁模型算法中上海、南京、杭州、宁波均是长三角区域中内部联系比值较低的城市，反映了这一算法中4个城市在两大城市区域功能联系的去地化趋势；但是在分区核心城市算法中，所有城市的内部联系比值均大于1，且南京的内部联系比值相对于杭州更低，说明南京的外部联系强度更为突出。总体来看，算法结果的差异实质上是分区核心算法更为强调生产性服务业区域总部的必然结果。

类似地，连锁模型算法中珠三角的广州、深圳、佛山、中山均是内部联系比值低于1的城市，但是在分区核心算法中，深圳的外部联系作用更为明显并超过了广州，这从一个侧面说明了分区核心算法的区域性本质：广州在珠三角区域中更多地承担着省会城市的职能，因此表现为分区核心算法中内部联系比值高于深圳的格局，也反映了深圳在生产性服务业城市网络中具有更强的外部链接功能。

另外一个值得关注的现象是，在分区核心算法中，长三角的城市相对于珠三角区域有着明显的较低的内部联系比值，而连锁模型则不显著。运用独立样本的t检验进行分析(表4)，在考察Levene检验值的基础上观察双尾检验的显著性水平，可以看到分区核心算法显著性达到了p＜0.01的检验水平，而连锁模型算法的显著性则没有通过p＜0.05的检验。这说明，在分区核心算法中，长三角区域的城市其生产性服务业联系具有更加突出的跨区域特征，在城市群外部联系的发育方面略胜珠三角一筹。

4.2.2 网络的结节性结节性是网络研究的一个重要议题，但学术界对点度的数值处理方法并没有统一的标准。因此，本文采用了标准值化的处理方式，即将各类型的结节性计算值以其相应类型最大值为1，通过比值换算得到0～1的数组分布。先比较两种算法中点度的分布。两种算法中，上海的点度原始数值都最高，因此无论哪种算法上海的点度都为1。

根据图4，可以直观地发现，连锁模型的点度递减相对缓慢，图4中仅珠三角的肇庆、江门和长三角的舟山其点度在0.2以下；而在分区核心算法形成的点度图中，长三角的扬州、泰州、常州、南通、湖州、嘉兴和珠三角的中山、肇庆、江门、珠海、东莞、惠州、佛山等地其点度均在0.2以下。

进一步地，将两种算法得到的点度均改写为P并分析其位序规模分布特征，根据Newman、Clauset、Boccaletti等学者的研究[41-43]，在实际的地理空间网络可以观察到点度的分布曲线符合幂律分布的无标度特征，且网络的节点幂律分布可以表示如下：

图4 连锁模型、分区核心算法对长三角、珠三角生产性服务业点度的计算结果

Fig.4 Results of degree for advanced producer service of YRD and PRD by interlocking network method and regional core cities calculating method

在长三角15个城市(长三角的末尾城市舟山数据过低，进行“截尾”处理)、珠三角9个城市点度的规模位序曲线中(图5)，无论是分区核心算法还是连锁模型算法，两种算法得到的点度分布都呈现出明显的幂律分布特征，回归方程的决定系数均超过了0.9(表5)。在回归方程曲线的斜率分布方面，分区核心算法的分布曲线更陡(图5)，其点度位序规模回归方程中α值为0.859，高于连锁模型算法中点度的α值(0.609)。结合图4可以观察到分区核心算法有着更为突出的层级特征，联系到全球城市的地理空间极化观点，可以判断，分区核心算法体现了长三角、珠三角区域中少数城市的控制性地位。

图5 连锁模型、分区核心算法的点度分布

Fig.5 Distribution of degree by interlocking network method and regional core cities calculating method

若参照Hall、Pain，Burger、Knaap、Wall和Meijers、Burger等学者对巨型城市区域的多中心测度方法[13，44-45]，利用本文两种算法计算出来的结节性，以点度的规模位序方程度量长三角、珠三角的空间结构。可以看出，两种算法在点度的无标度分布方面均呈现出优越的高拟合性，且通过方程拟合则可以进一步观察到长三角和珠三角在生产性服务业空间集聚方面的差异性，即长三角区域的城市网络呈现出更为扁平的结构特征，而珠三角区域尚存在一定的空间极化现象。这一点尤其在分区核心算法的节点拟合方面更为突出，珠三角区域相应的系数达到了1.176，呈现出较弱的首位型分布特征。

继续考察分区核心算法得到的分项结节性指标(入度、出度、邻近性、中间性)与连锁模型点度的相关关系(表6，图6)。可以看到，连锁模型点度与分区核心算法的出度、邻近性、中间性的相关性均超过了0.7(决定系数R[2]值分别为0.881、0.870、0.752)，但是与入度的相关性不高(R[2]值为0.097)，说明了分区核心算法虽然对连锁算法具有很好的拟合性，但是分区核心算法的出、入度分布较连锁模型更能反映真实的层级特征(表4)。由于生产性服务业的企业总部或高等级办公地点集中于少数核心城市(出度)，因此从分区核心算法中可以观察到城市间功能关系的不对称性，这实际上是由于总部和分支机构区位分布不对等所造成的必然结果，体现了Friedman、Sassen关于世界城市或者全球城市的总部控制功能的空间集中特征。进一步地，Diken对跨国公司生产网络的不均等性进行研究后认为，在不同公司控制的生产系统各部分之间，有控制与被控制之别[46]；Massey也提出了“所有权关系决定社会关系”的观点，认为空间上的所有权关系，便变成了权力关系地理、控制与被控制地理、影响与被影响地理[47]。因此，分区核心算法中出度、入度表征了双三角区域经济联系的非对称性特征，也是价值链在巨型城市区域内部的一种地理映射关系。

深入分析核心算法得到的邻近性和中间性(表6)，可以发现，两类指标中上海都处于绝对的优势地位，第二位城市深圳的地位也没有发生变化，但是在中间性方面，南京替代广州成为了第三位城市，说明南京相对于广州能够更有效地承担“中间人”的角色，而广州链接其他城市的邻近性方面则更胜一筹；另外有13个城市的中间性得分为0，反映了两大区域中城市网络链接的层级现象。

图6 连锁模型、分区核心算法对生产性服务业城市网络结节性的比较

Fig.6 Comparison of nodasity of advanced producer service city network by interlocking network method and regional core cities calculating method

若进一步对分区核心算法得到的点度、邻近性、中间性等3类结节性进行深入的分析，通过每一个城市分项结节性偏离相应数组平均值的0.5标准差为划分标准，并对个别的单个类型城市适当归并，一共可以得到5组城市：上海、深圳、广州、南京、杭州属于3类结节性均非常突出的城市，即不但点度突出，而且具有链接其他节点便捷、位于关键位置的特征，当然上海是属于最顶端的城市；苏州、南通、无锡、常州、宁波、绍兴、东莞属于3类结节性均处于区域中游的城市；珠海、佛山属于点度较低、其余结节性指标一般的城市；镇江、扬州、泰州、湖州、嘉兴、台州是邻近性较低的城市；而肇庆、中山、江门、惠州、舟山等城市的点度和邻近性均显著低于区域平均值(表7)。

总体而言，由于分区核心算法有效地改进了社会网络的分析指标，从而能更为全面、深入地表征生产性服务业的城市网络关系。反观连锁模型算法，由于其假定所有的异地分支机构具有联系，在忽略权重的情况下即形成正则式的网络，因而对这种网络形态进行社会网络分析就不大适合，这也是西方从事世界城市网络研究的学者一般不对连锁模型得出的数据进行社会网络分析的一个重要原因。

5 讨论

基于生产性服务业企业数据的城市网络链接是考察城市区域空间组织的重要途径，但是如何恰当地对城市联系进行度量是重要的方法论问题。本文认为，鉴于城市联系中的实际社会网络状况，为避免公司—城市数据库简并后的信息损失，有必要在全过程实行单一公司的遍历式计算，并采用地理空间结合企业层级的方法进行探索性研究。在长三角、珠三角两大城市区域的演绎实证中，研究改进后的分区核心算法具有明显的层级特征和地理空间特征，更能完整地反映生产性服务业连接的社会网络特征。更为重要的是，邻近性、中间性、出度、入度等统计量得以展开，从而拓宽了生产性服务业城市网络的研究视角。

需要指出的是，本文的实证研究只针对两个城市区域进行展开，但在理论上，对3个区域生产性服务业城市网络的计算才能代表这一算法的全部过程。这是因为：当事先假定城市区域的区间网络连接只通过区域各自首位城市与全部网络中区位价值最高的核心城市进行链接时，任意两个城市之间最短路径最多发生于3个区域之间：即在任意一个公司网络j中，若两个区域的核心城市a、b之间没有链接，而必须通过第三方的最高区位价值城市i中转，最长的路径步数为4、包含了5个节点城市(图7)。以长三角、珠三角、京津冀三大城市群为例，采用分区核心算法得出的总点度中，上海(615)高于北京(580)，但是北京的出度(486)略高于上海(480)，这从一个侧面反映了北京在高级服务业方面的总部控制力。当然，实际计算过程中，中间性的实际运用会受到海量数据的制约，需要运用更为先进的计算工具和软件系统，限于篇幅，本文仅仅指出这一方法需要考虑的因素，而不再进行具体的推演。

图7 三个区域的分区核心算法图示

Fig.7 Model map of regional core cities calculating method for three regions

进一步，分区核心算法仍旧有缺陷，其不足首先来自于模型假设的限制，正如本文一开始即提出的分区核心算法的空间尺度问题，为了达到结果中更大的垂直差异性(hierarchy)，这一算法在模型中加入了区域的概念(region)，致使地理单元的选取在很大程度上就决定了模型的结果；另外，在链接路径的分析中，除了邻近性、中间性以外，分区核心算法仍有其限制，典型的统计量如网络分析中通用的群集性(即图1中三角形闭合路径的比重)同样无法计算。这表明，分区核心算法虽然对区域空间和层级有较好的反映，但在具体的分析方法上还有待改进。

当然，任何理论模型的演绎分析决定于假说前提，城市网络的结构同样受制于基础数据的计算模型，本文只不过揭开了冰山一角而已。就巨型城市区域的空间联系而言，Burger等人针对兰斯塔德地区城市联系的实证研究表明，巨型城市区域的功能联系是一种多元化的格局，城市网络的外在空间表征取决于实际的样本类型[44-45]，这也说明城市区域作为巨型复杂系统，其内、外部的空间关系远非一两种理论模型即可概括。虽然理论界对于生产性服务业城市网络的算法仍处于争议之中，但否定之否定的辩理过程在学术研究中弥足珍贵，毕竟，科学的进步往往蕴含于这种生生不息的探索和求知过程。笔者认为，后续的生产性服务业城市网络研究的一个创新途径即在于对生产性服务业企业进行田野式的调查，进一步明确城市联系发生的内在机理，在此基础上对算法进行归纳性的改进，这也是未来相关研究值得关注的方向。

标签：网络模型论文; 空间分析论文; 广州深圳论文; 邻近算法论文; 企业特征论文; 模型公司论文; 企业空间论文; 地理论文; 广州总部论文;

一种城市网络算法及其实证比较_网络模型论文

猜你喜欢