基于多智能体的城市人口分布动态模拟与预测,本文主要内容关键词为:城市人口论文,智能论文,动态论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
修订日期:2009-11.
1 引言
近年来,随着城市化进程不断推进,大批流动人口涌入城市,城市人口数量激增造成了诸多问题,如自然环境恶化、城市交通拥挤、人口密集地区服务设施滞后等等。历史实践表明,有预见性的、正确的城市人口分布规划与人民生活息息相关,是关系到本地区以及广大经济腹地长远发展的大事,更是建设和谐社会的基础。因此,对于城市人口分布的研究是城市地理学需要解决的热点问题之一。20世纪50年代以来,城市人口分布研究吸引了西方大量学者的关注,形成一系列较具代表性的理论模型。例如Clark模型[1]、城市人口与城区面积间的异速生长模型[2-3]、正态密度模型[4-5]、负幂指数模型[6]、二次指数模型等[7];20世纪80年代末期以后,随着西方多核心城市结构研究的兴起,学者们提出了城市人口密度多核心模型;在中国,近年来以冯健、周一星[8]等为代表的学者们也应用数理统计方法进行了大量的理论探讨和实证研究;谢守红、宁越敏[9]基于GIS方法对广州市人口密度分布及演化进行了研究;景楠[10]利用多智能体与GIS技术对北京市人口分布进行了预测研究。
综合以上研究可发现目前国内外进行城市人口分布的模型主要有两种:计量数学模型和基于GIS技术的多智能体模型。计量数学模型利用传统的数学统计方法对人口密度分布进行预测,应用的是传统的“自上而下”的分析过程,这类模型是一种静态模型,缺点是仅应用计量分析方法获得数值答案,不能精确反映人口密度的分布,而且不能详实的表现影响因子的作用,无法呈现动态人口密度分布状况;虽然基于GIS技术的多智能体模型具备了动态特征和空间特性,但是对于随着时间推进而变化发展的环境特征缺乏考虑。为了克服上述城市人口密度分布模型的局限性,需建立一个充分考虑影响因子与人口分布在时空变化中的相互关系且动态可视化的城市人口分布模型,将多智能体(MultiAgent System,简称MAS)与元胞自动机(Cellular Automata,简称CA)引入到城市人口分布的研究中。近年来,多智能体被广泛应用于模拟城市空间形态变化及其他地理现象变化等复杂系统中,并取得了许多有意义的研究成果:如Monticino利用多智能体系统建立了表现人类与环境交互作用的模型[11];Ligtenberg提出了结合多智能体和元胞自动机的土地利用规划模型[12-13];Benenson等把一个家庭作为一个个体,建立了Tel.Aviv城YAFFO地区的人口分布模型,利用高性能并行计算机仿真城市环境和对居民搬迁的动态模拟[14-15],之后又根据居民的经济状况、房产价格变动以及文化认同性等模拟了城市空间演化的自组织现象和城镇的居民种族隔离和居住分异现象[16]。国内研究学者如黎夏、杨青生结合多智能体与元胞自动机进行的城市用地扩张模拟,该研究很大程度上弥补了国内对多智能体与元胞自动机结合研究的不足[17]。然而目前基于多智能体与元胞自动机系统的城市人口分布动态模拟尚不多见,并且已有的多智能体研究运行环境多为静态模型,并且对于政府的总体规划与宏观政策考虑较少。本文拟以多智能体与元胞自动机理论为基础,构建动态且能描述各种智能体与影响因子互相作用的模拟系统,对城市的居住人口进行动态模拟与预测。
2 城市人口分布模型
2.1 模型概述
以人口地理信息系统[18](Topologically Integrated Geographic Encoding Referencing,简称TIGER)为基础,城市人口分布模型由3部分组成:社会环境、多智能体系统、城市人口密度。社会环境由5个数据层组成:政策规划、区位、交通、服务设施、自然环境;多智能体系统中,每一个Agent数组储存了该种类Agent的行为、位置信息、社会属性等等;城市人口密度模型包括城市人口数据、街道电子地图、街道人口密度数组。三者具有密切关系且相互作用(图1),城市人口分布模型实际上是Agent所处的城市现阶段人口分布规律,而Agent受社会环境影响,同时也作用于社会环境,改变其状态。文中的分析过程基于如下假设:①只考虑新增的规划城市用地,已有城市用地不改变;②政策的主导性单独处理;③城市人口由常住户籍人口和流动人口组成。
2.2 实验区与使用的数据
研究以长沙市城区为实验区,所使用的数据包括遥感影像数据、GIS数据、街道人口数据、文本资料等多种数据。遥感数据包括2000年及2005年长沙市区TM数据;GIS数据包括长沙市2002-2020年的城市总体规划图、交通结构图以及学校、医院、商业用地等服务设施分布图;文本资料包括长沙市土地利用总体规划(1990-2010),长沙市城市总体规划(2001-2020),统计数据主要出自长沙市2002-2008年统计年鉴及第五次人口普查数据。应用Vb.net2003与Arc Object 构建系统,为提高系统运行速度,所有空间数据在ArcGIS9.2中统一转换成100m×100m的Grid栅格数据。
2.3 城市人口密度
城市人口密度的表示参考数字人口模型[19],将居住区域按设定的原则和方法划分为100m×100m的格网,将2000年以及2005的实际人口密度输入相应到格网上。模型总体上可以分为以下几类(表1):单核心模型的对数模型、Clark模型、Smeed模型、Newling模型及多核心模型。
图1 多智能体城市人口分布模型框架
Fig.1 Framework of urban population distribution model based on MAS
以长沙市作为研究区,将2000年及2005年长沙市49个街道的人口数据进行单核心拟合,芙蓉中路和五一大道交界处作为城市中心,半径取1.5km为间隔距离做若干同心圆,综合考虑实验区的面积和形态,最大半径为12.5k m,共8个环带。采用GIS方法计算各环带的平均人口密度,测算出各个环带所包含或穿过的街镇的面积,再乘以该街镇的人口密度,对其求和,再除以所包含或穿过的街镇面积之和,即为各环带的平均人口密度。计算公式如下:
式中:Den表示环带的平均人口密度,Area为环带所包含或穿过的i街的面积,Pop为i街镇的人口密度,n为环带所包含或穿过的街镇数量。
获得2000年及2005年长沙市人口密度与距离的数据矩阵(表2),使用SPSS13.0软件对上述几种典型的人口密度模型进行单核心模型拟合,结果见表3。参数a表示城市中心人口的理论值,参数b的绝对值表示人口密度随距离衰减的斜率,结合这些参数的变化可以分析长沙市空间结构的演化趋势。
Clark模型在这两个年份中拟合效果最好,模型的斜率有逐年降低之势,由2000年的0.220减至2005年的0.187,而城市中心的理论人口持续增长,这表明长沙市城区人口分布仍向中心区靠拢,但趋于均匀。适用于描述城市边缘与腹地人口密度变化的Smeed模型拟合度较差,这也说明长沙市郊区化整体发展不明显。
长沙市2000年、2005年人口密度模型将作为多智能体城市人口分布模型运行的初始状态,Agent在社会环境和长沙市人口密度模型下进行动态的仿真,2000年长沙市区常住人口175万,家庭数量在60万左右,还有大量的流动人口,不可想象对等设计相同的agent数量,因此以地块为agent的设计,模型中居住区16260个地块,几千个agent就足够了,仿真压力大大减轻,模拟将反映长沙市人口分布动态变化的结果。
2.4 社会环境的设计
社会环境由两个静态图层和三个元胞自动机图层构成:政策规划图层、自然环境图层、交通通达度元胞自动机、服务设施元胞自动机、区位压力元胞自动机。通过一个移动的5×5窗口来捕捉各个图层与Agent的相互作用,将该移动窗口应用到所有数据图层,同时将多层属性数据存储在对应的Agent的属性数组中,做出考虑所有影响因子综合评价。
本文中选择了logistic方法来自动获取CA的转换规则[20],包括高速公路、一级干道、二级干道、服务设施及距市中心的距离。获得的规则如下:
(1)服务设施元胞自动机。城市服务设施状况是居民选择居住地的重要因素之一。本文收集到的服务设施用地包括公路用地、特殊用地、村民点、闲置地、社会停车场、港口用地、铁路用地、交通设施、供应设施、其他市政设施、施工维修、殡葬设施、环卫设施、邮电设施、危险仓储、堆场、普通仓储、商业用地、市场、体育设施、其他公建、办公用地、医疗卫生、教育用地、文化娱乐、文物古迹、科研设计、小学、中学。考虑到现状,将小学、中学及商业用地和医疗卫生用地作为更侧重的商服设施,其余作为基础设施。建立以上数据图层,采用到服务设施的距离指数衰减函数来表示(i,j)位置的服务设施质量。
(2)交通通达度元胞自动机。交通通达度是城市现代化建设水平的重要标志,市区交通通达度对市区繁华度、居民生活和工作方便程度有直接影响,体现出行便捷的程度一般用两种方式:一是到道路的距离,本文中将道路分为高速公路、一级干道、二级干道;二是计算道路的面域内人均道路密度。
本文采用指数距离衰减函数来反映交通通达度:
(3)政策规划。在城市发展和人口聚集过程中,政策规划起着重要的影响作用,引导了整个城市的演化过程,也决定了城市发展模式。将长沙市2020年土地利用规划作为补充,将政策与规划在相应的区域划出做为叠加图层。
(4)自然环境。自古至今人们对于居住区域的自然环境就有要求,将山林地、公共绿地、水体作为自然环境因子,采用指数距离衰减函数来反映自然环境状况:
(5)区位压力元胞自动机。在单核心城市发展中,假设距离市中心越近的地块其房价、就业等压力越大,文中使用简单的距离因子表示综合压力,而随着市中心人口逐渐增长,其房价、就业压力必然会增长,因此区位压力元胞会随着区域内人口的增长而生长:
2.5 多智能体综合决策规则
智能体,即在元胞中活动着的有智能的个体。本模型尝试对Agent进行适当的抽象与描述,模拟各类Agent探测到社会环境信息并对此做出反应,以及社会环境信息影响Agent之间的行为。研究共设置了三大类智能体:一类是流动人口智能体,另一类是户籍人口智能体,第三类是政府智能体。根据历年长沙市统计年鉴(2002-2008)数据设置城市人口智能体的初始属性,在各个街道内加人流动人口与户籍人口智能体,将人均可支配收入、消费支出比重等数据输入Agent数组中保存。政府Agent一方面起到宏观调控的作用,另一方面在特定区域执行政府主导的指向性影响。
户籍人口Agent以每年末公安户籍记录为统计基础,不包括本地户籍但长期在外地居住的人口,因为分布比较流动人口Agent稳定,模型中户籍人口的区位选择与决策采用L.A.Brown和E.G.Moore模型[21]。对每年的长沙市商品房成交套数、户籍人口数量及居民对住房消费的投入进行分析,户籍人口Agent每5-10年产生一个是否搬迁的概率。流动人口Agent则是城市人口流动的推动力,在这一过程中,一方面流动人口Agent希望所居住的区域靠近工作地点,以使生活更加便利,另一方面希望可以尽量减少花费,减轻生活压力。因此,流动人口Agent将参考区位压力图层信息,选取区位压力作为评价指标,随时产生是否搬迁的概率。
模型在居民人口智能体追求最优解假设的前提下,考虑动态随机效用模型[22]和离散选择模型[23],智能体每一步仿真及其行为都按照如下步骤进行:
(1)寻找适宜的居住地。在一个自组织的人口分布系统中,人口分布变化是与周围环境互动的变化过程。在这个过程中,过去的Agent通过与环境之间的相互作用来影响未来的Agent行动,智能体根据自身的要求与实际情况寻找适宜居住地,智能体搬迁后,使搬迁前所在街道的人口数减少,搬迁后所在街道的人口数增加。对坐标(i,j)地块及周围二十五公顷面积地块的人口密度和综合评价进行模拟计算。表达式为:
将长沙市2000年街道人口数据带入模型,重建2005年城市人口分布。由于户籍人口与流动人口有各自的评价偏好,在模拟结果和实际结果数据矩阵中采用多准则判断模型(MCE)求出影响因子的主观偏好权重,采用熵值法修正各个影响因子的权重[24](表4),熵是信息论中关于“不确定”的度量,信息量越大,不确定性就越小,熵也越小,其权重影响因子也越稳定。
图2 2005年长沙市人口密度分布模拟结果与实际情况对比图
Fig.2 Comparison of simulation result of Changsha population density distribution with actual distribution,2005
(2)智能体的生长。在模拟中,根据该年人口自然增长率增加智能体数量,其随机地分布在所出生的街道内,并赋予其初始属性,但不进行移动。
(3)智能体的消亡。根据该年人口死亡率随机设置智能体消亡,反馈到城市人口密度模型,将其消去,相应的人口数减少。
(4)更新社会环境。更新各街道人口数、区位压力元胞自动机。
3 模拟应用及结果分析
3.1 模型精度与相对误差检验
在模型中使用2000年长沙市街道人口密度数据对2005年长沙市城市人口分布进行空间重构,取运行结果与实际情况做对比,验证模型的适用性。城市人口分布状况是错综复杂的,包含许多偶然因素,因此完全准确的模拟其动态分布变化是不可能的[25-26]。目前尚无统一的标准与方法评价模型模拟精度,一般是采用逐点对比统计检验[27]。编写程序以数字人口模型标准将2005年长沙各个地块的人口密度模拟数据和实际情况数据逐一以文本格式导出,在SPSS中进行统计,单个地块人口密度预测结果取大于等于80%作为精度标准,城市居住区共16260个地块,其中13206个地块的相对误差在20%以内,整体预测精度达81.22%。这说明多智能体人口分布模拟模型的精度是可接受的(图2)。
宏观上,模型在模拟过程中充分体现了其运行结果的客观事实性与运行过程的可操控性,而五层元胞自动所构成的社会环境也真实的影响了城市人口分布。如2005年模拟结果中(图2),长沙市高新开发区处于距离市中心9~13km的西北环层内,交通干线与服务设施仍在建设中,但其人口密度增长速度远远超过周边地区(图3),成鹤立鸡群之势,这与2000年至2005年长沙市城市总体规划的政策指引密切相关。
图3 政策因素在2005年长沙市人口密度分布模拟结果中的体现
Fig.3 The policy factors in simulation results of changsha population density distribution.2005
图4 长沙市区未来人口密度分布预测
Fig.4 Population density distribution prediction in Changsha urban area
3.2 2010年-2015年长沙市区人口密度分布预测
根据2005年长沙市区街道人口统计资料,以2005年土地利用现状数据、城区交通图为依据,将长沙市土地利用总体规划(1990-2010)、长沙市城市总体规划(2001-2020)和政府工作报告作为政策指导文件,对2010年及2015年长沙市区人口分布情况进行预测(图4)。
由2010-2015年长沙市区人口分布预测结果发现:①长沙人口密度分布仍长期呈典型Clark分布,市中心人口处于高速增长状态,五一大道东西向贯穿的街道人口密集;②政策因素对于地区发展和人口分布的影响显著,由咸嘉湖街道、望城坡街道组成的高新技术开发区人口密度增速明显;③人口分布高峰向距市中心5~8km环形范围发展,天心区的城南街道、雨花区的左家塘街道、高桥街道、芙蓉区的韭菜园街道以及开福区的清水塘街道形成了长沙市人口高度密集的第二个环层;④长沙市在发展过程中,侧重改善了沿湘江畔的生态环境,因此“沿江风光带”沿岸的通泰街街道、坡子街街道、书院街街道书院路街道形成了新的人口密集区;⑤城区以外的广大地域,尽管许多街道人口数量获得增长,但人口密度增长缓慢,这也是长沙尚未步入城市人口郊区化分布的例证。针对这个情况,政府应提高市中心的交通运输能力,合理规划,并加快近郊基础设施建设以减轻人口过度密集造成的不利结果。
4 结论与展望
本文在多智能体系统(MAS)、元胞自动机(CA)环境及城市人口密度模型支持下,模拟了户籍人口Agent、流动人口Agent、政府Agent在城市人口分布中的决策行为及决策规则,构建了动态且能描述多种影响因子与多种Agent相互关系的多智能体城市人口分布模型,智能体根据自身偏好对居住位置的交通通达度、服务设施、自然环境以及区位压力评价,进而调整期在城市中的居住地,整个城市的人口也因此不断的发生变化。
将长沙市区作为实验区应用于模型中,结果表明,多智能体城市人口分布模型与城市人口实际分布情况的基本特征和规律是吻合的。根据政策规划对2010年及2015年的长沙市人口分布情况进行了预测,预测结果表明:长沙市未来将形成“市中心人口快速增长,近郊区人口缓慢增长,沿湘江畔、沿五一大道及岳麓区高新技术开发区人口密集”的格局,即人口郊区化缓慢,人口增长过程中的相似性大于差异性,市区内仍将长期呈现单核心聚集人口增长高峰。
然而对人口是否搬迁的评价没有统一的标准和固定的变量,因此参数确定还是具有一定的主观性,导致模型本身及模拟结果都存在一定的不确定性,而且研究中受时间和资料的限制,本研究只考虑了户籍人口Agent、流动人口Agent、政府Agent三类智能体的相互作用,社会环境只考虑了政策、区位压力、交通通达度、服务设施和自然条件对智能体选择居住地的影响。Agent的属性特征需要更加全面的扩充,以保证实现真实、自然的决策行为过程,并且提高模型的预测精度和应用能力,这将是进一步研究的方向。
本文引用格式:
肖洪,田怀玉,朱佩娟,等.基于多智能体的城市人口分布动态模拟与预测.地理科学进展,2010,29(3):347-354.