离散选择模型研究进展,本文主要内容关键词为:研究进展论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
修订日期:2015-07 引用格式:王灿,王德,朱玮,等.2015.离散选择模型研究进展[J].地理科学进展,34(10):1275-1287.[Wang C,Wang D,Zhu W,et al..2015.Research progress of discrete choice models[J].Progress in Geography,34(10):1275-1287.].DOI:10.18306/dlkxjz.2015.10.008 1 引言 离散选择模型(Discrete Choice Model,DCM)自提出以来,已逐渐发展成为研究个体选择行为最为有力的工具。从最基本的多项Logit模型起步,随着研究问题的复杂化和模型设定的精细化,目前已建构了包括一系列模型在内的较为完整的理论体系,并在实践中广泛应用。国外有关离散选择模型的研究成果十分丰富,系统性介绍经典模型方法的著作可见于Hensher等(2005)、Train(2009)、Green(2012)。此外,还有大量文献从不同理论视角和众多应用领域推动模型在广度和深度上的不断发展(Ben-Akiva et al,1985;Zwerina,1997;McFadden,2000; et al,2005;Borgers et al,2005,2006;Chintagunta et al,2011;Müller et al,2014)。 国内对离散选择模型的研究起步较晚,理论层面的专著仅见于关宏志(2004)的基础性介绍。近年来相关研究成果的数量不断增长①,在地理学和空间研究方面的应用也越来越多,研究内容包括居民购物行为选择(张文佳等,2009;马静等,2011),通勤行为选择(陈梓烽等,2014),消费者在商业空间中的活动选择(朱玮等,2008;蔡嘉璐等,2011),参观者在的大型活动中的行为选择(王德等,2009,2015),人口居留和居住、就业选择(郑思齐等,2004;赵艳枝,2006;余建辉等,2014),自行车使用与路径选择(朱玮等,2012;潘晖婧等,2014)等。虽然取得了诸多进展,但整体上仍以简单Logit模型的直接应用为主,理论基础相对较弱,精细化程度不足,远未发挥模型体系整体的强大能力,难以针对特定问题选择最合适的模型形式。聂冲等(2005)曾对离散选择模型进行过研究综述,包括对模型基本原理的阐述,并简要回顾了一些经典模型在理论上的发展。在综合以上研究的基础上,本文一方面重点分析各经典模型的适用性,旨在加深理解,提高应用研究的理论科学性;另一方面继续拓展理论综述的范围,进一步关注国外理论发展的其他热点和新动向。 2 离散选择模型基础 2.1 一般原理 离散选择模型的一般原理为随机效用理论(random utility theory):设选择者有J个备选项,分别对应一定的效用U,该效用由固定与随机两部分加和构成,固定效用V能够被一定的可观测要素x所解释,而随机部分ε代表了未被观测的效用及误差的影响。选择者的策略为选择效用最高的备选项,那么每个备选项被选中的概率可以表示为其固定效用的函数:P=F(V),函数的具体形式取决于随机效应的分布。在大多数模型设定中,可见效用V被表述为解释要素x的线性组合形式,即V=βx,β为系数,其取值和显著性水平可由观测数据估出。 2.2 应用价值 离散选择模型的应用领域广泛,其中市场与交通是最主要的两个方面。市场研究中经典的效用理论和联合分析(conjoint analysis)方法与离散选择模型有直接渊源,其研究主题亦与模型高度契合,即通过分析消费者对不同商品、服务的选择偏好,测度、检验、预测市场需求(Zwerina,1997; et al,2005;Chintagunta et al,2011)。在交通领域,利用离散选择模型分析个体层面对目的地、交通方式、路径的选择行为,进而预测交通需求的方法,比传统的交通小区层面的集计方法具有显著的优势,已成为研究前沿(Ben-Akiva et al,1985;McFadden,2000)。此外,地理、环境、社会、空间、经济、医学、教育、心理等领域的应用研究亦较多见。 离散选择模型的主要价值包括以下3个方面: (1)揭示行为规律。通过对β估计值的符号、大小、显著性的分析,可以判断哪些要素真正影响了行为,其方向和重要程度如何。对于不同类型的人群,还可以比较群组间的差异。 (2)估计支付意愿。一般通过计算其他要素与价格的系数之比得到该要素的货币化价值,该方法也可推广到两个非价格要素上。值得注意的是,有一类研究通过直接向受访者抛出价格进而征询其是否接受的方式,估计个体对物品、设施、政策的支付意愿,这种被称为意愿价值评估(contingent valuation method,CVM)的方法广泛应用于对无法市场化的资源、环境、历史文化等的评价,应用案例有:Breffle等(1998)对未开发用地、Treiman等(2006)对社区森林、Báez-Montenegro等(2012)对文化遗址价值的研究。 (3)展开模拟分析。一般以“what-if”的方式考察诸如要素改变、政策实施、备选项增减等造成的前后差异,或是对方案、情景的效果进行前瞻。例如,Yang等(2010)模拟了高铁进入后对原有交通方式选择的影响;Müller等(2014)模拟了两种不同的连锁店布局方案分别的经济效益。以上模拟都是在集合层面上进行的,相比之下,个体层面的模拟更加复杂。有的研究基于个体的最大可能选择,例如Zhou等(2008)对各地用地功能变更的推演模拟;更多研究是借助蒙特卡洛(Monte Carlo)方法进行随机抽样,例如Borgers等(2005,2006)分别在宏观、微观尺度下对行人在商业空间中连续空间选择行为的模拟。 2.3 基础模型形式:多项Logit模型 多项Logit模型(multinomial logit model,MNL)是最简单的离散选择模型形式,它设定随机效用服从独立的极值分布,此时的选择概率函数为: 式中:解释变量x可以是选择者的个体社会经济特征,也可以是备选项的属性。一些研究和软件将二者加以区别,认为MNL模型只处理前者,而处理后者的则被称为条件Logit模型(conditional logit model,CL)。但Greene(2012)认为二者的区别没有实际意义,因此在本文中统称为MNL模型。 MNL模型是整个离散选择模型体系的基础,在实际中也最为常用,一方面是由于其技术门槛低、易于实现;另一方面也与其简洁性及由此带来的稳健、通用性,表现为样本要求低、技术成熟、出错率少等分不开的(Ye et al,2014)。虽然MNL模型存在的固有理论缺陷(如假设随机效用独立),使得在一些复杂问题上采用更加精细化的模型更为适宜,但根据Hensher等(2005)的看法:前期应以MNL模型为框架投入50%以上的时间,将有助于模型的整体优化,包括发现更多解释变量、要素水平更为合理等。可见,MNL模型尽管较为简单,但其基础地位在任何情况下都举足轻重,应当引起研究者的高度重视。 3 离散选择模型的精细化 3.1 嵌套Logit模型 3.1.1 模型的提出与理论架构 嵌套Logit模型(nested logit model,NL)主要针对MNL模型中不合理的随机项独立假设而提出,该假设否定了备选项间可能存在的相关性,因而会导致所谓的“无关选项独立”(Independence from Irrelevant Alternatives,IIA)效应,使得当一个选项的选择概率发生变化时,剩余所有备选项对它具有无差别的替代性。然而,一般认为越相似的备选项之间替代性越高,因此在相关性显著存在时,IIA特性明显与现实不符,会产生诸如“红蓝巴士问题②”的谬误。 嵌套Logit模型则接受备选项间的相关关系,并以此为依据建构一个树形结构:从顶端的备选项全集开始,将彼此相近的备选项分入第二层的若干子集中,必要时还可以进一步细分至三层及以上。同层子集互不重叠、上下层子集之间逐级嵌套。在这样的结构下,同一子集内部仍保持IIA效应,但不同子集之间则不复存在,由此得到的替代模式可以更真实地根据备选项相关性的不同而不相同。 3.1.2 处理相关性与替代模式问题 回顾嵌套Logit模型的应用研究,可以明显看到其最主要的出发点在于希望妥善处置备选项中的相关性。例如,McFadden(1978)开创性地在住宅选择模型中通过设置嵌套结构而允许同一社区内住宅之间存在相似性;De Dios Ortúzar(1983)在交通方式选择的研究中按个体交通与公共交通划分子集,并通过与MNL的对比体现了嵌套Logit在拟合优度和预测可靠性上的优势;更复杂的3层嵌套Logit模型如Lo等(2004)对出行者换乘路径的研究,其分别按照换乘交通方式和换乘点的不同对备选路径进行了两次划分。 嵌套Logit建模的关键无疑是树形结构的合理确定。在Suárez等(2004)在对购物中心选择的研究中,认为消费者首先选择的是具有“锚固作用”的大型超市,然后再在拥有特定超市的购物中心中作出选择,这样的设定使得实体层面处于上层的购物中心和处于下层的超市在模型中发生了层次颠倒,这一方面体现了嵌套Logit模型的灵活性;另一方面也反映了树形结构设定对于理论假设的依赖以及相应承担的假设合理性风险。对此,Hensher(1999)提出了一种用于寻找最优树形结构的方法。Rasciute等(2010)在利用嵌套Logit模型分析外国资本对中东欧13个国家的投资选择时应用了这一方法,发现其结果与基于历史、地理、文化、语言等直觉假设划分子集相比明显更优;进一步分析发现,该方法抓住了上述13个国家在更为切题的经济发展上的本质差异。 值得注意的是,有一种形式固定的嵌套Logit模型对树形结构的理论假设要求很低,同时又有着广泛的应用,即:当选项中包含“以上都不选”时,考虑到它的特殊性,常将其单独设为一个子集,而其他所有选项进入另一个子集。例如,Montgomery(2002)在分析学校选择行为时,把具体的学校备选项与“不入学”分别归入两个子集;Schmidheiny等(2011)在分析商业区位选择时,把各个区位备选项与“不进入”分别归入两个子集。理论层面上,这种设定的必要性最早由Haaijer等(2001)提出,并由Goos等(2010)作了进一步发展,后者还提出了针对带“都不选”备选项的嵌套Logit模型的选择实验设计方法。 3.1.3 处理数据合并问题 嵌套Logit模型的另一重要应用价值是数据融合。当有多个数据源时,一般认为它们不可能满足MNL所要求的“同分布”假设,此时采用嵌套Logit模型在理论上更为适宜和规范。最为典型的非同源数据是从实际选择中观察到的显示偏好数据(revealed preference,RP)以及通过虚拟选择实验获得的陈述偏好数据(stated preference,SP),因此,嵌套Logit模型大量应用于RP与SP数据的融合上。Hensher等(1993)较早提出了被其称作人造树形结构的RP/SP融合方法,即对每个RP选项各自形成一个子集,而将所有SP选项集合于一个子集之中;Louviere等(2000)提出了一个等价但更为直观的结构,用两个子集分别包括全部RP与SP选项。在应用层面,最常见的无疑是处理两个数据集的“RP+SP”融合模式(Espino et al,2007),而其他模式同样也是可行的,只需对树形结构作相应扩展即可。例如,De Dios Ortúzar等(2008)增加了一组先前收集的SP数据,形成“RP+SP1+SP2”的模式;Adamowicz等(1997)收集了两组RP数据,进而尝试了“RP1+RP2”、“SP+RP1+RP2”等多种模式。 3.1.4 一般化形式:GEV模型体系 应当指出,嵌套Logit模型相对于MNL模型只是部分放开了对备选项相关性的限制,这一限制的完全放开将产生一般极值模型(generalized extreme value model,GEV)。因此,嵌套Logit模型实际上是GEV模型的一个特例,较之更具一般性和灵活性的还包括交叉嵌套Logit模型(cross-nested logit model,CNL)、成对组合Logit模型(paired combinatorial logit model,PCL)、广义嵌套Logit模型(generalized nested logit model,GNL)等,其中以CNL模型的应用最为广泛。CNL模型不同于嵌套Logit之处是允许子集之间存在重叠,即一个备选项可以从属于多个子集,因为它可能在不同的维度下与不同子集的备选项具有相关性。例如,Papola(2004)在研究路径选择行为时依照公共路段划分子集,使得路径I可以与路径J因共享前半程路段ij而从属于子集B[,ij],同时又与路径K因共享后半程路段ik而从属于子集B[,ik];Hess等(2012)在研究低碳环境下的购车选择时,认为备选车辆按车型与燃料类型的相关性均可建立独立的树形结构,而将两个维度相结合即形成了交叉嵌套结构。除CNL模型之外,PCL模型将任意两个备选项成对组成一个子集(Koppelman et al,2000),GNL模型则设定每个备选项与每个子集都通过一个分配系数而建立不同程度的从属关系(Wen et al,2001),这些模型都给研究者以更大的自由,但由于理论相对复杂,实际应用还较为有限。 3.2 混合Logit模型 3.2.1 模型的提出与理论架构 混合Logit模型(mixed logit model,MXL)主要针对MNL模型忽略个体异质性、无法处理随机偏好差异的不足而提出,与MNL中的恒定系数相区别,MXL模型允许解释变量的系数是随机的,因此又可称为随机系数Logit模型(random parameter logit model,RPL)。具体而言,通过设定模型系数服从于一定的分布,可以估计出相应的分布参数,典型者如均值与标准差,前者反映了平均偏好大小,后者则反映了偏好差异的幅度。 同时,混合Logit模型还可以妥善处置各种复杂的相关性。这是由于个体随机偏好的引入使得作为误差的随机效应因有了新的成分而不再独立,因此,以处理相关性为主要目的的混合Logit模型有时也被称为误差成分模型(error components model,ECM)。与嵌套Logit模型相比,混合Logit模型中的相关性虽然没有树形结构那么直观,但却灵活得多;事实上,Brownstone等(1998)证明了前者在一定程度上只是后者的特例;McFadden等(2000)进一步指出混合Logit模型可以模拟出一切基于效用最大化假设的选择模式。 3.2.2 处理随机偏好问题 总体而言,应用研究中选择混合Logit模型最主要的出发点是对随机偏好差异的考虑。例如,Hess等(2005)在研究机场选择行为时,通过混合Logit模型发现人们对时间敏感性的差异显著;Lijesen(2006)将模型应用于意愿价值评估,获得了对机场航班频次的差异化价值判断。Lindberg等(2012)在对旅游设施选择偏好的研究中,运用混合Logit模型比较了偏好的系统差异(当地居民与游客之间)和随机差异,同时特别指出哪些要素没有显著差异,即系数可以被视作固定,从而尽可能全面地获得偏好规律。 上述研究只是通过估计偏好系数的标准差实现了简单的随机化,然而对于每个特定的选择者而言,个体偏好系数仍是未知的。事实上,如果与选择者已知的实际选择结果相结合,那么是可以进一步开展个体级别估计的(Train,2009),这也是混合Logit模型的一项独有优势。既有应用研究表明,上述个体估计能够提供丰富的信息。例如,Greene等(2005)、Hess(2007)在各自对交通方式选择和航班选择的研究中,均估计了个体层面的时间价值,并且一致认为该结果的精确性较整体估计有很大提升;Campbell等(2009)在研究居民的政策选择行为时,从估计的个体系数中找出过大和过小的离群值,进而发现现有随机偏好差异很大的部分原因是由少量的“极端偏好个体”造成的;Hess等(2010)为分析受访者在选择实验中是否忽略了某些要素,利用每个受访者个体系数的估计值和标准差计算变异系数,以推断实际的要素忽略情况,结果表明,推断情况相比于受访者的陈述情况更加真实。此外,为便于技术推广,Hess(2010)还编写了独立的个体估计程序,填补了大多数建模软件中该项功能的空白。 3.2.3 处理各种相关性问题 另一些研究应用混合Logit模型的理论出发点是对相关性的考虑,首先即是类似于嵌套Logit模型中出现的备选项相关和相应的替代模式问题。例如:Jou等(2011)在研究到达机场交通方式的选择时,发现大运量捷运系统的引入对个体机动交通的替代性明显高于其他公共交通;Behrens等(2012)在设定两地间交通方式的选择模型时加入两种误差成分,分别代表了两种不同的相关结构;Hayakawa等(2014)在研究跨国公司投资的区位选择时,通过与3个不同结构的嵌套Logit模型相对比,发现混合Logit模型可得到类似的投资地替代模式,而且由于嵌套Logit模型的树形结构合理性难以定论,因此,混合Logit模型的结果应更加精确。 除了备选项之间的相关之外,也有研究关注面板数据相关问题,即在重复选择背景下,同一个体多次选择之间的“情景相关”。典型的重复选择情景通常有两种可能:一种是通过多期重复调查获得的RP数据,另一种是几乎所有的SP数据(绝大多数要求被访者完成多次选择)。在Sarma等(2007)基于多年期RP数据对老年人选择养老方式的研究,以及Feo等(2011)基于SP数据对货运方式的研究中,均采用混合Logit模型处理面板数据相关。此类研究中一般假设个体在多次选择中的偏好保持不变,但也有学者对此提出质疑,具体可见于Bhat,Gossen(2004)对游憩活动类型的选择、以及Hess,Rose(2009)对路径选择的研究。这类模型中的误差成分设定更加复杂,虽然使模型更加精细化,但大大增加了建模与估计的难度。 此外,混合Logit模型还可以估计随机系数之间的内在相关性(inter-coefficient correlation),即回答如下问题:当影响选择的某些要素权重较高(或较低)时,另一些要素的权重是否同时较高(或较低)。这一问题在MNL模型中是没有意义的,因为每个权重系数都只有唯一的估计值,彼此不可能建立相关关系。而在混合Logit模型中,由于随机系数在不同个体之间是各异的,因此可以得到有效解决。一种简单的途径是通过前述的个体级别估计获得每个选择者的系数,进而直接计算相关系数。Hess(2007)利用这种方法在研究航班选择时发现,几乎所有的随机系数之间均具有显著的相关性,典型如时间系数与价格系数之间呈现负相关,更好地揭示“人们对时间越看重,对价格就越不看重”的直觉特征。 最后在数据合并问题上,混合Logit模型是嵌套Logit模型之外对RP/SP数据联合估计的另一主流方法。通过一定的随机系数设置,不同数据源分布不同的问题可以直接得到控制,具体应用可见于Bhat等(2002)、Brjesson(2008)等的研究。Hensher等(2008)通过与嵌套Logit模型相对比,论证了混合Logit模型在应用于RP/SP数据合并上的优势,是备受推荐的方法。 3.2.4 衍生形式:潜在类别模型 与混合Logit模型一样,潜在类别模型(latent class model,LC)也是针对随机偏好差异问题而提出的(Greene et al,2003),其处理方式是将选择者划分为几种类别,分别适用不同的系数。需要注意的是,每个选择者的所属类别不是人为划定的,而是由模型自动计算其属于每一类的概率,这与一般的样本细分估计明显不同,也是“潜在性”的体现,其优点为:①可以判断类别之间是否有显著差异,即分类是否有意义;②避免了人为样本细分中分界点的确定较武断的弊端。 在应用研究中,潜在类别模型以其高度的实用性成为分析随机偏好差异的有力工具,尤其在关于人群细分的研究中成为主流方法。例如,Teichert等(2008)改进了航空公司现有的“商务—经济乘客”划分法,用潜在类别模型得到了一个更加全面和准确的五类别体系;Wen等(2010)论证后发现与MNL模型相比,潜在类别模型由于考虑了类别间差异,因而在产品替代弹性分析和市场模拟预测上要准确得多。作为处理偏好差异的两个主要工具,潜在类别模型与混合Logit模型经常被相互比较,总体而言,虽然二者的结果较为相似(Hole,2008),但多数研究认为潜在类别模型在拟合性、理论基础、信息丰富度等方面略优于混合Logit模型(Shen,2009;Hess,Ben-Akiva et al,2009;Varela et al,2014),其强大的分析能力应当得到进一步重视。 3.3 多项Probit模型 当设定离散选择模型中各备选项的随机效用服从多元正态分布时,即得到了多项Probit模型(multinomial probit model,MNP)。由于完全摆脱了MNL模型中独立同分布的限制,MNP模型的自由度极高,可以通过对协方差结构的设置解决相关性、替代模式、随机偏好差异等几乎所有主流问题(Train,2009)。例如,Yai等(1997)在研究路径选择时,以两两路径之间公用路段长度所占的比例作为衡量其相关性的特征指标,从而建构了一种类似于交叉树形结构(Papola,2004)的相关模式。如果没有预设结构,MNP模型同样会根据数据的实际情况自动匹配相关模式,因此仍能发挥上述优势。例如,Johansson等(2006)在研究交通方式选择时,纳入了舒适性、方便性等难以直接观测的复杂变量,为此相应地采用MNP模型作一般化自动处理;Jumbe等(2011)在研究居民对三种薪材来源的选择时,借助一个通用的MNP模型发现彼此之间的替代弹性差异很大,以此为基础对环境政策的效果进行了探讨。 尽管MNP模型具有诸多优势,但也存在以下两个主要弊端:一是所谓的识别性(identification)问题,即研究者对相关结构的设定不合要求,导致模型无法估计。例如,Bunch等(1989)在对7篇文献中的MNP模型进行回顾时,发现有近一半不可识别;Dow等(2004)认为MNP模型经常具有难以发现的弱识别性,并且可能导致显著性水平被拉低、结果违反直觉等问题。二是模型估计的运算量随着备选项个数的增加而迅速膨胀,因此MNP模型一般只适用于备选项较少的选择,虽然估计方法在不断进步,但迄今仍是制约MNP模型推广的主要障碍。 4 离散选择模型研究的新动向 上文回顾总结了离散选择模型理论研究的经典形式,除此之外,近年来的研究还聚焦于其他一些值得重视的议题,主要有以下几方面。 4.1 多种模型形式的结合 从第3节的讨论可以看到,嵌套Logit、混合Logit、多项Probit等经典模型具有各自的适用性。在更复杂的问题面前,一些研究试图将不同模型形式结合起来,各取所长,发挥联合优势。例如,Teye等(2014)在研究收费路径选择时建立了一个混合嵌套Logit模型(mixed nested logit model),以更方便地同时设置选项间相关性和随机偏好差异;Wen等(2012)在研究交通方式选择中出于同样的考虑,将树形结构与分人群估计相结合,建立了一个潜在类别嵌套Logit模型(latent class nested logit model)。类似的研究还包括潜在类别混合Logit模型(Greene et al,2013)、混合多项Probit模型(Bhat et al,2011)等。 4.2 不同类型的选择数据 4.2.1 RP数据与SP数据 许多研究关注于RP与SP这两种不同数据类型对离散选择模型的影响。一个共识性观点是两种数据各具优缺点:RP数据的优点集中体现在真实性上;而SP数据的优点包括允许实际中不存在的选择场景、保证备选项间的足够差异、可通过实验设计避免要素间的相关性、省时省力等(Louviere et al,2000)。由于这些优点,SP方法的应用非常广泛。然而,一些研究也指出单独使用SP数据的风险,例如,Brjesson(2008)通过与RP数据的对比,认为SP数据缺少长期的行为适应性和各种潜在约束,具有更多的偶然性和短视性,容易导致结果的极端化,由此得出SP方法可能不那么值得信任的结论;Hensher等(2010)对52篇交通方式选择文献中的245个模型结果进行了比较,发现由单一SP数据得到的价格弹性明显偏高,是RP数据或RP/SP混合数据结果的3倍。此外,在针对SP数据的虚拟实验设计方法上,除传统的正交设计法外,一些高效设计(efficient design)方法近年来发展迅速,其突出优势是题量更少,每次选择的信息量和效率更高,且可以与后续拟采用的具体模型相结合,更具针对性。 4.2.2 定序、排序、多选数据 除了常见的无序单选数据之外,还有一些其他类型数据也可用于离散选择模型中,如定序(ordered)、排序(ranked)、多选(multiple choices)数据。 定序数据是指从多个具有次序关系的备选项中选出一个,典型如满意度评价、等级划分等。面向定序数据已经形成一系列相对独立的模型,主要为定序Logit模型(ordered logit model)和定序Probit模型(ordered probit model),更复杂的还包括考虑随机系数的混合定序模型(mixed ordered model)和考虑多次定序选择之间关系的多变量定序模型(multivariate ordered model)等。大多数定序模型的建模与估计十分简便,因此得以广泛应用。例如,Li等(2012)用定序Probit模型研究了骑行者对骑行环境的评价;Ferdous等(2010)用多变量定序Probit模型研究了居民对30种游憩活动模式的频率选择的关系。 排序与多选数据的建模思路相似,均是将一次观察结果拆分成多次“伪选择”,以共计J个备选项为例:对于排序数据,首先从全集中选中第一位备选项,然后将其剔除,再从剩余的子集中选中第二位备选项,依次类推,直至选择集中只有两个备选项,由此共拆分成J-1次选择;对于多选数据,则依次独立审查每一个备选项是否被选中,共拆分成J次二项选择。通过上述方法备选后即可直接应用经典的离散选择模型,其中面向排序数据的常被形象地称为爆炸Logit模型(exploded logit model),面向多选数据的则常称为多维二项Logit模型(multidimensional binary logit model)。在应用案例上,Kumar等(2007)分析了居民对多项森林价值的排序偏好数据;Lee等(2012)分析了游客在目的地选择时的多选数据。 4.3 基于受限理性的选择 前述各种模型均建立在完全理性个体实现效用最大化的假设上,它暗示了个体掌握被纳入模型的所有相关信息,并拥有充分的认知和处理能力以获得最优结果。然而在现实中,这种假设显然是不准确的,因为人们受主客观条件的限制,处理信息的能力有限,因此会以牺牲一部分精确性为代价减少问题的复杂度,降低决策成本。例如,个体在面对众多备选项和影响要素时,可能会通过若干要素的取舍点(cut-off)快速排除大量“越界”的选项,类似这种“一票否决”的决策机制包括连结式(conjunctive)、非连结式(disjunctive)、字典序(lexicographic)等③(Zhu et al,2008),它们的共同点是要素之间的非补偿性,即一个要素的效用损失不能被其他要素的效用收益所平衡。显然,非补偿性机制不能保证总体效用最大,而以完全理性的视角,其结果只能实现局部最优。这种不违反理性原则,但又考虑到实际客观制约的行为准则设定被称为受限理性(bounded rationality)。 已有越来越多的研究关注基于受限理性的离散选择问题。例如,Swait(2001)首次将取舍点的概念以越界惩罚的形式纳入模型,在对消费者租车选择的研究中,发现一些要素的惩罚变量十分显著,由此揭示了这种选择策略的客观存在及重要意义;Marcucci等(2011)用类似的方法研究了旅客的机场选择行为,进一步证实了将取舍点纳入的必要性;Campbell等(2006)在分析居民对景观改善措施的意愿价值评估时,以字典序原则对混合Logit模型进行修正,结果表明该原则在许多选择者中都得到体现。以上研究都需要在调查中获得关于选择策略的信息,如选择者对取舍点位置、是否忽略某些要素的自述等,而Zhu等(2008)的研究则因为无需额外信息而更具一般性,其建立的受限理性选择模型框架可以自动估计出要素被考虑的次序等与决策过程相关的信息。 4.4 选择的时空背景 4.4.1 时间背景的处理 与一般的计量模型类似,离散选择模型同样存在复杂的时空背景问题。考虑时间背景的模型常被称为动态选择模型(dynamic choice model),其典型的两种处理方式如下。 第一种是滞后因变量的运用。一些研究参照时间序列分析方法,将上一期或多期的选择结果作为本期解释变量纳入模型,试图追踪并解释同一类行为随时间变化的规律。例如,Smith(2005)在利用混合Logit模型研究渔民10年间的捕鱼地选择时,将过去所有的选择结果全部纳入,结果表明自变量的瞬时变化具有不同的近期和远期效应;Dargay等(2007)在对居民小汽车保有水平和交通模式选择进行跟踪研究时,发现将滞后因变量分别纳入定序Logit和二项Logit模型均取得良好的解释力;Chatterjee(2011)在使用定序Logit模型预测公共汽车的使用频率时,发现滞后因变量的加入显著提高了预测精度;Grigolon等(2014)建立了动态混合Logit模型以研究7年间人们对不同长度假期的选择,通过将同年、去年、两年前的选择结果纳入模型,发现与中短假期相比,长假的选择更易受前期选择结果的影响。 第二种是期望贴现效用(expected discounted utility)的运用。如果说前类研究主要关注过去,则此类研究更多着眼于未来,它试图反映个体在进行选择决策时,会考虑到当前结果将影响未来的选择情景,因此以更长远的眼光选择能使总体期望贴现效用最大化的选项。例如,Attanasio等(2012)在研究儿童上学的选择中,除纳入上学、工作两个选项的当前效用外,还考虑了上学投资对未来工作的预期回报及其不确定性;McKee(2006)用类似方法研究了中老年人的退休选择决策,其中考虑了基于未来收入、开支、健康状况等因素的期望效用的影响;Todd等(2010)将此类方法统称为动态规划离散选择模型(discrete choice dynamic programming model,DCDP),并总结了其在教育、经济、移民等政策评价中的应用;Lapparent等(2012)在研究居民是否保有车辆的选择时,发现其重要决策因素之一是对未来车辆使用的预期以及由此折算的当前需求,指出将未来考虑纳入模型对理解决策过程具有重要意义。 4.4.2 空间背景的处理 对于空间背景的考虑可主要归结为3个方面。首先是备选项因为空间邻近关系而自然相关,多见于选址研究。根据第3节对模型适用性的总结,此类问题完全可以用经典的模型形式解决。例如,Bhat,Guo(2004)提出了一个特殊的GEV模型,为任何一对存在邻接关系的空间备选项建立一个子集,由此得到了与空间分布模式相匹配的备选项相关结构。其次是空间自相关问题,即认为发生于某空间内的选择行为不仅取决于该空间的解释要素,还受到相邻空间选择结果及其对应要素的影响。例如,LeSage(2000)在犯罪空间研究中将二项Probit模型与空间自回归等模型相结合,发现犯罪高发的地区,其相邻空间也更有可能高发;Wang等(2012)在利用MNP模型追踪研究用地性质的变化时发现明显的空间自相关性,尤其是居住用地表现出了强烈的群聚趋势。再次是选择模型系数的空间异质性,即认为不同空间的系数应呈现有规律的渐变,越邻近的空间其系数应越接近。例如,Páez(2006)在研究车站周边324个地块的用地是否更新时,估计了可达性和可用地比例系数在空间内的连续变化情况,并以系数等值线的形式表达。 5 结论 本文按照离散选择模型的发展脉络简要回顾了各主要模型的理论架构和应用价值。最为基础的MNL模型具有易于实现、简洁、稳定等优势,至今仍被广泛采用,即使对于更复杂的模型,也应特别强调预先在MNL框架下不断优化模型设定的意义。针对MNL的理论缺陷,一些替代的精细化模型正在发挥越来越大的作用,它们有各自相对的适用范围:嵌套Logit模型最宜于直观地处理备选项间的相关性、合理纳入“都不选”备选项、支持RP/SP等非同源数据的合并,更具一般性的GEV模型体系可以设定更灵活的相关结构;混合Logit模型最宜于处理随机偏好差异问题,同时也可以解决各种相关问题,包括备选项相关、面板数据相关、随机系数相关、数据合并等,其衍生的潜在类别模型同样以处理随机偏好差异见长;MNP模型异常灵活,可以处理上述所有问题,但受到识别性问题和高计算量的制约较大。以上梳理覆盖了绝大部分的主流模型,旨在提高国内离散选择模型研究的理论水平,为研究者在面对特定问题时选用最合理的模型提供参考。 此外,本文还重点总结了4个依托经典模型的研究新动向。其中,多种模型形式的结合可以整合各模型的优势,更全面地分析问题;在数据方面,RP与SP数据各具特点,一些新的SP实验设计方法可提高效率,并更好地与具体的选择模型结合,特殊类型的定序、排序、多选数据也有相应的模型方法;基于受限理性的选择模型考虑了多种启发式选择机制,更加符合客观实际;当选择具有时空背景时,可通过滞后因变量、期望效用的纳入处理时间效应,通过考虑空间相关性、异质性处理空间效应。限于篇幅,上述总结虽无法面面俱到,但也在较大程度上代表了国外理论研究长期关注热点以及近期的主要动向,希望能为尚在起步阶段的国内离散选择模型研究带来更宽广的视野。 ①根据在中国知网上对关键词为“离散选择模型”的搜索结果,2000-2013年,相关文献数量持续增长,年均增长率近30%。 ②该问题的一种表述如下:假定出行者当前的出行方式选择有小汽车与红巴士两种,概率分别为0.5,则两种方式的选择概率比为1∶1,当选择集中新加入蓝巴士之后,由于IIA特性,这一比例应保持不变,同时,考虑到巴士的颜色不会对出行者的选择造成影响,因此其选择红、蓝巴士的概率比也为1∶1,则三种出行方式的选择概率相同,均为1/3。然而从常识推断,蓝巴士的加入应该仅仅影响原先选择红巴士的人,即此时小汽车的选择概率为0.5,红、蓝巴士各为0.25,因此,基于IIA特性的结果是不合理的。 ③连结式原则是指选择者为每一个要素均设置了最低标准,只有当一个备选项的所有要素都超过了相应标准时才会被选中;非连结式原则是指选择者为每一个要素均设置了最低可接受标准,只要备选项有任一要素超过了相应标准即会被选中;字典序原则是指选择者对各个要素的重要性进行排序,然后按顺序依次选择在更重要的要素上占优的选项,如果一个选项在最重要的要素上占优,即使其在第二位及以后的任何要素上表现较差,也不影响其被选中。标签:树形结构论文; 相关性分析论文; 效用理论论文; 效用函数论文; 差异分析论文; 路径分析论文; 嵌套论文; logit模型论文;