方言与经济增长_方言论文

方言与经济增长,本文主要内容关键词为:经济增长论文,方言论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      0 引言

      中国具有统一的汉语书写语言,但发音“南腔北调”,颇具多样性。按照《汉语方言大词典》(许宝华和宫田一郎,1999)的统计,中国形成了北京官话、东北官话、冀鲁官话、江淮官话、胶辽官话、中原官话、银兰官话、西南官话、赣语、晋语、徽语、吴语、闽语、湘语、粤语、客话以及平话17种方言和105种次方言。多样的方言代表了多样的文化,但这是否有利于经济增长呢?这是一个有趣的问题,经济增长文献最近的一个进展就是考察文化对经济增长的影响(Aghion and Howitt,2009;Doepke and Zilibotti,2014)。Aghion and Howitt(2009)把经济增长理论的进展划分为三个阶段:第一阶段强调技术创新和资本积累,第二阶段强调制度和结构调整,第三阶段也是目前的最新进展,认为经济增长更加根本的原因是文化与信仰。一方面从纵向来看,文化的代际传递使得当前的经济增长受到历史上流传下来的文化的影响(Doepke and Zilibotti,2014);另一方面,从横向来看,区域内不同文化间的交流碰撞和文化多样性带来的壁垒也会影响当前的经济发展。现有研究更多倾向于前者,而本文的研究则属于后者,从方言的视角来看,多样的文化对经济增长到底有怎样的影响呢?

      中国推广普通话的实践,似乎给出了否定的答案。自建国以来,中国一直很重视语言融合的工作,大力推广普通话。1949年10月,中国语言文字改革协会成立,首先进行汉语拼音方案的研究。1952年2月,中国文字改革研究委员会成立,下设拼音方案组,在郭沫若、吴玉章和胡愈之等人的带领下着手制定《汉语拼音方案》。1958年2月,第一届全国人大正式批准《汉语拼音方案》。在汉语拼音的基础上,1982年将“国家推广全国通用的普通话”写入宪法。1986年国家把推广普通话列为新时期语言文字工作的首要任务。普通话的推广成效显著,国家语委2010年的“普通话普及情况调查”显示,2000年,河北、江苏和广西三省区的普通话普及率已达70%以上(普通话普及情况调查项目组,2011,第2~10页);但普及普通话并没有消除方言,而是形成了普通话与方言并行使用的双语现象。国家语委2010年的“普通话普及情况调查”同时发现,尽管河北、江苏和广西三省区的普通话普及率均已达70%以上,但是分别只有24.5%、16.5%和8.5%的受访者在家中使用普通话,大部分受访者小时候最先说的语言是方言,方言仍是家庭的首要交际用语(普通话普及情况调查项目组,2011,第2~10页)。

      方言不仅带来语言交流上的障碍,更代表着不同的文化。方言是身份认同的重要维度(Pendakur and Pendakur,2002),影响人际交往中的心理距离,进而影响信任与沟通。从现实看,人们通常更愿意与具有共同文化喜好的人交往,因为共同文化拉近了心理距离,使得沟通更容易。社会互动文献也强调,不同行为人在文化、规范和社会结构等方面相互影响,因为人与人的互动影响经常产生于同一空间(群),如居住在同一社区、具有相同的身份认同、讲同一种的语言或方言等。这种群内互动在微观上会提高群内个体和企业的社会网络和社会资本,进而影响其收入和流动(陆铭和张爽,2007),在宏观上作为非正式制度影响参与人的激励和行为,进而影响经济增长(陆铭和李爽,2008)。

      本文尝试在标准的经济增长框架内实证分析方言多样性对经济增长的影响。首先,本文根据《汉语方言大词典》所报告的中国2113个县或县级以上观测单元所使用的具体汉语方言,构建了中国278个地级(及以上)城市的方言多样性指数,贡献了一个方言多样性的数据库。需要强调的是,本文所构建的方言多样性指数是以地域为观察单元,直接测度该地域上的汉语方言种类,而不是运用这些语言的听说读写能力,从而在指标度量上把语言从人力资本中分离出来。接着,本文实证分析方言多样性对城市经济增长的影响,结果发现,中国城市的方言多样性对城市经济增长具有显著的负面影响。具体而言,从发展的角度看,如果消除城市中的方言多样性,当其他因素不变时,平均而言,人均产出水平最多将提高30%左右。最后,本文实证分析方言多样性阻碍中国经济增长的背后机制。采用Hall and Jones(1999)的策略,本文进行水平增长核算发现,中国城市经济差距主要取决于以TFP度量的技术水平,进一步实证分析发现,方言多样性是通过影响技术水平进而阻碍城市经济增长。

      本文的发现是稳健的。在方言多样性指标的度量上,本文考虑了方言分类、统计口径和权重设定等方面可能带来的测量误差。在内生性的处理上,本文利用解放前的铁路交通不便程度作为方言多样性的工具变量,Ⅳ估计的结果依然支持本文的发现。在进一步控制了地理、宗教和产权保护等因素后,本文的结论依然成立。为了克服方言多样性受到普通话普及的影响,本文进一步控制了当地居民的普通话水平以及当地方言与普通话的相似程度,结论依然成立。

      本文的工作属于多样性文献。Alesina(2013)认为,多样性是政治经济学中非常重要的话题,是政治经济学研究中必不可少的组成部分。现有的多样性文献一般认为,多样性是利弊兼备。一方面,民族语言分化(ethno-linguistic fractionalization)阻碍经济增长(Easterly and Levine,1997;Alesina and La Ferrara,2005)。一系列学者发现多样性通过这些渠道阻碍经济增长:人力资本积累(Easterly and Levine,1997)、信任(Alesina and La Ferrara,2000;2002)、冲突(Alesina et al.,2012)、企业生产能力(Parrotta et al.,2012)、团队合作(Milliken and Martins,1996)。另一方面,多样性带来互补,从而有利于经济增长。Brunow et al.(2012)和Boeheim et al.(2012)等发现,外国工人的多样性和工人出生地的多样性,对企业的表现有显著的正向作用;Alesina et al.(2013)发现出生地多样性能够显著地促进经济增长。

      本文与Chen et al.(2013)的工作接近。Chen et al.(2013)利用移民的户籍所在地与工作地是否属于同一汉语方言,来构造方言差异的二元变量,进而检验它对劳动力就业的行业和职位的影响。显然,Chen et al.(2013)是从微观上考察方言的差异对劳动力就业的影响,而本文从宏观上考察方言多样性对城市经济增长的影响。具体而言,在方言指标的构建上,本文将Chen et al.(2013)中的二元变量扩展成了多元甚至是连续的变量;同时,本文将Chen et al.(2013)中方言差异对微观个体的负面影响,扩展到了方言多样性对宏观经济绩效的负面影响。

      本文以下部分的安排如下:第1部分是文献综述和理论假说,第2部分是讨论方言多样性指数的度量,第3、4、5部分实证分析方言多样性对经济增长的影响及机制;最后是结论性评述。

      1 文献综述与理论假说

      1.1 文献综述

      1.1.1 多样性及其影响

      多样性(diversity)主要表现为种族多样性、语言多样性、宗教多样性、基因多样性和出生地多样性。实证分析多样性对产出的影响及其机制的文献始于20世纪90年代,最基本的发现是多样性对经济的发展有利有弊。

      一方面,大量文献发现多样性不利于经济增长。Easterly and Levine(1997)采用跨国数据实证分析发现,民族语言分化(ethno-linguistic fractionalization)阻碍了经济体的经济增长,并据此认为,种族多样性是非洲增长悲剧(Africa's growth tragedy)的主要原因。Alesina and La Ferrara(2005)使用美国城市和县级样本探索种族多样性对美国城市和县域经济增长的影响,也有相似的发现。

      现有文献已识别出多样性影响经济增长的机制或渠道。Easterly and Levine(1997)发现,种族多样性降低了人力资本(入学率)、导致了政治上的不稳定、扭曲的外汇市场、较多的政府赤字、不完备的财政体系以及不充足的基础设施,从而阻碍经济体的经济增长。Alesina and La Ferrara(2000,2002)发现,在种族多元化的城市中,个人会更少地参加社会活动,对其邻居的信任度也比较低。这表明语言、种族多样性影响人的信任,提高经济体的沟通成本。Alesina et al.(2012)强调了种族多样性的不平等维度,并认为是种族分化与种族不平等之间的互相作用导致了冲突,并造成了多样性对经济体的负面影响。此外,现有文献还从企业层面上分析多样性的微观影响,发现多样性降低了团队的凝聚力、提高了合作成本(Milliken and Martins,1996)。Parrotta et al.(2012)采用企业样本发现年龄和种族多样性阻碍企业的生产能力,为Alesina等学者在宏观层面上的发现提供了微观证据。

      另一方面,也有文献强调多样性有利于经济增长。这类文献主要强调,多样性能够形成技术互补(skill complementarities),不同文化、不同种群、不同教育背景的人拥有着不同的信息集,可以从不同的角度理解、解决各种难题,从而形成互补并带来更高的产出。在理论上,Hong and Page(2001)证明,在不存在不确定性的条件下,一组具有认知多样性并且只拥有有限技术水平的工人将比一组同质的具有高超技术的工人更加优秀。在实证上,Hambrick et al.(1996)发现,异质的管理团队的反应能力比同质的竞争对手慢,却能够获得更高的市场份额和利润。Brunow et al.(2012)采用德国企业样本发现,外国人的比重对企业生产能力并没有影响,外国工人的出生地多样性水平却对企业的表现有显著的正向作用。Boeheim et al.(2012)采用澳大利亚的企业及其工人1994-2005年的样本,采用Ⅳ(工具变量)估计也发现,工人出生地多样性提高了他们的工资水平。最近Alesina et al.(2013)使用195个国家的移民数据系统地分析了出生地多样性对经济表现的影响,结果发现,出生地多样性与种族多样性以及语言多样性并不相关,出生地多样性能够显著地促进经济增长。

      总之,不同层面的多样性所体现出的净效应不尽相同:语言多样性和种族多样性等大多体现为负的净效应,影响的渠道主要是人力资本、信任和沟通;出生地多样性、技术多样性、教育背景多样性等则体现为正的净效应,影响的渠道主要是技术互补。

      1.1.2 语言的经济影响

      大量文献研究了语言的经济影响。在微观上,劳动力的语言能力会影响其收入。Chiswick and Miller(1995)使用工具变量检验了移民的语言能力对其收入的影响,发现移民的目的地语言能力对其收入有正面影响。Chiswick and Repetto(2000)发现,在以色列,移民的目的地语言能力对其经济收入有正面影响,移民对希伯来语的熟练程度和读写能力直接影响其在以色列的收入。McManus et al.(1983),Grenier(1984),Kossoudiji(1988),Bleakley and Chin(2004)使用美国普查数据(US Census)和其他数据库,检验了移民讲英语的能力与其收入之间的关系,发现英语讲得越差的人收入越低。在宏观上,语言会影响生产效率和技术水平。Marschak(1965)指出,语言通过降低生产过程人际互动中的不确定性来提高生产效率。McManus(1985)认为学习技术先进团体的语言是通往高技术的通道。

      在语言影响的渠道上,现有文献至少识别出两个渠道:人力资本和心理距离。语言作为一种人力资本,其影响在听、说、读、写能力上各不相同。Chiswick and Miller(1990)将移民的英语能力看成表现其人力资本的最基本的形式。Chiswick(1991)发现阅读能力对工资的重要性远高于表达的流利性。Dustmann(1994)使用德国的数据,区分了语言的表达能力和书写能力,发现是后者提高了移民者的收入水平。Funkhouser(1996)发现男性移民英语表达能力的提高可以解释其收入大约50%的变化。Carnevale et al.(2001)发现移民对英语单词的理解能力是其在劳动力市场上获得成功的一项重要能力。

      语言作为民族和文化的代表,会影响人际交往中的心理距离,体现着语言本身的影响。Huston and Levinger(1978)提出,心理学的文献已经从实验上证明,感知相似性(perceived similarities)会影响人与人的吸引力。McPherson et al.(2001)指出,与不相似个体间相比,相似个体间更容易发生互动。人们更愿意与相似的个体交往,是因为相似的个体有共同的文化喜好,沟通更容易。Pendakur and Pendakur(2002)认为语言是民族认同和民族身份的一个重要维度,他们研究了加拿大三大城市区中13种少数语言的经济回报,发现当控制了主体语言后,掌握少数语言的个体往往是低收入的,这显示了不常用语言的负面影响。他们将这一现象归因于种族划分(ethnicity),也许是因为移民主动选择在相应种族语言的劳动力市场上工作,也许是因为劳动力市场对少数语言群体有歧视。

      总之,现有文献把经济活动主体所拥有的语言视为人力资本以及人际交往中的心理距离,从而影响经济绩效。但问题是,既然反应微观个体语言能力的听说读写能力就是其人力资本的一个重要组成部分,那么如何确定现有文献所识别的就是语言本身的经济绩效而不是人力资本的经济绩效呢?

      1.2 理论假说

      中国具有统一的汉语书写语言,但发音呈现多样性,形成了众多的方言。即使到了2010年,国家语委在河北、江苏、广西的调查显示,普通话普及率均已达70%以上,但是只有不到25%的受访者在家中使用普通话,方言仍是家庭的首要交际用语(普通话普及情况调查项目组,2011,第2~10页)。《汉语方言大词典》显示,中国有17种方言和105种次方言;在本文统计的278个地级及以上城市中,23%的城市同时使用两种及以上的汉语方言,55%的城市同时使用两种及以上的汉语次方言。正如多样性文献所强调的,中国城市的方言多样性也会对中国城市经济增长产生负面影响。

      理论假说:当经济处于稳态时,方言越多样,发展水平越低。

      对于这个理论假说,本文还有三点说明。一是采用中国城市样本为分析单元是有意义的。分析语言多样性的文献所采用的分析单元目前更多的是国家或地区,语言文化往往与制度等因素交织在一起,在实证分析中,很难把语言多样性的影响单独分离出来。采用一个经济体内部的样本,比如中国城市样本,由于不同样本采用的是同样的制度安排,至少能够控制制度变量的影响。当然,这种做法的损失是只能够考察统一官方语言之下的方言多样性的影响。

      二是我们度量城市属地本身的方言多样性,可以更干净地识别语言本身的影响。语言的听说读写是人力资本的重要组成部分,如果以经济活动主体为观察单元度量语言或语言多样性,那么则很难把语言与人力资本区别开来,进而无法干净地识别语言的影响到底是人力资本带来的,还是语言本身带来的。我们采用城市所在地域为观察单元,直接测度该地域上的汉语方言种类,而不是运用这些语言的听说读写能力,从而在指标度量上把语言从人力资本中分离出来,更利于实证分析语言本身的影响。

      三是理论假说强调方言多样性是影响经济增长的更深层的决定因素。Aghion and Howitt(2009)在其《增长经济学》一书中明确指出,看待经济增长过程及其政策可以分为三个层次:第一个层次就是要素积累和创新;第二层次是制度和结构改革;第三个层次,也是更加深层次的是文化和信念。Aghion and Howitt(2009)同时明确强调考察文化对经济增长的影响是近年来才兴起的一支文献①。方言显然是文化的一个重要维度。目前,中国还没有处于世界技术的前沿,技术进步主要是靠学习而不是创新。方言多样性难免会通过影响沟通、信任等阻碍技术和知识的传播,从而对中国城市经济体的技术水平带来负面影响。

      2 方言多样性的度量

      2.1 数据来源

      度量方言多样性的原始数据来自《汉语方言大词典》。大词典由中国复旦大学许宝华和日本京都外国语大学官田一郎主编,“是一部编纂得比较成功的汉语方言方面的大型词典”(谢自立,2000)。大词典报告了中国各县市汉语方言系属简表②(以下将其简称为“简表”),罗列了中国县及县级以上城市所使用的汉语方言系属③,共2113个观测单元④。这个“简表”是根据中国社会科学院和澳大利亚人文科学院合编的《中国语言地图集》(1987)的汉语方言部分以及有关的论文编制而成。对于这个“简表”,以下三点值得强调:

      一是“简表”共涉及17种方言、105种次方言。17种方言分别是北京官话、东北官话、冀鲁官话、江淮官话、胶辽官话、中原官话、银兰官话、西南官话、赣语、晋语、徽语、吴语、闽语、湘语、粤语、客话以及平话。方言下面分次方言,共105种。

      二是“简表”所采用的基本地域单元是县,包括县、县级市以及城市辖区,但城市辖区并没有一一列出,而是统一列出其所属地级市的方言系属情况。县、市名以中国1986年6月的行政区划为准。县和县级以上的市,如果名称相同,而且方言系属也完全相同,“简表”只列市名,并在市名后的括号内标注“县”字,该县的方言系属不再另列,比如河北省邯郸市和邯郸县同属晋语的邯新片,就写为邯郸市(县);县和县以上的市,一律使用简称而不用全称,比如云南省孟连傣族拉祜族佤族自治县,则写为孟连县。

      三是“简表”报告了县内的方言情况。具体而言,分两种情况报告。对于所用方言单一的县、市,“简表”采用统一的格式展示其方言系属,比如安徽省凤台县,属中原官话的信蚌片,就写为“安徽。中原官话。信蚌片。”;对于所用方言比较复杂或存在特殊情况的县、市,则根据具体情况进行说明。本文把后者统称为“方言复杂县”,后文将作详细说明。

      2.2 方言多样性指数

      本文以地级及以上城市为分析单元,构建城市内部的方言多样性指数。本文将基本的方言多样性指数定义为城市中所使用的汉语次方言数量,用Div表示。这一指标统计了一个城市所使用的汉语方言片的个数。比如北京市,其辖区和辖县所使用的汉语次方言有京师片、保唐片以及承怀片共3个,则北京市的方言多样性指数为3。显然,Div的最小值是1,值越大城市的方言越多样。Div只关注城市中所使用的次方言的种类,对数据的要求不高,且相对稳定。

      由于大词典中的县、市名以中国1986年6月以前的行政区划为准,在度量Div之前,本文要按照2000年的行政区划再现中国汉语方言在现市区上的空间分布。之所以选择2000年是因为这本大词典是1999年出版的,考察随后的经济绩效,从方法论的角度讲,能够避免在实证分析中常见的反向因果关系。另外,2000年后中国行政区划比较稳定,如图1所示。

      

      图1 1978-2012年中国行政区划的变动

      注:来源《中国统计摘要2013》

      2.2.1 匹配分析单元

      在1986-2000年,中国县级行政区划变化主要涉及更名、撤县设区、撤县设市、撤销县市、县并入其他县、成立新县等变化。为了准确按照2000年的行政区划再现大词典简表中的汉语方言的空间分布,本文严格按照以下4个步骤进行匹配。

      第一步,直接匹配。对于县名称完全相同,且所属省份特征一致的县,本文进行直接匹配。在这一个步骤中,成功匹配了1271个观测单元,约占全部样本的60%。其中并不包含地级市,对于地级市我们放入第二步中进行匹配。

      第二步,人工校对匹配。本文采用人工校对的方法匹配剩下的842个观测单元,约占全部样本的40%。这842个观察单元可以分为以下4类:一是“简表”中的地级市;二是由于“简表”中的县、市的名称省略而无法直接匹配的县(市);三是撤县设区、撤县设市或者县升级为地级市而无法直接匹配的县(市);四是更名后无法直接匹配的县(市)。

      经过直接匹配和人工匹配之后,本文成功匹配了“简表”中的2097个观察单元,占全部观察单元的99.2%。剩余的16个观测单元(均为县级行政区)由于撤销并入其他县、市等原因无法匹配⑤。

      第三步,为新设立的县级行政区赋值方言数据。对于1986-2000年新设立的县级行政区(可能是原地级市辖区或辖区的一部分、原某个县的一部分、或原来几个县部分乡镇合并等),本文以保证方言系属能够被准确且唯一确定为原则,为其匹配方言数据。具体而言,本文采用人工匹配的办法为21个县级行政区匹配了方言数据⑥。

      第四步,对市辖行政区赋值方言数据。根据市辖行政区的类型,本文分两种情况进行赋值。一是对市辖县的赋值。对于邯郸市(县)这一类观察单元,本文将市方言数据复制到其下辖县。比如“简表”中邯郸市(县)的方言系属为晋语邯新片,赋值后,地级邯郸市和邯郸县的方言系属均为晋语邯新片。二是对市辖区的赋值。“简表”仅列出了地级市(或直辖市)的方言系属,并没有细分到其辖区,我们也无法将每一个地级市新设立的辖区与1986年已经存在的辖区区分开来,即使我们能把这些新设立的辖区区分开来,也无法为这些辖区科学的界定方言的系属,因此,我们将地级市(或直辖市)⑦中除了期间撤县设区外⑧的辖区(包括郊区)统一界定为“简表”中该地级市(或直辖市)的方言系属,而不考虑城市辖区的变化。比如,浙江省温州市在2000年有3个辖区,即鹿城区、龙湾区和瓯海区,其中瓯海区由原瓯海县撤县设区而来,因此鹿城区和龙湾区界定为“简表”中温州市的方言系属,而瓯海区则依然界定为“简表”中瓯海县的方言系属,保持不变。

      经过上述四步的匹配、赋值后,本文得到按照2000年行政区划再现的方言数据完整的2356个县市区,以及县级方言数据完整的278个地级及以上行政区⑨。根据第五次人口普查数据(2000),样本覆盖了全国89.5%的人口。

      2.2.2 方言多样性指数的度量

      本小节度量中国278个地级及以上城市所使用的次方言数量Div。在278个城市中,93个城市下辖“方言复杂县”,约占全部样本的1/3⑩;剩余的185个城市无“方言复杂县”。“方言复杂县”主要存在两种情况:一种“方言复杂县”存在一个主要的次方言,而且其他方言能够确定使用人群很小;另外一种“方言复杂县”无法通过“简表”中的描述来判断出一个主要的次方言或者无法确定除了主要方言外其他方言的使用人群的大小。表1为方言多样性的简单描述性统计。

      在度量Div时,本文对“方言复杂县”的方言进行如下处理。对于第一种情况,本文只统计该“方言复杂县”中主要的次方言。比如安徽省宿州市泗县,“简表”描述为“安徽。中原官话,信蚌片。东部少数乡村说江淮官话,属江淮官话洪巢片”,则把泗县的方言确定为中原官话、信蚌片,忽略东部少数乡村所用方言;对于第二种情况,本文实际统计该县所使用的方言种类,但忽略其中使用人群确实很少的方言。比如河北邯郸市曲周县,“简表”描述为“河北。东里町以西说晋语,属晋语邯新片磁漳小片,以东说冀鲁官话,属冀鲁官话石济片聊泰小片”。本文则把曲周县的方言确定为晋语、邯新片以及冀鲁官话石济片。

      

      图2报告了278个地级及以上城市Div的空间分布情况,颜色越深,方言多样性的程度就越高。如表1所示,Div的均值是1.92,最大值是5,即在中国地级及以上城市内部,最多同时使用5种汉语次方言。按照Div度量,方言最多样的城市是安徽省池州市、广西省桂林市等,最不多样的城市是广东省广州市等。图3报告了对应城市2010年人均实际产出(2001年为基期)的空间分布情况,颜色越深,经济越不发达。

      

      图2 语言多样性的分布Div

      

      图3 城市经济绩效

      3 方言多样性与经济增长水平

      3.1 实证方法

      Hall and Jones(1999)强调,当经济体处于稳态时,标准的新古典经济增长文献和内生经济增长文献已经证明,经济体的人均产出增长速度等于技术进步的速度,建议把经济体的生产函数

整理为

      

      其中,Y、L、K、h和A分别为总产出、人口、物质资本、人均人力资本和技术水平。本文首先识别方言多样性对城市人均产出水平的影响,然后采用式(1)将中国各个地级及其以上城市的人均产出水平分解为资本产出比、人力资本和技术水平的贡献水平,并识别方言多样性对各生产要素贡献水平的影响,从而检验本文的理论假说。

      具体而言,本文将实证分析中国地级及其以上城市的方言多样性对其2010年的发展绩效及其各要素贡献部分的影响。

      

      其中,y代表人均产出和各要素的贡献部分;Div和X分别为方言多样性指数和一系列不随时间变化的地理因素,包括省虚拟变量、省会城市、到省会的距离等;ε为扰动项;

度量方言多样性影响发展水平的程度,当本文的理论假说成立时,

<0。

      3.2 基本结果

      表2报告了采用式(2)的回归结果,与理论假说预期的一致,方言多样性的回归系数显著为负号。

      

      表2第1列报告了只引入方言多样性Div的一元回归结果,这时Div的回归系数为-0.082,能够通过显著水平为5%的检验。这表明,方言多样性每下降一个单位,人均产出将会增加8.2%。具体而言,由表1中的描述性统计可知,Div最大、最小值分别为5和1,如果消除城市的方言多样性,其他条件不变时,城市的人均产出最大可以增加约33%。

      表2中的第2~5列报告了逐步引入相关控制变量后的回归结果,具体而言,第2~5列逐步引入了东中西部虚拟变量、省区虚拟变量、省会城市虚拟变量以及城市距其省会的距离。表2第5列报告了同时引入这些控制变量的回归结果,这时,Div的回归系数仍然为负号,能够通过显著水平为5%的统计检验,绝对值大小略微变小,从0.080左右下降为0.070,表明如果消除城市的方言多样性,其他条件不变时,城市的人均产出最大可以增加约28%。就控制变量而言,省会城市虚拟变量的回归系数约为1/3,能够通过显著水平为1%的检验,即省会城市的人均收入水平,平均而言,比省内其他城市高了约1/3。距省会的距离Dis_sh的回归系数约为-0.975,能够通过显著水平为5%的检验,其单位为百万米,即距离省会越近的城市,平均而言人均收入越高,其他条件不变时,距离每减少100公里,人均收入提高9.75%。

      总之,以上回归结果表明,与理论假说预期的一致,城市中的方言多样性对城市的人均收入水平具有显著的负面影响。如果消除城市的方言多样性,那么城市的人均收入水平最多可以增加约30%。

      3.3 进一步讨论

      本文对方言多样性的度量基于《汉语方言大词典》。从方言多样性的度量过程来看,方言多样性的测量误差可能来自以下3个方面:《大词典》对方言的分类不均、统计口径以及方言权重的设定。在分类不均的问题上,具体来讲,方言在官话地区、北方地区及内陆地区分类可能更加详细,而在非官话地区、南方地区和沿海地区则相对粗糙,因此,在官话区、北方地区及内陆地区方言多样性可能被相对高估,而在非官话区、南方地区及沿海地区,方言多样性可能被相对低估。对此,本文进一步做了如下三个稳健性检验。

      第一个稳健性检验是考察官话与非官话的影响。本文将城市样本分为以官话为主的城市和非官话为主的城市,引入官话城市为1、非官话城市为0的虚拟变量,重现表2中的回归结果,本文的理论假说依然成立。

      表3第1、2列报告了引入官话城市虚拟变量Guan后的回归结果。其中,第1列加入了官话城市虚拟变量Guan,第2列同时加入了虚拟变量Guan以及其与方言多样性的交乘项。与表2中的相应回归结果相比,区分官话与非官话后,Div的回归系数显著性基本没有发生变化,符号仍然是负号,只是系数绝对值略微变大;而且交乘项的回归系数都不显著。这表明,方言多样性在官话与非官话城市之间也许存在差异,但是方言多样性对城市经济增长的影响不因官话或非官话而异。

      第二个稳健性检验是考察南北方言的影响。以北纬33°(秦岭淮河一线(11))作为分界线将城市样本分成北方城市与南方城市,引入北方城市为1、南方城市为0的虚拟变量,重现表2中的回归结果,本文的理论假说依然成立。

      

      表3第3、4列报告了引入北方城市虚拟变量North后的回归结果。其中,第3列加入了北方城市虚拟变量North;第4列同时加入了虚拟变量North以及其与方言多样性的交乘项。与表2中的相应回归结果相比,区分南方与北方后,Div的回归系数显著性没有发生变化,符号仍然是负号,只是系数绝对值略微变化;而且交乘项的回归系数都不显著。这表明,方言多样性在南北地区之间也许存在差异,但是方言多样性对城市经济增长的影响不因南北而异。

      第三个稳健性检验考察沿海与内陆的影响。(12)本文将城市样本分为沿海省份的城市和内陆省份的城市,引入前者为1、后者为0的虚拟变量,重现表2中的回归结果,本文的理论假说依然成立。

      表3第5、6列报告了引入沿海地区虚拟变量Yanhai后的回归结果。其中,第1列加入了沿海地区虚拟变量Yanhai,第2列同时加入了虚拟变量Yanhai以及其与方言多样性的交乘项。与表2中的相应回归结果相比,区分沿海内陆后,Div的回归系数大小及显著性基本没有变化,沿海虚拟变量显著为正,进一步引入交乘项后,Div系数为负但不显著,交乘项的系数则显著为负。这表明,在沿海地区和内陆地区,方言多样性的影响确实存在差异,尽管如此,无论在沿海地区还是内陆地区方言多样性对经济发展都表现出阻碍作用,在沿海地区这一作用更加显著。

      总之,以上回归结果表明,尽管中国方言在官话非官话地区、在南北地区及沿海内陆地区之间可能存在某些差异,但是方言多样性对城市经济增长的阻碍作用依然稳健。可能的解释是本文度量的是某个地域内的方言种类,尽管方言在南北方之间等可能存在数量上的差异,但是并不存在质的差异,都存在多样的方言。

      接下来的稳健性检验是考察统计口径与方言权重的设定问题。在统计口径的设定上。Div对“方言复杂县”的处理,可以保证信息损失较小,但可能存在口径过宽导致高估城市方言多样性的问题。基于此,本文采用窄口径的度量做法,对每一个“方言复杂县”只确定一种次方言,重新度量中国278个地级及以上城市所使用的次方言数量,计为Div_n。Div_n避免了高估方言多样性的可能,但方言信息损失较大。

      另一方面,在权重的设定上,以Div度量的方言多样性,实际上假定城市中的每个汉语次方言都是等权重的,并不考虑方言使用人群的差异。这样处理的好处是对数据的要求不高,且比较稳定,但也可能造成一定的误差。基于此,本文采用式(3)重新构造方言多样性指数,记为Div_w。Div_w能够反映每种次方言的使用情况,但需要使用每种语言的确切人口规模,对数据的要求相对较高。

      

      其中,

表示在城市i使用方言j的人口比重;N其实就等于Div_n;Div_w的取值在0~1,值越大则表示方言越多样。

      该多样性指数是多样性文献中最常见的度量指标(Easterly and Levine,1997;Alesina et al.,2003;Alesina et al.,2005;Fearon,2003;Alesina et al.,2013),其经济学含义是对城市内随机选取的任意两个个体,他们讲不同方言的概率大小。这个指数的值越大,他们讲不同方言概率就越大,那么讲相同方言的概率就越小,也就是一样性就越低。因此它反映了当地方言的多样性程度。Div_w对S的赋值进行简化处理,每一个县市区只确定一种汉语次方言,同时假定该县市区的所有人群都讲这种汉语次方言。比如,广州市海珠区的方言系属为粤语广府片,则假定广州市海珠区的所有人都属于“粤语广府片”这一语言群体,相应的人口数据来自第五次人口普查数据。

      表4报告了采用方言多样性指数Div_n和Div_w的回归结果。表4第1、4列分别采用方言多样性指数Div_n和Div_w重现表2第5列的回归结果,此时,Div_n、Div_w的回归系数分别为-0.079、-0.267,符号均为负号且都能够通过显著性水平为5%的检验。表4第2、5列报告了引入虚拟变量Guan后的回归结果,第3、6列报告了引入虚拟变量North后的回归结果,分别对比第1、4列可以发现,区分官话非官话地区或者南北地区之后,以Div_n和Div_w度量的方言多样性的回归系数仍然显著为负号。

      综上讨论,考虑可能存在的测量误差之后,方言多样性对经济增长仍然具有显著的阻碍作用,本文的理论假说依然成立。

      

      3.4 内生性问题

      正如生态语言学文献所强调的,经济发展会导致某些语言的消亡。联合国教科文组织濒危语言问题特别专家组(2006)认为,语言消亡的主要原因是当今社会政治、经济及文化的不平衡发展,强势语言的扩散使大量的少数民族语言成为濒危语言,因而提倡应保护语言的多样性。范俊军(2006)认为语言生态危机的重要表现之一就是语言多样性减少和语言的单极化,而某一种语言的消亡意味着该民族特有文化智慧的消亡,因而提倡应该从语言人权的角度保护语言的多样性。显然,这支文献隐含着经济发展会减少语言多样性。因此,当这种机制存在时,本文所观察到的方言多样性与经济绩效负相关,也可能是经济发展减少方言多样性的表现,而不是方言多样性阻碍了经济增长的表现。

      为了克服这种可能存在的反向因果关系,本文将引入交通便利程度,并以此作为工具变量采用两阶段最小二乘法重新考察方言多样性对辖区经济发展的影响。把交通便利程度作为工具变量,主要是基于生态语言学文献所揭示的逻辑。这支文献强调,随着经济发展某些语言成为强势语言,强势语言的扩散使其他语言成为濒危语言甚至消失。因此,一个地区交通越不便利,强势语言对该地区语言多样性的影响就越小,即一个地区的方言多样性与其外界的交通便利性负相关。

      本文根据中国1878-1948年铁路分布情况(13),计算出解放前各个城市铁路交通的便利程度并作为语言多样性的工具变量,解决语言多样性的内生性问题。具体而言,本文把铁路交通便利度定义为各个城市与离它最接近的3个或4个通铁路城市的平均距离。(14)之所以选择解放前的铁路交通便利度是因为,一方面,在解放前中国的铁路建设更多的是基于战争或掠夺资源的需要,并非用来发展经济;另一方面,这一平均距离也在一定程度上反映了该城市通往四面八方的交通便利程度。可以预测,这一平均距离越大表明城市越偏远,交通越不便利,那么其语言越多样。如表5中的第一阶段回归结果所示,平均而言,中国各个城市在解放前的铁路交通不便程度与其当今的语言多样性显著正相关。

      

      表5报告了采用两阶段最小二乘法的回归结果。第1~3列和第4~6列分别用各个城市与离它最接近的3个和4个铁路城市的平均距离(对数值)作为工具变量。我们发现:采用工具变量后,除了Div_w外,语言多样性的回归符号依然显著为负号,且回归系数绝对值变大。其中,Div的系数绝对值从0.070提高到0.5左右;Div_n的系数绝对值从0.079提高到0.8左右。这意味着,克服了语言多样性可能存在的内生性问题后,语言多样性对经济增长的阻碍作用更大,本文的理论假说依然成立。

      3.5 引入其他控制变量(15)

      为了更干净地识别方言多样性本身的影响,我们考虑引入以下三个方面的控制变量。一是地理地形因素;二是宗教多样性因素;三是产权保护程度。

      首先,地理地形因素很可能同时影响了方言的多样性和经济的发展,是更深层次的因素,因而需要进一步加以控制。这是因为复杂的地形会带来地理上的隔离,会同时阻碍人们的沟通与贸易,于是既影响方言的多样性也影响经济发展水平。这种地理隔离几乎不随时间变化,因而这两种效应会一直伴随着当地的发展历史。例如,当一个地方的平均坡度越高或者平均地形起伏度越高时,越容易形成地理上的隔离,这一方面在方言的形成历史过程中,阻碍了讲不同方言的人们之间的沟通,使不同的方言无法融合,因而表现出更高的方言多样性;另一方面在人类的经济发展过程中,这种地理上的隔离也阻碍了知识和技术的传播,因而不利于该地的经济发展。因此,我们在表2中看到的方言多样性与经济发展水平的负相关,很有可能都是地理隔离导致的,而不是方言多样性本身的影响。为了排除这一可能,我们在表2的回归中,进一步加入各地的平均坡度和平均地形起伏度,来控制地理地形的影响。

      表6的第1~3列报告了控制地理地形因素的结果。第1列控制了平均坡度,第2列控制了平均地形起伏度,第3列将二者同时控制了,数据来自封志明等(2007、2014)的测算。(16)与表2的结果相比,方言多样性Div的系数大小几乎不变,仍然显著为负,平均坡度和平均地形起伏度系数为负但不显著。这说明坡度和地形起伏度等因素很可能影响了方言在过去的形成,导致了多样的方言,但并未显著影响现在的经济发展,而方言多样性对经济发展的影响则显著为负,因此这一影响并非地理隔离导致的,而是方言本身导致的。

      

      其次,是宗教多样性的影响。地理隔离在形成方言多样性的同时,也很有可能形成多样的宗教,不同宗教之间由于信仰和文化不同,知识和技术也难以共享和传播,因而宗教越多样的地方也不利于经济发展。因此,我们在表2中看到的结果很有可能反映的是宗教多样性与经济发展的负相关关系,只是由于方言多样性与宗教多样性相关,所以我们也观测到了方言多样性与经济发展的负相关,但这并未反映方言本身的影响,而是宗教的影响。为了排除这一机制,我们控制当地居民宗教的多样性程度,再进行表2的回归。

      表6第4、5列报告了控制当地居民宗教多样性之后的回归结果。第4列中的宗教多样性用当地被调查的居民所信仰的宗教数量来度量,第5列中宗教多样性的度量与式(3)中方言多样性的度量类似,考虑了人口加权,数值越高表示越多样,数据来自中山大学“2012年中国劳动力动态调查数据”。与表2的结果相比,方言多样性Div的系数大小有所下降,但仍然显著为负,宗教多样性的系数显著为负。这表明,尽管宗教多样性不利于经济发展,且与方言多样性相关,使得我们在表2中高估了方言多样性的影响。但是当我们控制了宗教多样性后方言多样性的影响依然显著,完全消除方言多样性,其他条件不变时,依然至少可以使经济增长水平提高21%。

      最后,我们讨论产权保护以考察制度对经济发展的影响。基于现有文献,多样性可以通过降低不同群体间的信任,阻碍知识与技术的传播和贸易的发生,进而阻碍经济发展。尽管如此,可以通过建立制度与契约来消除不信任带来的阻碍。因此,方言多样性越高的地方产权保护制度可能越健全,有利于经济发展。为了排除方言多样性通过产权保护这一机制来影响经济,我们控制各地的产权保护程度。

      表6第6、7列报告了控制产权保护程度后的回归结果。产权保护程度数据来自世界银行(2006),由于该指标只涉及120个城市,与方言多样性匹配后只剩余112个样本,为了防止样本减小带来的偏差,第6列基于该指标所在的子样本再现了表2的回归结果,第7列中控制了该指标。第7列与第6列相比,方言多样性系数几乎不变,依然显著为负,产权保护程度不显著。这表明,尽管方言多样性越高的地方,产权保护程度也可能越高,越有利于经济发展,但这种促进作用并不能完全消除方言多样性的阻碍作用。

      以上分析表明,当我们进一步控制了地理因素、宗教多样性和产权保护程度等可能的遗漏变量后,方言多样性对经济发展的影响依然显著,若方言多样性完全消除,其他条件不变时,至少可以使经济增长水平提高21%。

      4 当方言遇见普通话

      中国拥有统一的官方语言,即普通话。普通话的普及,消除了人们在听、说、读、写上的分歧与障碍,在人际沟通中起着重要作用。然而,不同方言往往还代表着不同的文化与认同,影响着人际交往中的心理距离。普通话能否消除不同方言带来的心理距离,进而抵消方言的阻碍作用?本节将通过实证分析回答这一问题。

      4.1 普通话水平

      一方面,居民的普通话水平本身,可能可以消除不同方言带来的心理距离,因此我们引入居民的普通话水平变量。本文利用“2012年中国劳动力动态调查数据(试用版)”中,访问员对被访者普通话流利水平的打分,构造了各城市居民的平均普通话水平,记为Puth。具体而言,该调查覆盖了我国29个省(不含西藏和海南)、256个地级市、2282个区县单元,共调查了16253个个体。在访问结束后,访问员会对每个个体的普通话流利程度进行打分,从1~5分普通话流利程度依次升高,1表示既听不懂又不会讲,2表示听得懂但不会讲,3表示不太流利,4表示流利、略带地方口音,5表示非常流利。各地被调查个体在权重设计上与2010年人口普查的人口分布保持一致,这样我们对各地级市中被调查者的普通话流利程度取平均,近似该城市居民的平均普通话水平。需要明确的是在匹配数据过程中,东营市等19个城市平均普通话水平数据缺失(17)。因此,在本小节,有效样本减少至240个。

      本文所构建的普通话水平变量与国家语委2010年的调查结果类似。国家语委2010年的“普通话普及情况调查”中,普通话普及率是指被调查者中能用普通话交流的比例。从总体上看,被抽查河北、江苏、广西三省区的普及率为70%~80%;本文所构建的普通话水平变量Puth在全样本上的均值为4.00,在这三省的均值为3.96,也接近最高值5的80%。这意味着,至少与国家语委所报告的河北、江苏、广西三省区普通话水平相比,平均而言,本文采用“2012年中国劳动力动态调查数据”度量各地普通话水平大致是可行的。

      表7第1~3列报告了引入城市居民平均普通话水平Puth后的回归结果,方言多样性的回归系数显著为负号,本文理论假说依然成立。表7第1列重现了当不引用普通话水平、只采用240个样本时的回归结果,对比表2第5列的回归结果可以发现,样本从259个城市下降到240个城市后,方言多样性Div的回归系数符号、大小和显著水平都没有发生任何实质性的变化。这意味着,240个城市样本仍然具有代表性。表7第2列单独考察城市平均普通话水平Puth对其经济绩效的影响,发现Puth的回归系数并不显著,表明城市的平均普通话水平对其经济增长并没有显著的影响。表7第3列报告了同时引入方言多样性Div以及普通话水平Puth后的回归结果,与第1、2列对比可以看出,这时,方言多样性的回归系数符号、绝对值和显著水平几乎没有发生变化,仍然显著为负号;普通话水平Puth仍不显著。这意味着,控制了各地普通话水平后,方言多样性对经济增长仍然具有显著的负面影响,本文的理论假说仍然成立。

      之所以如此,一个可能的解释是普通话水平是后天的人力资本投资的结果,并不能够消除方言所代表的文化认同及其所带来的心理距离。正如国家语委普通话普及情况调查项目组(2011)所发现的,大部分受访者小时候最先说的语言是方言,普通话主要是通过学校学习所掌握的,是一种人力资本,它能够消除在听、说、读、写上的交流障碍距离,却无法消除不同方言所造成的心理距离。表7第4、5列报告了采用普通话水平Puth对人力资本进行回归的结果,人力资本的系数显著为正号。这也表明人力资本与普通话水平正相关,人力资本高的城市平均而言普通话水平也较高。

      

      4.2 方言与普通话的相似程度

      另一方面,当方言与普通话越相似时,也越可能消除这种心理距离,因此我们进一步引入各方言与普通话的相似程度。由于该指标在方言学上并没有直接的和系统的测量,我们用它们与北京市所讲方言的相似程度来替代。在相似程度的度量上,稳健起见,我们依据《中国语言地图集》和《汉语方言大词典》中划分的方言树图,分别按照Fearon(2003)、Melitz and Toubal(2014)和Spolaore and Wacziarg(2009)的3种方法,计算了各地方言与北京方言的相似性。这3种度量分别侧重两种方言在系属分类上的亲疏、共同使用人群的多寡和共同祖先的远近。(18)

      表7第6~8列的结果中控制了各地方言与普通话的相似程度。其中,第6~8列控制的相似程度分别按照Fearon(2003)、Melitz and Toubal(2014)和Spolaore and Wacziarg(2009)的方法计算而得。与表2中的相应回归结果相比,控制了与普通话的相似程度后,Div的回归系数显著性没有降低,符号仍然是负号,只是系数绝对值略有增大,与普通话的相似程度在3种度量方式下都显著为正。这表明一个城市的方言与普通话越接近越有利于其经济发展,但并未消除方言多样性带来的阻碍作用。这也进一步说明,方言多样性不是通过其在听说读写上的障碍来阻碍经济发展,而是通过其带来的心理距离。

      总之,本文所构建的方言多样性指数度量城市属地本身的方言多样性,更干净地识别了语言本身的影响。进一步引入普通话水平和方言与普通话的相似程度后,方言多样性对经济增长仍然具有显著的阻碍作用,本文理论假说仍然成立。

      5 影响渠道

      本节将采用式(1)分解中国259个地级及以上城市的发展水平。首先,把Y、L、K、h和α带入式(1)(19),求出各地级及以上城市的技术水平A;接着以北京为一个标准化单位把全国其他258个地级及以上城市进行标准化处理。表8报告了中国部分城市的分解结果。

      表8揭示了中国地级及以上城市的发展差距主要取决于其技术水平A。表8第1行报告了北京的情况,由于本文选择北京作为标准化单位,所以其产出水平、资本产出比、人力资本和技术水平都是1。第2行报告了上海发展水平情况。在2010年,上海的人均实际GDP是北京的1.5倍,其中资本产出比、人力资本和技术水平所贡献的发展水平分别是北京的0.8、0.9和2.0倍。这表明,上海的发展水平比北京高,主要因为上海的技术水平高。显然,如果上海和北京的技术水平一样,那么上海的发展水平可能将会只有北京的70%左右。表8还报告了其他地区的分解结果,比如天水。在2010年,天水的实际人均GDP不到北京的20%,但其资本产出比、人力资本所贡献的发展水平则高达北京的70%左右,只是技术水平所贡献的发展水平只有北京的37%。如果天水的技术水平和北京的一样,那么天水的发展水平将会提高约2.6倍,占北京的比重也会从现在的18.5%提高到49.5%。表8的倒数第2行则报告了259个城市发展水平的差距情况。发展水平的标准差是0.4,而资本产出比、人力资本和技术水平所贡献的发展水平之间的标准差则分别为0.12、0.07和0.78。这意味着,在全国259个地级及以上城市之间,技术水平所带来的发展差距最大,而资本产出比和人力资本所贡献的发展差距并不大。

      中国地级及以上城市的发展水平与其技术水平A高度正相关。如表8中的最后一行所示,资本产出比与劳均产出的简单相关系数只有-0.046;而人力资本和技术水平与劳均产出的简单相关系数则分别高达0.62和0.93。

      

      表9报告了被解释变量分别为资本产出比(lnK/Y)、人均人力资本(lnh)和技术水平(lnA)的回归结果。回归结果显示了技术和人力资本与方言多样性的负相关关系,资本产出比与方言多样性不相关。表9第1列用资本产出比的对数值lnK/Y对Div回归,回归结果表明两者之间不存在显著的相关关系;第2列用人均人力资本的对数值lnh分别对Div回归,回归结果显示两者存在显著的负相关关系,Div每下降一个单位,人均人力资本将会提高1%,Div的最大、最小值分别为5和1,如果消除城市的方言多样性,那么城市的人均人力资本最大可以提高约4%;第3列用技术水平的对数值lnA对Div回归,回归结果显示两者存在显著的负相关关系,Div下降1个单位可以使技术水平上升5.8%,消除城市的方言多样性可以使技术水平最多增加约23%。

      

      在采用式(1)进行水平分解时,技术水平A是资本产出比和人力资本所不能够解释的残差部分,难免会包括技术水平之外的其他因素,比如石油、铁矿以及其他有色金属等自然资源(20)。因此,考察方言多样性对技术水平的影响不应忽视由本文所采用的方法论本身带来的这种偏差。国家计委宏观经济研究院课题组(2002)划分5种资源,把47个地级及以上城市确定为资源型城市(21)。本文采用各城市的技术水平A对各类型资源型城市的虚拟变量进行回归发现(22),5种类型中的石油城市、黑色冶金城市和其他资源类型城市的A显著高于其他城市,对应的城市分别为大庆、东营、濮阳、克拉玛依、本溪、马鞍山、郴州、攀枝花和云浮9个资源城市。为了消除资源禀赋带来的影响,本文剔除这些资源型城市再进行检验,表9第4列报告了剔除高技术资源型城市后的回归结果,与第3列的回归结果相比,回归结果并没有发生实质性变化(23)。

      6 结论性评述

      经济增长文献的一个新进展就是考察文化对经济增长的影响(Aghion and Howitt,2009;Doepke and Zilibotti,2014)。方言是文化的重要方面。中国方言是南腔北调,颇具多样性,本文构建了中国各个地级及以上城市方言多样性指数。根据《汉语方言大词典》所报告的中国2113个县或县级以上观测单元所使用的具体汉语方言,本文构建了中国278个地级及以上城市的方言多样性指数。方言多样性指数直接测度各个地级及以上城市辖区内的汉语方言种类,而不是运用这些方言的听说读写能力,从而在指标度量上把方言从人力资本中分离出来。

      本文考察了方言多样性对经济增长的影响。具体而言,本文把各地级及以上城市2010年的经济绩效与其方言多样性指数相匹配。实证分析发现,方言多样性对经济增长具有显著的负向影响。如果消除城市的方言多样性,当其他因素不变时,平均而言,人均产出水平最多将提高30%左右。考察了可能的测量问题、内生性问题及地形、宗教和产权保护等可能的遗漏变量问题,本文的发现稳健存在。

      本文还实证分析了方言多样性阻碍中国经济增长的背后机制。采用Hall and Jones(1999)的策略,本文对中国278个地级及以上城市2010年的发展水平进行增长核算,结果发现,中国城市间的经济差距主要取决于以TFP度量的技术水平,方言多样性是通过影响技术水平和人力资本阻碍城市经济增长。

      本文的发现是稳健的,揭示了方言等文化因素是影响经济增长的深层次因素。当然,本文并不否认,方言多样性在其他维度上可能会促进社会发展,这还需要进一步研究。

      

      

      

      庄初升、杨海生等给予大量建议,匿名审稿人和责任编辑提出了宝贵的修改意见,在此表示感谢。

      ①最近出版的经济增长手册,第一篇论文就是考察文化对经济增长的影响(Deopke and Zilibotti,2014)。

      ②我们使用的“全国各县市汉语方言系属简表”来自CNKI中国工具书网络出版总库。

      ③部分地区并不使用汉语或者属于未分区方言,“简表”并没有列出这些地方所使用的语言。

      ④2113个观测单元并不意味着只有2113个县、市的数据,因为有的观测单元可以包含一个地级市和一个县的数据,比如邯郸市(县)。

      ⑤附表1详细报告了这16个县的具体情况及其可能的影响。

      ⑥附表2详细报告了这21个县级行政区的具体情况。

      ⑦其中包括从县(或县级市)升级而来的地级市;但不包括由某几个县(或县级市)合并而成,而我们无法确认其辖区原(1986年)属于哪个县(或县级市)的地级市。

      ⑧对于撤县设区而来的辖区,其方言数据与撤县设区前县的方言数据保持一致。

      ⑨数据缺失的原因包括:部分地区并不使用汉语或者属于未分区方言,简表未列出其方言系属,如西藏大部分地区;匹配过程中无法确定其方言系属而遗漏。

      ⑩附表3详细报告了这些城市的“方言复杂县”情况。

      (11)秦岭淮河一线在32°N~34°N,本文取33°N作为分界线,城市纬度数据统一来自Google Earth。

      (12)感谢匿名审稿人宝贵的建设性意见。

      (13)数据来源于中国百科网(http://www.chinabaike.com/)中文章《中国近代铁路建设》中的“1878-1948年的中国铁路分布图”。

      (14)如果该城市为铁路城市,那么最接近的3个城市中就有它本身,它与自身的距离为0;选择3个城市是因为3个或以上的城市数量才能形成平面,这一平均距离才能更好反映一个城市通往四面八方的便利程度。基于稳健性的考虑,我们也选择了4个城市计算平均距离,结果是一致的。距离为地理距离,通过经纬度计算,数据来源于Google Earth。

      (15)感谢匿名审稿人宝贵的建设性意见。

      (16)中国科学院地理科学与资源研究所的封志明老师及其合作者游珍老师,慷慨地共享了他们所测算的平均坡度与平均地形起伏度的数据,在此表示特别感谢。

      (17)这19个城市分别是:东营市、和田地区、铜陵市、朔州市、金昌市、鹤壁市、阿勒泰地区、辽源市、迪庆藏族自治州、乌海市、克拉玛依市、怒江傈僳族自治州、三门峡市、莱芜市、马鞍山市、嘉峪关市、延边朝鲜族自治州、阳泉市、池州市。

      (18)感谢匿名审稿人宝贵的建设性意见。

      (19)采用式(1)分解中国城市的发展水平,需要对Y、L、K、h和α等进行赋值。α为1/3。Y、L和h分别采用各地级及以上城市2010年的实际GDP、常住人口和平均受教育年限,数据来自《区域经济统计年鉴》和第六次人口普查数据2010。K是物质资本存量,现有统计部门并不提供中国各个地级及以上城市的物质资本存量数据,本文将采用永续盘存法模拟出2001-2010年全国259个地级及以上城市的资本存量。在采用式(1)水平分解时,本文只采用2010年资本存量数据。采用永续盘存法模拟资本存在需要解决3个度量问题,即如何度量2001年的初始资本存量,以及2001-2010年的折旧率和实际物资资本投资。本文按照文献通常的做法,取折旧率为0.06;实际物资资本投资采用各自的GDP缩减指数进行平减后的固定资本投资;在计算2001年的基期资本存量时,本文假定各个地级及以上城市的资本产出比等于其所在省的资本产出比,采用各省的实际物质资本存量、GDP和各地级及以上城市的实际GDP就可以估计出各地级及以上城市的初始的实际资本存量。各省2001的实际资本存量数据来自徐现祥等(2007)。

      (20)比如,表格7中报告了大庆、克拉玛依和东营这三个石油城的情况。从分解结果看,这三个城市的人均实际GDP大致都是北京的2.3倍,其中资本产出比和人力资本所贡献的产出水平都没有北京的高,但Div所贡献的产出水平则分别是北京的5、2.6和4倍。显然,如此高的倍数,是式(1)这种方法本身遗漏了自然资源等因素所致,而非真实的技术水平差距。

      (21)这47个城市分别是大庆、盘锦、东营、濮阳、克拉玛依、唐山、邯郸、邢台、大同、阳泉、长治、晋城、朔州、乌海、赤峰、抚顺、阜新、辽源、鸡西、鹤岗、双鸭山、七台河、淮南、淮北、萍乡、枣庄、平顶山、鹤壁、焦作、广元、达州、六盘水、铜川、石嘴山、葫芦岛、铜陵、白银、金昌、本溪、马鞍山、郴州、攀枝花、白山、松原、伊春、黑河和云浮。

      (22)为了节省篇幅,回归结果本文没有给予报告。感兴趣的读者可以索要。

      (23)另外,在实证分析过程中,我们改变折旧率和Div的取值,实证结果并没有发生任何实质性改变。为了节省篇幅,未予报告。

      (24)除金门县外,“无”则说明该县(市)的方言系属与其合入的地区保持一致。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

方言与经济增长_方言论文
下载Doc文档

猜你喜欢