中国少数民族构成要素的因素分析_因子分析论文

中国少数民族构成要素的因素分析_因子分析论文

我国少数民族构成要素的因子分析,本文主要内容关键词为:因子论文,少数民族论文,我国论文,构成要素论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

民族是一种比较普遍而稳定的人类群体特征,作为一个朴素的概念,它的含义似乎并不难理解。然而作为一个具有行政和法律意义的概念,尤其是对一个多民族的国家,需要根据实际情况依法进行民族识别,制定民族政策,管理各种具体的民族事务,民族的定义就应该具有明确的规范性和可操作性。

词典中对“民族”的定义一般是比较朴素和含糊的,例如《大英百科全书》“民族”(ethnicgroup )词条的解释是:“一种生活在较大的社区内,因共同的种族关系、共同的语言、共同的民族性或文化而相互区分或联系的人口社会群体或社会范畴。 ”罗杰 ·皮尔逊( Roger Pearson )主编的《人类学词汇》( AnthropologicalGlossary,Florida,1985)的解释是:“对共同的文化、 共同的语言或共同的种族特征有自觉意识因而相互区别的群体。”《中国大百科全书》(1986)对“民族”的表述是:“人们在一定的历史发展阶段形成的有共同语言、共同地域、共同经济生活以及表现于共同的民族文化特点上的共同心理素质的稳定的共同体”,这基本上是中国行政、法律和学术上对民族范畴的普遍理解,迄今仍被认为是科学的。(注:参见林耀华:《民族学通论》,中央民族大学出版社1997版,第106页。)

我国理论上和实际工作中把民族理解为由共同语言、共同地域、共同经济生活和表现于共同文化上的共同心理素质四种主要特征或要素构成的人们共同体,强调的是民族的本体共性特征,而在现实中,这四个民族构成要素对构成民族的作用是有很大差别的。例如对多数人使用本民族语言的民族来说,共同语言这一民族特征对构成民族的作用是重要的;而对基本已不使用本民族语言的民族来说,共同语言已不是构成民族的主要特征。民族的居住状况也很不平衡,有的民族的大多数人口居住在本民族聚居地区,有的民族基本没有民族聚居区,而主要是和其他民族杂居,说明共同地域这个要素对不同民族的构成来说,作用也是很不一样的。

50年来的实践表明,中国民族识别和划分的结果大体是比较合理的,得到了少数民族的认可。因此本文是从我国现行少数民族实际的构成情况出发,以正式文献公布的、部分民族的社会经济文化指标为资料依据,对我国少数民族的诸社会构成要素进行微观和实证的统计分析,试图描述目前我国民族要素构成的基本情况,以及这些要素对民族的构成的作用或代表的信息量有多大。

一、指标、材料和方法

笔者使用的民族社会构成要素有 10项指标,可以大致归纳为以下4个要素。

——地区要素,指各少数民族在本民族地区聚居的人口情况。具体包括各民族总人口、各民族自治地方内本民族人口和少数民族人口3 项指标数据。民族聚居地区共包括截至1997年已建立的155 个少数民族自治地方(5个自治区、30个自治州、120个自治县/旗)。

——经济要素,指各少数民族在本民族地区的经济发展水平和在业人口情况。具体包括各民族自治地方人均国内生产总值(GDP )和各民族在业人口中从事农、林、牧、渔业的人口2项指标数据。

——教育要素,指各少数民族的受教育情况。具体包括各民族人口中的识字人口和在校生人数2项指标数据。

——语言要素,指各少数民族使用本民族语言的情况。具体包括各民族人口中的母语使用人口、单语使用人口和双语使用人口3 项指标数据。少数民族语言涉及大陆70种左右目前正在使用的少数民族语言。本民族母语多数情况指和民族名称相一致的本民族语言,对使用两种或几种本民族语言的民族来说,母语人口也包括两种以上本民族语言的使用人口。

当然这里所说的构成民族的地区、经济、教育、语言要素和我国民族定义中所指的有关要素在内涵上不一定完全一致,这主要是由于指标资料来源方面的限制,因此本文的各种描述和分析结果,只能在所依据的指标的意义上理解。

由于分析要素涉及3项与民族区域自治有关的内容, 因此本文的分析对象为中国已经建立了民族自治地方的44个少数民族,因为其他11个民族1997年时尚未建立民族自治地方(自治县以上)。这44个少数民族的总人口为90,437,017人(1990年),占全国少数民族总人口 90 ,567,245人的99.86%, 所以所用数据和分析结果应该对全国少数民族的情况有很高的代表性。

笔者对中国少数民族构成要素的原始数据作了以下基本的统计分析:

1.分民族的10项指标的描述统计,即统计各少数民族在民族地区的人口、经济、教育、语言使用情况的数据的平均值和标准差,以说明这些指标在民族构成中的集中趋势和离散趋势。

2.10项民族构成要素指标之间的相关分析,以说明各要素之间的相关关系。

3.10项民族构成要素指标之间的因子提取,以说明各要素对民族构成的代表性或所包含的信息量。因为各构成要素之间会或多或少地存在着一定的相关关系,所以通过因子分析可以将复杂的多个要素指标进一步概括为少数几个不相关的综合指标,从而可以对民族构成的情况作出综合的评价。

由于数据绝对值的相关统计显示出多个变量(要素)之间都高度相关,所以用绝对值作原始数据的统计结果不理想。为此笔者把民族总人口外的各项指标的绝对值都转换成相对的百分比,从而避免了指标间信息的重叠。

二、分析结果

(一)描述统计

少数民族地区、经济、教育、语言构成要素的集中与离散趋势统计结果见表1。

表1 描述统计

平均值 标准差 民族数

总人口 2055386.753356225.82 44

本民族%

59.31 24.43

44

少数民族% 58.61 23.17

44

人均GDP2893.61 1729.05

44

农业人口% 83.99 13.95

44

识字人口% 54.42 16.48

44

在校生%16.57 4.5944

母语人%69.79 31.14

44

单语人%39.20 27.30

44

双语人%36.39 20.62

44

结果显示占中国少数民族总人口99%以上的44个少数民族社会构成情况的以下信息:

每个少数民族人口平均约为200万人, 但是民族间人口数的标准差很大,说明中国少数民族的人口数量非常悬殊。例如人口最多的壮族有15,555,820人,而人口最少的珞巴族仅有2322人,二者相差6700倍。

每个少数民族平均近60%的人口居住在本民族自治地方中,表明中国实行民族区域自治制度是有本民族人口聚居的基础的。

各少数民族自治地方内的少数民族人口平均占到近60%,说明民族地区的居民确实是以少数民族人口为主。

各少数民族在民族自治地方的人均GDP不到3000元,和5634 元的全国平均水平有较大差距,且不同民族之间极不平衡。例如鄂温克族自治地方人均GDP达8659元,而普米族自治地方人均GDP仅192元。

平均每个少数民族84%的在业人口从事农、林、牧、渔业,民族间的差距不算太大,总体上高于全国平均水平(72%)。

每个少数民族平均54%的人口识字,明显低于全国平均水平(70%),各少数民族之间也不平衡。例如最高的朝鲜族的识字人口占82.25 %,而东乡族最低,仅占16.17%。

每个少数民族的在校生平均占总人口的16 .57%,略高于全国平均水平(16.10 %),说明和其他事业相比,少数民族地区的教育事业达到了较高的水平。

平均每个少数民族近70%的人口掌握母语,说明本民族语言目前仍是少数民族的主要社会交际工具;平均每个少数民族近40%的人口只能操母语,而不会其他语言,因此目前少数民族语言的使用和发展仍然应受到重视;平均每个少数民族36%的人口为双语人,可以预计使用双语的人口比例还会逐渐加大。从语言使用人口的各项指标的标准差看,不同民族掌握母语、单语和双语的人口比例是很不平衡的。

(二)相关分析

相关分析可以反映变量(构成要素)之间的相关程度和相关方向。

10项民族构成要素之间的相关情况见表2相关矩阵的统计结果。

表2 相关矩阵

总人口本民族%

少数民族%

人均GDP农业人口%

本民族%

0.219

少数民族% -0.1020.349*

人均GDP

0.165 -0.082 -0.186

农业人口% -0.0480.448* *

0.472* *

-0.447* *

识字人口% 0.221 -0.263 -0.291 0.575* *

-0.657* *

在校生%

0.017 -0.179 -0.251 0.486* *

-0.595* *

母语人%

-0.1510.438* *

0.222 -0.163 0.283

单语人%

0.037 0.446* *

0.304* -0.128 0.403* *

双语人%

-0.337*

0.127 -0.104 -0.172 0.061

识字人口% 在校生% 母语人% 单语人%

少数民族%

人均GDP

农业人口%

识字人口%

在校生% 0.890* *

母语人% -0.377*

-0.259

单语人% -0.369*

-0.356*0.757* *

双语人% 0.061 0.250 0.370*

-0.231

* 相关显著度在0.05的概率水平

* * 相关显著度在0.01的概率水平

没有“*”表示在概率上要素之间不相关

下面对各项要素之间的相关情况作进一步表述,并依据经验知识对各项要素之间的相关情况作一些说明。

少数民族人口的多少除与双语人比例为负相关外,和其他民族构成要素均没有关系。人口数与双语人数为负相关的原因可能是,人数越少的民族,客观上越需要掌握其他人口较多的民族的语言。

自治地方本民族人口比例与农业人口比例、母语人口比例、单语人比例之间显著地(相关系数带**)相关,与当地少数民族人口比例相关(相关系数带*)。自治地方的少数民族人口比例与农业人口比例显著地相关,与当地自治民族人口比例、单语人比例之间相关。这种相关情况表明少数民族聚居程度越高的地区,从事农、林、牧、渔业的人口越多,同时使用少数民族语言的人口也越多。

少数民族人均GDP的水平与农业人口比例显著负相关, 与识字人口比例、在校生比例显著相关。这几项相关关系的原因很容易理解,即从事农、林、牧、渔业的人口越多,民族的教育水平和经济发展水平越低。

农业人口比例与自治地方的自治民族人口比例、少数民族人口比例、单语人比例均为显著的正相关,与人均GDP水平、识字人口比例、 在校生比例为显著的负相关。农业人口与多项民族构成的社会指标相关,表明人口的在业状况(即以传统的农、林、牧、渔业生产方式为主)是当前少数民族的一个非常显著的社会特征。

识字人口比例与人均GDP、在校生比例显著正相关, 与农业人口比例显著负相关,与母语人比例、单语人比例负相关。在校生比例与人均GDP、识字人口比例显著正相关,与农业人口比例显著负相关, 与单语人比例负相关。由此可以看出,使用少数民族母语,特别是使用少数民族语言单语的人数比例越高的民族,受教育水平越低。

母语人比例与自治地方自治民族人口比例、单语人比例显著地相关,与双语人比例相关。

单语人比例和自治地方自治民族人口比例、农业人口比例、母语人比例显著地相关,与自治地方少数民族人口比例、识字人口比例、在校生比例负相关。

双语人比例与民族总人口负相关,与母语人比例正相关。后一项相关的原因可能是,使用母语人数比例高的民族,通常是人数较少的民族,所以他们更需要掌握其他人口较多的民族的语言。

(三)因子分析

因子分析是将多个原始变量转换为少数几个不相关的综合指标,并对这几个综合指标(即因子)加以命名,从而更容易突出分析对象的本质特征。综合指标比原始变量的数量少,但是所包含的信息量却损失很少。

10项民族构成要素的因子分析的初始值如表3。

表3 因子分析初始统计量

初始特征值

因子特征值方差%

累计%

13.77137.712 37.712

21.61716.165 53.877

31.53515.354 69.231

40.9139.132

78.363

50.8468.464

86.828

60.5195.187

92.015

70.4084.084

96.099

80.2802.801

98.900

90.0690.690

99.590

10

0.0410.410

100.000

从初始分析的统计量可以看出,依据特征值大于1 的提取原则(如果每个因子的代表信息相等,它们的特征值都应该为1),只有前3个因子的特征值大于1,它们对大多数原始数据具有充分的概括, 可以解释总方差的69.23%。

根据表4的因子负荷系数矩阵值可以写出用被提取的3个因子代替诸多原始变量后对各原始变量方差解释%的表达式:

因子1=-0.112*总人口+0.541*本民族百分比+0.537*少数民族百分比-0.571*人均GDP+0.811*农业人口百分比-0.855* 识字人口百分比-0.785*在校生百分比+0.615*母语人百分比+0.679* 单语人百分比- 0.085*双语人百分比

因子2=-0.223*总人口+0.402*本民族百分比+0.038*少数民族百分比+0.255*人均GDP-0.189*农业人口百分比+0.239* 识字人口百分比+0.416*在校生%+0.684*母语人百分比+0.307*单语人百分比 +0.715*双语人百分比

因子3=0.760*总人口+0.428*本民族百分比+0.148* 少数民族百分比+0.450*人均GDP+0.045*农业人口百分比+0.291* 识字人口百分比+0.122*在校生百分比+0.029*母语人百分比+0.407*单语人百分比-0.531*双语人百分比

表4 因子负荷系数矩阵

因子

1 2

3

总人口 -0.112 -0.223

0.760

本民族%0.541

0.4020.428

少数民族% 0.537

0.0380.148

人均GDP-0.571 0.2550.450

农业人口% 0.811

-0.189

0.045

识字人口% -0.855 0.2390.291

在校生%-0.785 0.4160.122

母语人%0.615

0.6840.029

单语人%0.679

0.3070.407

双语人%-0.085 0.715-0.531

从因子矩阵中3个因子的负荷系数可以看出,因子1对本民族人口百分比、少数民族人口百分比、人均GDP、农业人口百分比、 识字人口百分比、在校生百分比和单语人百分比等要素都有概括力(即方差解释力),而因子2和因子3分别只对母语人百分比、双语人百分比及总人口3 个要素有概括力,这是由于原始变量之间过高的相关程度所然,因此仍不好对这3个因子加以命名。

为了加大因子之间的正交性(不相关),可以通过对因子模型的旋转变换使因子的负荷系数向更大(向1)或更小(向0)方向变化,从而使对因子的命名和解释变得更加容易。因子模型的旋转变换后的矩阵见表5。

表5 旋转因子负荷系数矩阵

因子

123

总人口

0.2610.1710.736

本民族% -0.0610.7930.076

少数民族%

-0.3450.4310.082

人均GDP 0.742 0.0210.206

农业人口%

-0.7110.4140.136

识字人口%

0.897 -0.245

0.098

在校生% 0.867 -0.179

-0.146

母语人% -0.1280.812-0.413

单语人% -0.2240.8100.115

双语人% 0.225 0.117-0.858

从旋转因子负荷系数矩阵的数值可知,旋转后的因子负荷系数明显地向两极分化,即因子1对人均GDP、农业人口百分比、识字人口百分比、在校生百分比等要素有绝对值较大的负荷系数;因子2 对本民族人口百分比、少数民族人口百分比、母语人百分比、单语人百分比等要素有绝对值较大的负荷系数;而因子3 则对总人口和双语人百分比这两个要素有绝对值较大的负荷系数。根据诸民族构成要素的原始含义可以对这 3个因子进行命名。很明显,第一个因子主要概括了少数民族的经济和教育状况,所以可以命名为经济—教育因子;第二个因子主要概括了少数民族的居住和语言使用状况,所以可以命名为地区—语言因子;第三个因子主要概括了少数民族的总人口和双语使用状况,这两个要素无法提取共性,但却存在着民族人口越多,双语人比例越低的相关关系,所以可以暂命名为人口因子。

三、结论

对超过中国少数民族人口99%的44个民族的10个构成变量的多项统计分析,可以得出以下结论:

1.目前中国少数民族之间的区别特征主要在于经济发展水平、人口的教育水平、居住地区、使用语言等方面的社会差别,人口数量在民族之间也有差别,但影响没有前几项突出。因此共同的语言、地域、经济和教育发展水平是现行少数民族的主要构成要素。

2.同时也应看到,由于民族之间语言、地域、经济和教育等主要要素的差别只可以概括现行少数民族构成信息的70%,说明这些构成要素在现行民族之间的区别性功能并不是很强。随着全国通用语言的推广和扩散,不同地区之间民族人口的迁徙流动,以及整个国家社会、经济、文化生活逐渐趋于一体化,可以预计,传统意义上的各民族构成要素的作用将逐渐减弱,民族间的差别将逐渐缩小。

标签:;  ;  ;  

中国少数民族构成要素的因素分析_因子分析论文
下载Doc文档

猜你喜欢