基于元胞自动机的世界语言发展趋势研究论文

基于元胞自动机的世界语言发展趋势研究

王雪蕊1,侯为根1,陈旬旬2,李 蒙3

(1.安徽工业大学 数理科学与工程学院;2.安徽工业大学 能源与环境学院;3.安徽工业大学 商学院,安徽 马鞍山 243032)

摘要: 为了预测未来世界语言的发展趋势,将基于时间仿真模型与元胞自动机模型结合,进行时间和空间两个维度的预测.首先进行指标选取,将算法与BP网络结合,获得关键参数,最后进行模型扩展,以获得更大时间跨度的研究内容.在此基础上,构建元胞自动机模型,将大地坐标系转化成笛卡尔坐标系,模拟离散空间变量,并使用维基百科提供的数据,用Matlab软件模拟得出结果.模拟结果表明,50年后,目前世界排名前十的语言中有四种语言将被替换.语言作为人类交流工具,与经济发展、文化交流等有密切联系,研究结果可用于预测未来经济和文化发展趋势.

关键词: 时间仿真模型;元胞自动机;语言发展

语言是人类交流的工具,目前世界上约有6900种语言,随着全球化进程的不断加快,语言也在不断发展.语言交际与经济贸易、国际政治活动有着密切关系[1],因此准确预测未来语言发展有着重大意义.人们研究语言往往是从它的起源开始研究,涉及的影响因素有地理、历史、文化等,由感性研究得出的结论,往往缺少客观性,得出的结论准确度不高.还存在一些方法,例如元胞自动机[2]的方法,支持向量机[3]的方法,均是只从空间角度来预测语言发展趋势.本文除了运用元胞自动机的方法,还增加了时间仿真模型,将时间和空间两个维度结合起来,基于BP网络和Matlab仿真,引入参数推导出算法,更准确地预测了未来语言发展趋势.

现今世界语言的分布不仅受到地区经济发展状况、历史因素及人口迁移的影响,还与一个国家的政策开放程度等因素有关.人口出生和死亡必将影响各语言使用者总数,由于战争、移民等导致的人口迁入和迁出也是影响因素,因为现代经济发展的需求,各国人口在将本国语言作为母语的同时,还可能掌握一种或多种语言作为第二语言,所以语言之间的转换现如今也成了影响因素之一.

时间仿真模型认为不同语言使用者的数量可以相互传递,语言使用者的总数只与出生率,死亡率,迁入率,迁出率和转换率有关.语言使用者总数随时间变化,随着时间的推移获得各种语言使用者的数量.元胞自动机模型将地球表面划分为[-89,89]×[0,359]细胞,这与经度和纬度一致.在语言的初始值被选中后,它将遵循本文定义的规则.在模拟中,我们将得到每种语言在地理上的分布.本本文的模型使用维基百科提供的当前各种语言使用者数量[4]进行验证.两种模型模拟了2016年的数据,并且得出的结果显示了与2017年世界语言分布较为一致.因此,在此基础上的扩展模型可以用来研究50年内的语言发展趋势.

1 指标选取和解释

本文选取了出生率、死亡率、迁入率、迁出率、语言转换率五个指标作为影响因素,下面对它们做出详细解释.

1.1 出生率和死亡率

很显然,出生和死亡带来人口数量的变化,随之带来语言使用者数量的变化,

一般地,出生率有以下计算公式:

这里,S指的是各国人口出生总人数,M为世界总人口数,但由于地理环境、生活习惯、国家政策的不同,世界195个国家的出生率α和死亡率β也不尽相同,因此本文的α和β的计算均采用平均值计算公式:

在此,出生率和死亡率将是一个恒定的平均值,并且指的是日出生率和日死亡率,k=1,…,195指的是国家数,αk指的是各国人口出生率,βk指的是各国人口死亡率,mk指的是各国人口数,M指的是世界总人口数.

1.2 迁入率和迁出率

在迁出率部分:

在此,迁入率和迁出率将是一个恒定的平均值,并且指的是日迁入率和日迁出率,k=1,…,195指的是国家数,γk指的是各国人口迁入率,δk指的是各国人口迁出率,mk指的是各国人口数,M指的是世界总人口数.

1.3 语言转换率

(1)迁移方向和距离:对于每个元胞自动机,它只有四个方向可以迁移:向上,向下,向左和向右.在初始模型[10]中,迁移距离一次不应超过10个元胞自动机.由于每个元胞自动机只能移动一次,因此我们需要一种算法来确定方向和距离.实际上,我们定义任何方向具有相同的概率,即:

这个“不产生危害的量”是由国家标准来进行规范的。作为“有毒物质”,研究其毒性一般在动物身上进行。用不同剂量的农药喂养动物(或者其他方式让动物接触),找出动物“不表现出任何异常的最大剂量”。

ij表示从语言i到j的转换率.一般来说,它可以定义为:

由于世界各语言在不同地理位置上的分布是不同的,因而在考虑时间的同时,还应考虑空间因素,为此建立元胞自动机模型.该模型基于时间仿真模型,但更加复杂.元胞自动机(CA)是一种时间和空间都离散的动力系统,其整体行为是在个体行为共同作用下实现.本文在研究中采用二维CA,将整个笛卡尔坐标系平面看成是一张二维的规则格网,每一格网代表一个元胞,且在任意时刻都有自己的状态值,即任意时刻的各语言使用者人数,状态的更新依赖于转换规则函数,即公式(1)(2)(3)(4)(5)(11),元胞下一时刻的状态值是由上一时刻该元胞及其邻域元胞状态综合决定的.

图1 2016年p0和2017年p0之间的BP网络

在此,p0指的是语言使用者数量初值,权重矩阵是∈ij矩阵.在网络[8]中,有26个隐藏层和26个神经细胞.2016年各种语言的总使用者是输入,而2017年各种语言的总使用者是输出.在训练网络后,我们得到了∈矩阵.如图2所示.

图2 ∈权重矩阵

2 时间仿真模型

2.1 基本模型

在时间仿真模型中,将整个世界视为一个整体,分别考虑每种语言.而对于每种语言,使用者的总数只与出生率,死亡率和每种语言之间的转换率有关,在这里,因为考虑的是时间维度,所以忽视迁入率和迁出率,偏向于出生率、死亡率和语言转换率.关系如图3所示.首先,我们只考虑两种语言.在这个基本模型中,n表示天数,从1月1日开始统计.

图3 基本时间仿真模型

由上图可构造以下迭代公式:

在这个公式中,Pin表示n天后第i语言的总使用者数量,P1、P2、P3…Pn指的是说第一种语言、第二种语言、第三种语言…第n种语言的使用人数.

2.2 扩展模型

在本节中,我们将模型从两种语言扩展到三种语言,再扩展到26种语言.图4显示了三种语言之间的关系.

根据2.3、2.4节中承台角点位移及转角值,经3.1节中计算原则计算,桥墩顶最大沉降0.78 mm,最大横向位移0.19 mm、纵向最大位移0.83 mm,梁端水平折角最大为0.006‰,对上部结构影响较小,均满足1.4节中控制变形指标。

图4 三种语言之间的关系

由上图可构造以下迭代公式

在这个公式中,Pin表示n天后第i语言的总使用者数量,P1、P2、P3…Pn指的是说第一种语言、第二种语言、第三种语言…第n种语言的使用人数.

于是,最终得到了包含26种语言的最终模型——时间仿真模型.在推广上述公式后,我们得到以下公式:

其中,i=1,2…26,j=1,2…26,pin表示 n天后第语言的总使用人数,ij表示从第i语言到其他语言的转化量.ijpij表示从其他语言到第i语言的转化量.

3 时空元胞自动机模型

这里,tij指的是语言i转化为语言j的人数,mi指的是语言i的使用者总数,事实上,很难找到有多少人学习新语言并且忘记他们的母语,因此,我们决定将本文设计的算法与BP(背景传播)神经网络结合起来.根据联合国教科文组织最新发布的世界濒危语言图谱[6]可知,全世界大约有7000种语言,其中一半以上的语言将在21世纪末消亡,80%—90%则在未来的200年内灭绝,基于语言的影响力,本文只选取当今世界排名前26名的语言进行研究,这26种语言分别是:汉语普通话、英语、印度语、西班牙语、阿拉伯语、马来语、俄语、孟加拉语、法语、葡萄牙语、豪萨语、旁遮普语、日语、德语、波斯语、斯瓦希里语、泰卢固语、爪哇语、吴语、韩语、泰米尔语、马拉提语、粤语、土耳其语、越南语、意大利语.将2016年语言排名前26的使用者人数作为初值,即p0,与2017年维基百科的数据形成鲜明对比.因此得到26输入和26输出的权重矩阵[7].图1为BP网络图.

所谓思维能力就是在人们的感性认识的基础上,运用比较、分析、综合、归纳、演绎等基本方法形成概念并进行推理和判断,从而获得对事物的本质和规律性的认识的一种能力,苏霍姆林斯基曾经说过:“知识是最容易被遗忘的,而能力却永远伴随终身”,思维能力是培养学生综合能力的核心,也是培养学生核心素养的有效途径。

首先,我们将大地坐标系转换[9]为笛卡尔坐标系.值得注意的是经度∈[-180,180],这意味着西经180°,东经 180°.纬度∈[-90,90],这意味着南纬 90°,北纬 90°.另一个需要注意的是,坐标(4,88)并不表示它的经度是4°,纬度是88°.实际上,它表示该位置对应经度轴上的第4元胞和纬度轴上第88元胞.坐标(lo,la)代表元胞自动机在每一个小方格的位置,lo表示经度轴方向的坐标,la表示纬度轴方向的坐标.

图5阐述了该模型的工作原理:

图5 元胞自动机网格

元胞自动机中每一个格子中的人数会随着时间的推移(时间仿真模型)而改变,每个时间步长为一天.元胞自动机模型中,与时间仿真模型不同,此处进行的是空间分布研究,因此会更加关注迁入率γ和迁出率δ.

改革开放进入“深水区”,面对越来越难啃的“硬骨头”,以习近平同志为核心的党中央,带领全国人民涉险滩、攻难关,坚定不移将改革开放进行到底。正如今年10月,习近平在广东考察调研时向世界宣示:中国改革开放永不停步!下一个40年的中国,定当有让世界刮目相看的新成就!

图6 元胞自动机的示意图

这里只考虑了3种语言,下面是具体实现过程:

例9(2016·宜宾):如图所示,已知光线在水面反射的光线OB,O为入射点。请作出其入射光线和进入水中的折射光线。

语言转换率为一种语言使用者学习另外一种语言,从而忘记其母语语言的概率.当一种语言很少被使用时,或者该语言本身较难学习时,一般而言会增加该国大部分人放弃学习该国语言的概率,并选择学习一种较为简单通用的语言以供交流,例如拉丁语[5]就是一种日常口语已经消亡的西方古典语言,今天一般只作为文献语言以供研究.此外如果一个人很少说他的母语,那么他有很大可能不会与另一个说同样语言的人结婚,因此,人们普遍认为,他们之间的对话将基于一种常用语言,他的孩子也将学习这种通用语言,那么一代代发展下去,此人的母语有很大可能被遗忘,例如长期生活在汉族地区的少数民族的人,他们将很大可能同汉族人结为夫妻,由于生活、工作和学习的原因,他们以及他们的后代将会使用汉语而不是少数民族语言.此外,当发生战争或信仰入侵,也会使语言之间互相转换.社会压力,政府推动以及文化群体的同化等也会导致语言之间发生转换.

对于距离,迁移的概率与其距离成反比,即:

规范化方程并使得

为了做出这些选择,使用累积概率的方法.区间显示在表1中.

我们使用以下公式:

Variants of the performed operations are presented in Table 2.

表1 定向的累积概率

(2)每个元胞自动机一次只能移动一个位置.当元胞自动机中的语言使用者向上或向下移动第n 个单元时,(lo,la+n)或(lo,la-n)处的元胞将加上(减去)相应的移民数量,当元胞自动机中的人数向右或向左移动第 n 个单元时,(lo+n,la)或(lo-n,la)的人数将加上(减去)相应的数量.

(3)每移动一步,元胞自动机中的人数将经历出生,死亡,迁入,迁出和相互转换.

在其他原材料及调料一定的前提下,按照不同的薏米添加量分别以10.0%,15.0%,20.0%,25.0%,30.0%加入,通过感官评定分析,色差测定,确定薏米的最佳添加量。

在转换率部分:

在出生率和死亡率部分:

在迁入率部分:

其中,∑k=1pn(lok,lak)γ表示所有元胞中的语言使用者都迁入本文所认定的元胞中.

术后7d观察组在对照组治疗基础上,加予通窍鼻炎颗粒(成都迪康药业有限公司生产,批准文号:国药准字 Z10980073,规格:2g×9 袋),2g/次,口服,3次/d,持续治疗2个月。

毫无疑问,迁入人口对第二语言的冲击力最大,由于迁入人口在迁入国的生存压力或环境影响下将被迫或主动掌握该国家的语言,形成第二语言,且随着时间的发展,迁入人口的后代将以极大概率把迁入国语言转变为母语使用,因此,迁入人口的增加势必会增加迁入国语言使用者的数量.因种族、文化、信仰、政策的不同,迁入率γ和迁出率δ也同样会因为国家的不同而不同,所以本文对迁入率和迁出率同样采用平均值算法:

其中,∑k=1pn(loi,lak)δ表示所有元胞中的语言使用者都迁出本文所认定的元胞.

指标选取和模型构建后,根据相关检验分析具体模型的选取,考虑不同个体和截面是否具有相同的截距和斜率。经wald检验,其观测显著性水平均为0.0000,表明固定效应模型优于混合OLS模型,说明三大产业结构的面板数据存在个体效应,由上文中我国区域产业结构现状分析也可知,各省份之间确实存在显著的个体特征,因此拒绝OLS混合模型符合现实规律。对于固定效应和随机效应模型的选择,一般采用Hausman检验来判断。经检验,拒绝原假设,选取固定效应模型。

其中,j×pn(loi,lai)表示所有转换成其他语言的人.Pn(loi,lai)×0.00005表示所有人转换成认定的某种语言.

4 预测分析

4.1 第一部分

P0为26种语言使用者初值(单位:百万):

2.5.3上炕烘将煮好的天麻上炕烘时,温度不能过高,需使炕温平衡上升,温度保持在40~50摄氏度,烘2~3小时后,温度逐渐升至60~65摄氏度,天麻外层很快干燥,以防天麻糖心,而每隔30分钟排气5分钟,以便麻内的水分蒸发,至30小时温度可升80~85摄氏度,烘至40小时。

P0=[1090 983 544 527 422 281 267 261 229 229 150 148 129 129 121 107 92 84 80 77 75 74 72 71 68 66]

首先进行1年内26种语言的母语使用人数的预测,利用Matlab软件[11]模拟,模拟365天后,我们得到了以下结果(单位:百万):

参考译文:Judging by the current situation,the construction cost of thisproject will exceed thebudget by 30%.

图7 各母语使用人数在365天内的变化图

在此,P0指的是语言使用者总数,根据结果,第9种语言(葡萄牙语)成为第10种语言,而第10种语言(法语)成为第9种语言,并且汉语普通话[12]总数略有下降而英语使用者有所增加,但总体变化幅度不大.

4.2 第二部分

接下来继续用matlab来执行模拟,时间改为50年,即 365×50天,得到以下结果,P0同上.

由图8可见,50年的时间跨度内,语言发展趋势变化明显.观察可得:(1)上升趋势明显型:英语、法语、吴语(上海话).(2)上升趋势缓慢型:马来语、日语、德语.(3)变化趋势平稳型:英语、西班牙语、阿拉伯语.(4)波动性下降较为显著型:汉语普通话、阿拉伯语、俄语.另外,50年后,目前排名前十的名单中有四种语言被替换,它们分别是:西班牙语、俄语、孟加拉语和葡萄牙语,新进入排名前十的四种语言分别是:豪萨语、日语、德语和吴语(上海话).表2是现在世界排名前十的语言以及建模得出的五十年后世界排名前十的语言.

图8 各母语使用人数在50年的变化图

表2 世界排名前十的语言对比表格

5 结语

世界在发展,语言也在不断发展,通过建立时间仿真模型和元胞自动机模型,将时间和空间维度相结合,推算关键参数和算法,引入BP网络,并运用Matlab仿真,得出以下结论.

5.1 50年后,目前排名前十的名单中有四种语言被替换,它们分别是西班牙语、俄语、孟加拉语和葡萄牙语,新进入排名前十的四种语言分别是豪萨语、日语、德语和吴语(上海话).

我的这篇文章将要提到的十六首钢琴曲,以及李树化的其他许多音乐作品,都是他在杭州“国立”艺术院工作期间完成的,这些作品都是艺术院的重要学术成果,也是艺术院的骄傲,是杭州音乐史上的光荣。

5.2 英语在50年后将会排名第一,其次是印度语,汉语当中有普通话和吴语两种语言都在前十之列.即具有强烈影响力的语言,大多数国家更希望选择它作为他们的第二语言,并且会更快地增加并且更广泛地使用,这与世界经济发展状况有关.

贝多芬的《第九交响曲》是他的登峰造极之作,迄今无人能超越。这首作品在1824年5月7日首演,第一乐章以快板奏鸣曲式,斗争为主题;第二乐章以快板,诙谐曲进行;第三乐章是慢板,抒情性、整理性的;第四乐章为急板,代表作《欢乐颂》首次将合唱(人声)引入交响曲,倡导“自由 平等 博爱”。

本文使用的建模方法还可用于时间跨度更长的语言发展趋势研究.但在参数选取方面,本文假设未来50年内世界处于平稳发展状态,因此将一些参数考虑为恒定值,若考虑其为动态可变的,会使得结果准确度进一步提高.

参考文献:

〔1〕袁俏玲.语言与经济的关系探微[J].湖南科技学院学报,2007,28(5):107-109.

〔2〕汪榆淋.基于元胞自动机各语言人口分布分析[J].信息记录材料,2018,19(10):56-57.

〔3〕佟凯文,汪超,刘超.基于支持向量机的世界语言发展趋势研究[J].中国高新区,2018,41(13):58-59.

〔4〕Wikipedia,the free encyclopedia.List of languages by number of native speakers[OL].2018.https://en.wikipedia.org/wiki/List_of_languages_by_number_of_native_speakers.

〔5〕罗建平.西方古文明与拉丁语的兴亡——政治与语言的关系研究 [J]. 海外英语,2011,9(3):204-205.

〔6〕联合国教科文组织.全球濒危语言地图[OL].2018.360 百 科 :https://baike.so.com/doc/668 6574-6900477.html.

〔7〕任谢楠.基于遗传算法的BP神经网络的优化研究及MATLAB仿真[D].天津:天津师范大学计算机与信息工程学院,2014.

〔8〕熊少康,王凌川,章家岩,郭许林,冯旭刚.基于BP神经网络的车辆动态称重技术[J].安徽工业大学学报,2014,31(1):76~79.

〔9〕张龙,汪新庆,刘岳,常力恒.一种 MapGIS 向ArcGIS地图数据转换的方法 [J].测绘科学,2014,39(7):146-149.

〔10〕Jay Belanger et.al.Mathematical Modeling for the MCM/ICM Contests[J].Higher Education Press,2015,Volume 1:1-20.

〔11〕张志涌,杨祖樱.Matlab 教程[M].北京:航空航天大学出版社,2015.

〔12〕李娟,龙四古.人类语言发展与制度调适——兼评中国现行外语教育制度[J].太原师范学院学报,2007,6(1):43-46.

中图分类号: TP391

文献标识码: A

文章编号: 1673-260X(2019)07-0065-05

收稿日期: 2019-03-29

基金项目: 国家自然科学基金(61701004);安徽省自然科学基金(1708085QA15);安徽省教学研究项目(2017jyxm1168)

通讯作者: 侯为根(1962-),男,安徽工业大学,硕士,副教授,主要研究方向为微分方程

标签:;  ;  ;  ;  ;  ;  

基于元胞自动机的世界语言发展趋势研究论文
下载Doc文档

猜你喜欢