基于熵和神经网络的世界语言人数预测模型
郭家泰 盘何旻 韦 可
中南大学 湖南长沙 410006
摘 要: 随着时代的进步,全球的语言正发生着巨大的变化。语言的交流与人数增长趋势将对经济全球化的发展带来影响。基于以上问题,我们用建立模型的方法,利用熵权法初步处理不同语言各个维度信息,再利用神经网络来预测未来各语言人数的发展趋势。
关键词: 世界语言人数;熵权法;神经网络
近年来随着科技的进步与世界文化的融合与交流,随之而来的是语言的问题。目前地球上大约有6900种语言。说某种语言的人口总数受到多种因素的影响,比如移民政策,国际交流等。在学校、迁移的文化团体和移民国等地的人们很有可能会说第二语言。此外,在我们经济全球化发展的的世界中,还有一些额外的因素使得地理上相距遥远的语言可以相互作用。这些因素包括国际贸易的兴起,世界旅行的增加,社交媒体与电子通讯的发达,以及技术的进步可以实现快速和简单的语言翻译。因此研究语言分布人口总数就有着重要的意义。
1 研究方法概述
(1)熵目前在工程与经济等领域得到了非常广泛的应用。根据信息论基本原理,信息用来度量系统有序程度,熵是用来度量系统无序程度;如果指标的信息熵很小,表明该指标拥有的信息量很大,在综合评价中起着更大的作用,权重就会更高。[3]因此,我们可利用信息熵这个工具,得到每个指标的权重。
(2)神经网络。人工神经网络是在现代神经科学的基础上提出和发展起来的,旨在反映人脑结构及功能的一种抽象数学模型。[1]人工神经网络基本神经元模型包括一组连接,一个求和单元和一个非线性激活函数还有一个阈值。连接中的强度用权值表示,权值为正表示激活,反之表示抑制。
J是输出均方误差,w是权值,t是期望输出,y是实际输出。
通过训练,我们不断改变网络权重,使输出均方差最小化。[2]
2 研究过程
细看已有的村落研究,往往将村民文化的全部等同于“民俗”,似乎村民的文化生命要依凭在“民俗传承”方面的担当来衡量。厘清民与俗的关系,有助于拨开笼罩于民俗乃至村落研究之上的迷雾。王霄冰认为:
我们的观点是,要预测每种语言中母语人口数量的变化,实际上要研究他们的增长率。事实上,有许多因素直接或间接地影响了人口的增长。因此,我们将这些因素分为两大类:正面和负面。从这个角度来看,我们指的是影响增长率的以下因素:
r1是语言人口增长率,k是影响因子,w是权重。
对于上述因素,我们需要知道影响程度,即每个影响因子的具体权重,为此我们引入了熵权法来评估这些因素。基于熵方法,我们计算每个影响因子的权重,通过上述权重,我们可以得到人口变化率的实际表达:
消极因素:全球恐怖主义指数;脆弱国家指数。
中药质量的评价方法是传统中药制剂进入世界及被国际认可的关键所在。而中药指纹图谱已被业内人士认可,具有广阔的发展空间。由于中药指纹图谱全面反映了中药内在化学成分的种类与数量,与中药活性成分研究密切相关,因而能体现出中药的内在质量。护肝剂是由山茱萸、芍药、黄芩等几味中药经提取加工而成的制剂,而指纹图谱能较为全面、客观地反映该制剂对抗肝损伤的诸多活性成分。根据中医学整体观念的理论,通过护肝剂复方中活性成分间的协调作用,达到对肝损伤小鼠机体多层面的调节,有效改善肝功能。可见中药指纹图谱为中药质量控制和监督提供了一种有效的方法。
r 1=k 1w 1+ k 2w 2
积极因素:国家收支平衡;对生活指数的满意度;人类发展指数;智能手机普及率排名。
在实际情况中,可以随机获得值矩阵中的值,并且根本没有特定的顺序。因此,我们使用数学软件来模拟随机过程并将数据带入预测。根据结果显示每种语言都是一个波浪上升的过程。除了比其他语言具有更大基距的中文外,其他语言相对接近。由于影响因素的影响,语言将有不同的增长趋势,因此此时发生的变化将改变原始排名。
首先,我们收集关于每年说一种语言的人数的数据,以及使用该语言作为官方语言的主要国家的得分。我们希望根据人口增长和各种因素对增长率的影响来预测语言的人口分布。在此基础上,我们构建模型。我们清楚地知道,每种语言的人口分布都与文化交流,经济发展和国家政策等有关。我们的模型将考虑这些因素,以便能够全面分析每个因素的变化对结果的影响。
3 结果分析
为了综合考虑多种因素对语言数量变化的影响,我们用BP神经网络对权重不断的优化。我们使用BP神经网络模型进行不断的训练,并获得正确的权重,以便我们可以预测各种语言的人口增长模型。我们分析了前十名的语言并预测了人口的分布。
经济全球化给国际航运产业的发展带来了广阔的前景,大量的中国船东和船舶经营者活跃在国际航运市场中。船舶贸易需要精通船舶技术、经济、法律、经营等能力的复合型人才参与,作为航运类高校承担着培养国际船舶贸易人才的职责。《船舶贸易与经营》是我校船舶与海洋工程专业的一门专业拓展选修课。主要讲述国际船舶贸易、船舶融资、船舶建造招投标、二手船买卖合同等内容。这门课的教学目标是使学生掌握国际航运、造船、买卖船、融资等方面的知识,为今后从事船舶贸易、船舶融资等方面的工作奠定理论基础。
第二语言人口预测,与我们处理母语人群的方式相同,我们还提到了两个影响因素来预测每种语言的外语人口变化。以下是影响因素:世界旅游排名;世界移民排名同样使用熵权法与神经网络预测,我们得到了这些语言人数的发展趋势通过收集前几年的数据,收集的数据将在一定程度上与现有数据四舍五入。以中文为例,将数据引入神经网络进行训练,得到了预测结果。因此,由于诸多因素,虽然未来几年会有一些增长,但人口增长将在2020年后逐渐放缓,最终趋于饱和。最后,基于神经网络预测方法,我们得到了50年后每种语言的人口(总数)变化。我们通过预测预测后面没有超过前10种语言,但内部排名已发生变化。例如,印度排名更高,而马来西亚排名更低。
我国的书法学习也正在如火如荼地展开。从幼儿时期注重书法教育的基础训练,到现在的学校普及书法教育,书法教育开始呈现出一种如火如荼的趋势,对于广大书法爱好者形成书法认知能力和审美能力具有杰出的作用。在这个黄金时期,人们感受到了书法教育的功在当代、利在千秋的博大力量,更能感受到书法艺术的时代价值。从中可以通过书法教育折射祖国文化,感悟国学的力量,从而更好感受到书法艺术对于修养身心、陶冶心灵的博大作用。同时,在对书法的学习中,更好地启迪自我创造,形成自己的书法修养,具有突出的意义。
4 结语
在接下来的五十年中,特别是在2020年之后,每种语言的用户数量将逐渐增加甚至变得饱和。前十种语言尚未被其他语言取代,但内部顺序已发生变化。通过BP神经网络算法对熵方法模型进行改进,预测各种语言用户的发展趋势,得到更加合理的结果在预测人数时,我们通过熵方法得到所有研究影响因子的权重,以便更准确地衡量每个因素对增长率的影响。并且通过神经网络优化,预测结果可以更符合实际增长模型。此外我们的模型也有很多需要改进的地方:我们在假设我们收集的数据是正确的情况下构建模型,并且在数据收集和处理过程中可能存在一些主观因素。而且当我们预测人口时,我们忽略了一些快速变化的因素,如国家政策和该地区的热点。真正的体重变化会更复杂,考虑到这些因素需要进一步研究。
参考文献:
[1]司守奎.数学建模算法与程序[M].第二版.海军航空工程学院.
[2]屈桢深.人工神经网络理论及应用.哈尔滨工业大学.
[3]倪九派,李萍,魏朝富,等.基于AHP和熵权法赋权的区域土地开发整理潜力评价[J].农业工程学报,2009,25(5):202-209.
作者简介: 郭家泰,男,汉族,河北人,本科,自动化专业,中南大学自动化学院学生。