中国汽车技术研究中心有限公司
引言
在现代化信息技术的支持下,计算机技术为智能人工技术发展奠定良好基矗以计算机技术为支持的智能计算技术涉及了统计学、逼近论、算法复杂论以及凸分论等学科知识,可通过计算机技术,利用自身的学习经验,在自我系统中不断完善自身性能。以计算机规律性信息数据为支持,在计算机中找到规律性信息,获取知识经验,实现计算机技术的智能化,使得计算机向人工智能方向发展。
1概述
机器学习是AI人工智能的一个分支,在人工智能的时代机器学习作为一门重要的分支越来越受到学术界以及社会的关注,机器学习是一门涉及多领域的交叉学科,涉及统计学、凸分析、概率论、算法复杂度等多学科多门类,通过研究计算机相关模拟性能以及人类学习习惯和行为来获得新的技能或者新知识,并且根据自身框架结构不断优化完善自身体系性能。在此基础上持续优化模型,使得后续工作执行得更好。机器学习是令计算机不呈现程序即可显示获得某些功能的学习领域,也是计算机自身获取知识并逐步反馈逐步改进提示的过程。机器学习的研究需要以神经网络,统计分类等统计学,生物学为基础,让机器模拟人类学习过程。对此需要输入巨量的数据和学习样本以形成人类所知的"经验",不断重复拆分、回归、聚合,最终得到元素间的关系并可依此形成类似经历的判断和预测。因此也应用于数据挖掘,大数据处理等基于海量数据的预测,应用领域十分广泛,涉及大数据分析、数据深度挖掘、自然语言处理、搜索引擎、语音识别、机器人控制应用等。
机器学习的本质在于数据的整合归纳,模型的建立和算法的改进。在整个学习过程中,最基本的条件是持续的外界反馈,以某种方式形成的外界信息源,运用算法将获取的外部信息加工成为"经验",并储备在内在的数据库里。数据库根据建立的原则和规律提供执行的行动,而行动过程中获得的外界信息又成为了新的反馈来源,对下一次的行为提供新的指导信息。
2机器学习分类内容
机器学习中数据处理以人为标注为标准判断机器学习,主要有监督和无监督两种形式。监督学习是将学习目标采取具有标签的数据辅助完成学习,这种学习方式在实践中效果显著。但是,采取监督学习方式成本较大,价格昂贵。采用先进无监督学习则通过计算机自身自动化技术学习,以多种数据完善先验式知识吸收,整体上成本可控,不需要大量资金投入;但是,这种学习方式的实际效率较低。
2.1监督学习
监督学习以人为方式标注目标,初始训练数据是监督学习中需收集的必然数据。监督学习能够将机器自身泛化能力充分发挥出来,可以有效解决分类和回归问题。这种监督学习经典算法为卷积神经网络、多层感知机和逻辑回归等。经典方式由BN、SVN、KNN以及CBR等组成。由标注特征对机器展开数据集训练,使其能够学习对不同事物的合理划分,以学习的方式对规则、规律数据进行预测。
2.2无监督学习
无监督学习中,机器在未标记样本数据时,不进行的训练,开展无监督学习。无监督学习可以在机器学习中及时区分一些原理相似性概念,无监督学习可以和人类一样学习需要的知识。这种无监督的学习经典性算法分为深度置信网络、受限玻尔兹曼机、自动编码器等内容,在解决聚类问题上有广泛的应用。
3机器学习的经典算法
机器学习目标是在一定的网络结构基础上,构建符合要求的数学模型,选择合理的学习方式和数据训练方法,学习输入数据的内在模式和数据结构,不断调整内部参数,通过数学工具求解模型最优化的预测反馈,提高泛化能力、防止过拟合进行半独立甚至独立的繁琐性工作。机器学习算法主要是指通过数学及统计方法求解最优化问题的步骤和过程,下面以机器学习领域经典的BP算法、卷积神经网络和深度学习算法来介绍。
期刊文章分类查询,尽在期刊图书馆
3.1BP算法
BP算法属于有监督学习,该算法的基本原理如为浅层前向型神经网络计算模型,包含输入层、隐藏层和输出层,由大量神经元作为网络节点彼此连接,每个神经元通过激励函数处理作为网络权值的连接强度信号,通过调整这些连接强度,将输入数据中包含的模式信息映射到输出层。
3.2卷积神经网络
本质上,卷积神经网络是一种带有卷积结构的多层前馈神经网络,但区别于传统的全连接前馈神经网络,CNN具有局部连接和参数共享的重要特征,从而减少了连接和权值的数量,降低了网络模型的复杂度,提高了计算效率,特别是网络规模越大、效果越显著。另外,CNN通过层叠的卷积和下采样操作自动提取具有平移不变性的局部特征。
3.3深度学习算法
深度学习是机器学习的一个最新分支。Hinton等人于2006年提出基本概念,是机器学习基于数据辩表征学习的方法,用半监督式或非监督式的特征学习和分层特征提取高效算法来替代手工获取特征。人们一直在研究数字神经网络与人类大脑间的关系,随着对生物神经科学和计算机技术深入研究及它们的发展与应用,人们逐渐认识到神经网络的分层计算模型与人类大脑结构的特定区域相对应。近年来,深度学习模型的研究与应用成果也进一步证明了这个事实。因此,深度学习网络模型是最接近人类大脑的智能学习方法和认知过程,这也是其实践应用的理论依据。
4机器学习未来与发展
4.1非监督学习
非监督学习,目前还未是一门成熟的学科,主要关注统计数据密度问题,在训练中所需的已标识数据是经人工处理而成,且需由相关人家进行,获得大量的数据成本高,且也难度大。也因此非监督学习,针对从无标注的数据中学习将成为未来研究重点方向。
4.2模型尺寸上的优化
当前普遍使用的模型,尤其是自然语音处理的模型,大小均超过500M。如何能在小设备,比如移动设备上的使用是一种挑战。移动设备一般对于存量、大孝功耗等都有一定限制,而模型的过大则成为了一大制约因素。若未来能将机器学习技术广泛应用于移动端,需通过两方面的优化来改善该未来:使用压缩技术进行模型压缩,抑或改变算法以改变大校
4.3智能化发展
将深度学习与知识,逻辑等人类思维模式结合,推进人工智能的发展,获得如人类一般的学习能力。将知识与数据整合,提高模型训练的速度和精度,使得人工智能更加贴近人的思维和决策方式。
4.4博弈机器学习
博弈机器学习是面对人类的行为(非随机性、个别情况不理性、对立性)事实具有规律性可循的特点,进行人机之间建模分析,并且运用数据分析解决生活中问题包括社交媒体、交通疏导等,假若进行更深一步的运用,则是复杂和动态决策。如股票预测,需根据时间变化来不断预测何时买入卖出,以及多种因素和变量会对决策产生影响。因此,未来的发展可延伸至研究复杂动态性多因素之间的关系,根据观察环境甚至周围相似个体做出更为准确的预测。
结语
机器学习是基于神经网络,研究人工智能的核心技术,主要通过监督学习,来解决分类、回归、聚类和规则抽取四类主要问题,目前主要应用的领域有专家系统,图像,生物识别,通过模型,分类器的学习,对新事物做出判断。但目前机器学习主要解决的问题是认知性问题,在实际生产中,因环境,动态变化等制约,适用范围仍较窄。
参考文献
[1]王琦,操晓春.中国计算机学会通讯[J].2015,P60-62.
[2]葛恭豪.机器学习算法原理及效率分析[J].电子世界,2018(1):65-66.
[3]陈嘉博.机器学习算法研究及前景展望[J].信息通信,2017(6):5-6.
论文作者:赵明 刘复星
论文发表刊物:《科技尚品》2019年第1期
论文发表时间:2019/7/18
标签:机器论文; 算法论文; 数据论文; 神经网络论文; 模型论文; 卷积论文; 人类论文; 《科技尚品》2019年第1期论文;