摘要:人工智能是集合了计算机科学、逻辑学、生物学、心理学和哲学等众多学科,在语音识别、图像处理、自然语言处理、自动定理证明及智能机器人等应用领域取得了显著成果。人工智能在社会发展中扮演着不可或缺的角色。人工智能在提升劳动效率、减低劳动成本、优化人力资源结构及创造新的工作岗位需求方面带来了革命性的成果。
关键词:计算机;人工智能;数学算法
1 计算机视觉的发展
人们认识世界,91%是通过视觉来实现。同样,计算机视觉的最终目标就是让计算机能够像人一样通过视觉来认识和了解世界,它主要是通过算法对图像进行识别分析,目前计算机视觉最广泛的应用是人脸识别和图像识别。传统图像分类的方法主要经过2 个步骤: 特征提取和训练分类器。特征提取通用的方法主要包括2 种,使用通用特征提取和使用自己设计的特征提取。例如在人脸识别中,使用HOG,LBP 等通用特征进行检测。选定特征之后,使用传统的机器学习方法,例如adaboost 等建模方法训练分类模型,然后选择效果最好的模型进行调参,最终生成人脸检测模型。自2015 年之后,图像处理使用深度学习进行分类的方法得到了广泛应用。神经网络通过神经元构建成网络,通过激活函数使模型具有非线性拟合能力。只需要给模型设计好输入和输出,模型就能自动学习特征提取和训练分类器的过程。深度学习的使用让图像分类过程中最为费时费力的过程得以简化,提升了图像分类的效果和效率。VGG,ResNet( 残差神经网络),inception 这几种结构是工程中最常用的。工程上使用的模型必须要兼顾效率和效果,即在保证精度的同时也要保证速度。所以,在训练好模型之后会对模型进行微调和缩减。FRCNN,Mask-RCNN,YOLO是现在常用的网络模型,这几个模型拥有的共同点就是精度高、速度快。例如应用在人脸识别领域,这几个模型都可以实时检测并得出结果。
期刊文章分类查询,尽在期刊图书馆目标跟踪主要有3 类算法,相关滤波算法、检测与跟踪相结合的算法和基于深度学习的算法。相关滤波( Correlation Filter,CF) 是当前研究的一个重点,最初它应用在信号领域,之后引入目标跟踪领域。它引入了快速傅里叶变换从而使得算法效率得到有效提升。MOSSE是目标检测算法中应用最早的算法。在研究过程中在实时性应用方面做出突破的算法是CSK。在CSK 的基础上进行改进,产生了KCF 算法。之后还提出了CN,DSST,SRDCF等算法。检测与跟踪相结合的算法,简单来说就是目标跟踪的判别式算法。算法的实现理念是先找出目标的位置,然后再对目标进行跟踪。深度学习的推广也影响到目标跟踪研究。基于深度学习的算法有分类和回归两类。R-CNN,Fast R-CNN,Faster R-CNN是基于分类的算法。3 种算法最大的不同在于检测窗口的选择,R-CNN 采用滑动窗口,Fast R-CNN 采用SelectiveSearch,Faster R-CNN 采用RPN。计算机视觉就是将图片分割成像素,然后对像素进行处理。语义分割的意义是理解分割后像素的含义,例如图片中识别人、摩托、汽车及路灯等,它需要对密集的像素进行判别。卷积神经网络推动了语义分割算法的发展。语义分割中最基础的方法是通过滑动的窗口进行分类预测。2014 年,全卷积神经网络(FCN) 的出现替代了网络全连接层。基于FCN 研究出Encoder -Decoder 架构。Encoder 是降低空间维度的操作,Decoder 是恢复空间维度和细节信息的操作。之后空洞卷积( Dialated /Atrous) 取代了Pooling 操作。空洞卷积的优点是它可以保持空间分辨率。除了之前的几种方法,还有一种叫条件随机场(CRFs)的方法来提升分割效果。
2 机器学习的发展
机器学习的基本思想是通过计算机对数据的学习来提升自身性能的算法。机器学习中需要解决的最重要的4 类问题是预测、聚类、分类和降维。机器学习按照学习方法分类可分为: 监督学习、无监督学习、半监督学习和强化学习。监督学习指的是用打好标签的数据训练预测新数据的类型或值。根据预测结果的不同可以分为2 类: 分类和回归。监督学习的典型方法有SVM 和线性判别。回归问题指预测出一个连续值的输出,例如可以通过房价数据的分析,根据样本的数据输入进行拟合,进而得到一条连续的曲线用来预测房价。分类问题指预测一个离散值的输出,例如根据一系列的特征判断当前照片是狗还是猫,输出值就是1 或者0。无监督学习是在数据没有标签的情况下做数据挖掘,无监督学习主要体现在聚类。简单来说是将数据根据不同的特征在没有标签的情况下进行分类。无监督学习的典型方法有k-聚类及主成分分析等。k -聚类的一个重要前提是数据之间的区别可以用欧氏距离度量,如果不能度量的话需要先转换为可用欧式距离度量。主成分分析是一种统计方法。通过使用正交变换将存在相关性的变量,变为不存在相关性的变量,转换之后的变量叫做主成分。其基本思想就是将最初具有一定相关性的指标,替换为一组相互独立的综合指标。半监督学习根据字面意思可以理解为监督学习和无监督学习的混合使用。事实上是学习过程中有标签数据和无标签数据相互混合使用。一般情况下无标签数据比有标签数据量要多得多。半监督学习的思想很理想化,但是在实际应用中不多。一般常见的半监督学习算法有自训练算法、基于图的半监督算法和半监督支持向量机。随着Alpha Go 的火热,强化学习成为了当前最火热的研究领域之一,强化学习词热点居高不下。强化学习是通过与环境的交互获得奖励,并通过奖励的高低来判断动作的好坏进而训练模型的方法。自然语言处理( NLP)是指计算机拥有识别理解人类文本语言的能力,是计算机科学与人类语言学的交叉学科。自然语言是人与动物之间的最大区别,人类的思维建立在语言之上,所以自然语言处理也就代表了人工智能的最终目标。机器若想实现真正的智能自然语言处理是必不可少的一环。自然语言处理分为语法语义分析、信息抽取、文本挖掘、信息检索、机器翻译、问答系统和对话系统7 个方向。句法语义分析,是对于给定的语言提取词进行词性和词义分析,然后分析句子的句法、语义角色和多词义选取。信息抽取,是指从给定的一段文字中抽取时间、地点和人物等主要信息,以及因果关系等句子关系。文本挖掘,对大量的文档提供自动索引,通过关键词或其他有用信息的输入自动检索出需要的文档信息。机器翻译,输入源文字并自动将源文字翻译为另一种语言,根据媒介的不同可以分为很多的细类,如文本翻译、图形翻译及手语翻译等。问答系统,是提出一个文字表达的问题,计算机可以给出准确的答案,过程中需要对问题进行语义分析,然后在资料库中寻出对应答案。对话系统,指计算机可以联系上下文和用户进行聊天及交流等任务,针对不同的用户采用不同的回复方式等功能。
3 结束语
计算机是一门科学,也是一门不断发展和前进的科学,计算机人工智能技术的发展势不可挡,作为相关企业和技术研究行业,必须要认识到数学算法在人工智能技术开发中的重要作用,并能够通过不断完善计算机人工智能算法,推动计算机人工智能技术不断优化,实现人工智能在更多领域的有效应用。
参考文献
[1]姜野. 算法的规训与规训的算法:人工智能时代算法的法律规制[J]. 河北法学,2018,(12):142-153.
[2]陈永晔,张恩龙,张家慧等. 基于影像学的多种人工智能算法在肿瘤研究中的应用进展[J]. 磁共振成像,2018,(10):796-800.
论文作者:卢毅强
论文发表刊物:《防护工程》2019年8期
论文发表时间:2019/8/2
标签:算法论文; 人工智能论文; 计算机论文; 模型论文; 语义论文; 自然语言论文; 数据论文; 《防护工程》2019年8期论文;