(武汉理工大学 信息工程学院 武汉 430070)
摘要:为提高手写数字识别的准确性与实时性,本文提出了一种基于肌电信号和模板匹配的手写数字识别方法。首先对采集到的肌电信号进行降采样和去噪处理,然后利用动态规整算法迭代建立模板,然后使用DTW距离作为距离测度进行模板匹配。实验结果表明,该方法对6种手写数字的识别效果较好,平均识别正确率达到了93.66%。
关键词:肌电信号 动态规整 手写数字 模板匹配
引言
当前已经有研究者对基于肌电信号上肢静态动作识别做了深入的研究。例如,文献[1]中基于相关性分析对伸腕、屈腕、握拳等动作进行了有效识别。整体上看,这些信号是局部平稳、静态的。然而,人们在生活中做出的动作往往是非平稳的、动态的。除了肌电信号本身的随机性,动态信号的特征还牵涉到动作角度、用力大小等因素。这增加了动态信号处理和识别的复杂性,也要求我们使用更有效的方法对其进行处理和识别。
常见的手写数字识别方法常常基于用力、角度、位置等因素进行识别,也有方法从整体入手基于模板匹配进行识别[1]。考虑手写动作肌电信号的时域相关性很强,本文基于动态时间规整算法迭代得到匹配模板,对手写动作进行整体识别。
1 基本原理及方法
1.1 基于短时能量的动作端点判断
由于不同样本的差异性,在制作匹配模板之前需要先判断信号中动作的起始结束点,然后对信号做截断处理得到动作部分的信号。本文通过信号的短时能量来判断动作的起始结束点。首先确定一个基线值作为端点判断阈值,该值一般为信号的均方根值乘一个经验系数。然后取一个100ms宽度的滑动窗间隔20ms求信号的均方根值,如果该值第一次高于基线值则判断动作开始,若低于基线值则判断动作结束。
1.2 动态时间规整算法
在比较两个时间序列的相似性时,通常的做法是依据这两个序列之间的距离大小做判断。常用距离测度有欧式距离、马氏距离等。但是我们所要判断相似性的两个序列常常是不同长度的。在本论文中手写数字这一动作即便是同一个数字不同的人也会有不同的书写速度、力度和顺序,这会导致信号形状在时域上的位移与轻度畸变。所以此时用欧式距离等判据度量两时间序列相似性会使效果大打折扣。而动态时间规整算法是一种寻找最佳匹配位置的序列相似度检测算法,可以较好地度量两个时间序列之间的相似性。具体算法原理如下:
已知两序列和,长度分别记为和。为了对齐这两个序列,需要构造一个的矩阵网格,矩阵元素表示和两个点的距离,一般采用欧式距离,,每一个矩阵元素也表示点和对齐[2]。然后此问题转化为为寻找一条从端点到端点的最短路径的问题,路径通过的格点即为两个序列进行计算时对齐的点 [3]。
该路径为规整路径,表示为,的第个元素定义为,定义了序列到的映射,即:
该路径除了要满足边界约束外,还要满足连续性和单调性的要求。所以每个格点去往的下一个点只有三种可能。即若路径通过格点,那么下一个格点在,或之间产生。
我们需要找到一个使下面的规整代价最小的路径:
这里定义一个累积距离。从点开始匹配这两个序列和,每到一个点,之前所有的点计算的距离都会累加,到达终点后,这个累积距离就是最后的总的距离,也就是序列和的相似度[4]。累积距离为点和的欧式距离与可以到达该点的最小的邻近元素的累积距离之和[4]。
累积距离达到最小值的路径就是最佳路径。该路径可借助动态规划算法求解。
2 实验研究与结果分析
2.1肌电信号数据采集与预处理
上肢不同肌肉群对手写动作产生的肌电信号贡献不同,对肌电信号采集仪器的敏感程度也不同。通过反复实验,我们选取了位于小臂表面的旋前圆肌、尺侧腕屈肌、桡侧腕屈肌和掌长肌作为手写数字时的表面肌电信号采集源。实验对象为5名20至26岁健康男性,以正常速度书写0到5这6个阿拉伯数字。采集设备选用Delsys公司的Delsys表面肌电仪,采集频率为1000,采样精度为16,数据通过蓝牙传送到计算机上,在手写数字过程中,通过四路通道同时采集四块肌肉的表面肌电信号[5]。
因为单个时间序列的数据点很多,使得后续的算法运行时间过长,所以我们对信号进行降采样处理,采样率降为100Hz以提高后续处理速度。表面肌电信号的能量集中在20-150Hz的频段内,在500Hz之外的频率没有有用的信息存在,所以我们对信号进行20-450Hz的带通滤波和50Hz陷波,以去除部分噪声干扰,最后将信号取绝对值做翻转处理。
2.2模板制作与迭代
在制作模板前,将每个样本的信号基于经验模态分解算法做了平滑滤波处理,得到信号的外轮廓以进行下一步操作。
每个字符的模板长度取决于对应样本的平均长度,由于每个样本长度,所以每个样本都在平均之前被伸缩到模板长度并通过插值补全序列后再平均[1]。之后DTW算法就可以用来计算出每个样本相对于其对应模板的偏移点。通过这些偏移点再对样本进行部分偏移点的调整,然后再做一次平均。如此迭代下去,直到得到的模板达到较理想的效果。实验发现,基本一次迭代就可以达到较好的效果,再进行迭代改善的效果并不明显。
2.3结果分析
对于一个特定样本,它将与6个制作好的模板都计算一次DTW距离,最小值对应的模板就是该样本识别得到的结果。每个实验者各自书写了每个数字10次,所以我们总共采集到300个样本的数据。
为了观察该方法的有效性,我们还将所有样本与模板均伸缩到同一长度,使用欧式距离作为距离判据重复了该实验。最终得到的每个数字的识别结果如下表所示:表1 手写识别结果对比
经过反复实验得出如下结论:使用DTW距离作为距离判据对手写0、1、2、3、4、5这6个数字进行模式识别,准确率达到了93.66%,而将距离判据换位欧氏距离后准确率就下降为89.33%。这表明DTW距离较好地应对时域上有位移、轻微畸变的信号,而欧氏距离对于时域上的偏移则显得颇为乏力。进一步分析发现4、5这两个数字相对于其他四个数字的识别率较低,这是因为4、5的的结构相对于其他数字更复杂,导致其模板在时域上局部特征不够明显,最终造成识别率下降。
4 结语
本研究尝试使用动态规整算法更合理地比较两时间序列之间的相似性,并将其应用于基于肌电信号的手写识别,达到较高的识别准确率。实验中发现,由于该方法是基于模板的整体识别方法,所以它对受试者个人的书写习惯比较敏感。我们希望继续提高该方法的普适性,使其能够适应具有不同书写风格的使用者。
参考文献:
[1]黄淦. 生物表面电信号建模、分析及其在人机交互中的应用[D].上海交通大学,2013.
[2]吴洪亮 李卡尔 杨金塔 陈勋俊. 水文时间序列相似模式搜索的研究[D]. 现代计算机, 2013.
[3]陈立万.基于语音识别系统中DTW算法改进技术研究[J].微计算机信息,2006(05):267-269.
[4]翁兆廷. 语音生词本的分析和实现[D]. 东华大学, 2015.
[5]高发荣 王佳佳 席旭刚 佘青山 罗志增. 基于粒子群优化-支持向量机方法的下肢肌电信号步态识别[D]. 杭州电子科技大学智能控制与机器人研究所, 2015.
论文作者:王子晨,缪林良,冯思棋
论文发表刊物:《科技研究》2018年8期
论文发表时间:2018/10/23
标签:电信号论文; 距离论文; 序列论文; 模板论文; 数字论文; 信号论文; 算法论文; 《科技研究》2018年8期论文;