王井东[1]2004年在《线性与核高斯模型及其混合模型的研究》文中指出为观察变量找到相应的隐含变量是一种有效的概率建模的方法。这种方法包括两个部分:(1)建立观察变量与隐含变量的联合概率;(2)通过求边缘概率的方法获得观察变量的概率分布。这类模型称为隐含变量模型。本文考虑变量符合高斯分布的线性隐含变量模型,称之为线性高斯模型(Linear Gaussian Models, LGM)。本文将从以下叁个方面展开讨论:首先,讨论现有的线性高斯模型之间的关系,证明了概率主成分分析(Probabilistic Principal Component Analysis, PPCA)与概率子空间分析(Probabilistic Subspace Analysis, PSA)的等价性,通过对噪声模型做新的不同假设推广了现有的混合线性高斯模型(Mixture of Linear Gaussian Models, MLGM),并且给出了统一的框架。其次,提出了新的非线性隐含变量模型:核高斯模型(Kernel Gaussian Models, KGM)。核高斯模型有两个特点:(1)非线性化观察变量,这点与传统的非线性隐含变量模型中非线性化隐含变量是不同的;(2)引入核方法来有效的估计模型。进一步,提出混合核高斯模型(Mixture of Kernel Gaussian Models, MKGM)以实现非线性概率估计。与混合线性高斯模型相比,处理非线性问题时混合核高斯模型往往会取得较好的效果。最后,讨论了谱聚类(Spectral Clustering)与一种核高斯模型—核主成分分析(Kernel Principal Component Analysis, KPCA)之间的关系,指出谱聚类是一种特殊的加权核主成分分析模型。在此基础上,提出了加速的谱聚类算法。本文设计了大量的实验,如数据聚类、图像压缩、图像分割以及字符识别,来验证本文提出的新模型新算法的有效性与正确性。
李亚玲[2]2011年在《视频监控中运动目标检测与跟踪算法的研究》文中认为智能视频监控是在无人监督的情况下,利用计算机视觉技术和图像视频分析技术对摄像机拍录的图像序列进行自动分析,实现对场景中目标的检测、跟踪和识别,并在此基础上进行更高层次的判断和处理。本文主要研究智能视频监控中运动目标的检测与跟踪算法。在运动目标检测方面,首先,本文对背景差分法中的混合高斯模型进行了实验仿真,并对该模型不能应对光线突变而造成大量误检的问题进行了分析。在局部光照的扰动情况下,根据产生误检的原因,选择了新的模型参数,并对模型的更新机制进行了改进,即对方差的更新加入了自适应的更新因子,使其可以适应局部的光线的扰动;在全局光照突变的情况下,以帧间判断为依据选择性地更新均值以适应光照的突变。实验结果表明,改进的算法可以应对光照突变的问题。其次,针对依靠单一信息统计建模存在的缺点,提出了一种基于颜色和纹理的背景模型的运动检测方法,即用基于颜色信息的混合高斯模型和基于纹理信息的Uniform LBP模型在决策层上进行融合的算法。该算法不仅保留了混合高斯模型的优点,而且解决了运动物体和背景颜色相近时产生的漏检问题,同时可以有效地消除阴影。在运动目标跟踪方面,运用基于Mean Shift(均值偏移)的目标跟踪算法和基于Kalman(卡尔曼)估计器的目标跟踪算法分别对弱小目标进行了跟踪实验,在实验分析的基础上总结了两种算法的优缺点。对两种算法都不能连续跟踪弱小目标的情况,结合两种算法的优点,首先用Kalman滤波器根据前一帧目标质心信息和运动位移信息预测目标在当前帧的可能位置,然后利用Mean Shift算法在这个位置的邻域内寻找最终的目标位。实验表明改进后的方法能有效地在复杂背景和遮挡情况下跟踪弱小目标。
敬晓英[3]2011年在《关于若干回归模型的研究》文中研究指明回归分析是一个经典的统计模型,其参数估计的常规方法是最小二乘法。近年来,回归分析有了很大发展,产生了不少新的模型和估计方法。本文尝试将其中的一些模型和方法进行理论分析和数值验证,以期对实际应用者和理论研究者提供有益的参考。本文主要研究内容如下:1、关于高斯混合回归模型的理论分析与模拟实验研究。首先,引入高斯混合模型,讨论其参数估计方法。进而给出高斯混合回归及其相关理论,并进行模拟实验,通过同其他常用常规回归方法的对比,分析模型的理论结果,在模型精度、稳健性等方面对模型进行全面评价;2、关于混合回归模型的理论分析与模拟实验研究。基于混合回归模型的基本理论,讨论现有的一些参数估计方法,提出MCMC方法的实施策略,通过计算机模拟对模型和参数估计进行分析和评价,并与EM参数估计方法进行比较;3、关于多层次回归模型的理论分析与模拟实验研究。引入多层次回归模型的基本理论,包括基本的模型类型、相关参数的估计方法等,比较现有的回归方法,并通过实际数据实验对多层次回归模型进行分析和评价。
酆勇[4]2016年在《基于深度学习的说话人识别建模研究》文中研究表明说话人识别是利用人的发声特点自动对说话人进行区分,从而鉴别说话人身份的技术。由于其实用性,在金融、安防、公安、司法、军事和信息服务等领域都具有广泛的应用前景。目前,复杂背景(多环境、多传输通道)下的说话人识别中,i-vector模型框架融合了高斯混合-通用背景GMM-UBM模型、总体变化i-vector模型和线性判别分析LDA模型等叁种模型,其中GMM-UBM模型得到的高斯超向量较好的描述了语音特征的数据分布,i-vector模型通过因子分析将高维的高斯超向量降维得到能表征说话人身份的低维的总体变化因子(即i-vector),LDA模型通过通道补偿将总体变化因子进一步类内距离最小类间距离最大,取得了较好的识别效果,是当前的主流技术。然而,i-vector模型框架中总体变化模型和线性判别分析模型都是建立在说话人信息和通道信息线性可分的假设之上,但实际上仅通过线性空间关系,难于准确地将两者有效分离。这就限制了模型在复杂实际环境中的性能。近年来,得益于深度学习较强的深层信息抽取和非线性建模能力,深度学习理论在诸多机器学习领域都取得了成功的应用。为了进一步提高文本无关说话人识别的性能和鲁棒性,本文将深度学习引入到说话人识别的建模框架中,利用深度学习模型具有的深度非线性结构特征,在因子分析建模层面和通道补偿建模层面分别进行了探索,并对这些方法在海量数据及大规模人群条件下的说话人识别应用进行了性能评估和分析。所取得的主要工作成果和创新点如下:1.在因子分析建模层面,针对i-vector模型基于线性降维难以保留原始数据中非线性特征的问题,提出了一种基于受限玻尔兹曼机的总体变化因子建模方法来替代传统i-vector模型。该方法通过假设受限玻尔兹曼机的可见层和隐层服从高斯分布或伯努利分布,经推导后得到类似i-vector的数学表达式,并在此基础上构建了基于高斯-伯努利和高斯-高斯受限玻尔兹曼机的说话人特征向量提取器(RBM-i-vector),将高维的高斯超向量通过非线性降维映射到低维表示,并附加LDA线性判别分析模型,获得了较好的性能。在增加受限玻尔兹曼机网络层数的条件下,识别性能可进一步提升。此外,基于该建模方法的说话人系统与传统的i-vector系统进行系统融合后,识别性能还可进一步提升。2.在通道补偿建模层面,针对线性判别分析LDA模型线性区分能力不足的问题,提出了一种i-vector空间下基于深度神经网络的非线性度量学习建模方法来替代传统LDA模型。区别于传统的线性度量学习方法,该方法分别采用受限玻尔兹曼机和独立子空间分析网络来堆迭成深度神经网络,通过深度神经网络的非线性函数特性,将特征从原始i-vector空间变换到其它子空间进行通道补偿,同时将度量学习的侧信息约束和深度神经网络结合起来,在此基础上计算两条语音之间的相似性,以获得更好的区分特性。实验证明,该方法可以有效的提高说话人识别建模的区分性,提升说话人识别系统的性能。3.将上述两种基于深度学习的建模方法融合,提出了基于深度受限玻尔兹曼机的总体变化因子建模和基于独立子空间分析网络的深度非线性学习建模相结合的建模方法(RBM_ISA模型),完整替代传统i-vector模型和LDA模型,实现将高维的高斯超向量通过非线性降维得到能表征说话人身份的低维的总体变化因子RBM-i-vector,再采用非线性度量学习分类,进一步提升了说话人识别系统的区分能力,相比上述两种基于深度学习的模型和传统i-vector框架模型,均获得了更好的说话人确认性能。4.针对现有说话人识别系统多是在中小规模数据集基础上进行性能评估,鲜有面向几十万大规模数据集的说话人识别性能评估和分析研究的问题,通过构建一个40万级的大规模真实说话人语音库,对传统基于i-vector模型框架的说话人识别系统以及本文所提出的基于RBM_ISA模型的说话人识别系统的性能进行了评估,给出了40万人大规模声纹库条件下和40万人大规模测试语音条件下的两种说话人识别系统的说话人辨认性能,并分析了信道失配对海量语音说话人识别性能的影响,为说话人识别技术真正走向实用提供了有价值的分析和参考。
徐治非[5]2009年在《视频监控中运动目标检测与跟踪方法研究》文中进行了进一步梳理智能视频监控技术是近年来计算机视觉研究领域中新兴的一个研究方向。它的主要研究目标是利用计算机视觉技术、图像视频处理技术和人工智能技术对监控视频的内容进行描述、分析和理解,并能根据分析的结果对视频监控系统进行控制,从而使视频监控系统具有较高层次的智能化水平。它的主要研究内容包括:监控视频运动目标的检测、目标的跟踪、目标的识别和目标的行为分析等。本文致力于智能视频监控中的运动目标检测与跟踪方法研究,主要完成以下几方面的创新性工作:1.提出了基于递归误差补偿的特征背景建模方法来检测运动目标,通过对特征背景建模方法中的重建参考背景图像进行递归误差补偿,来减少前景目标对特征背景模型的影响,从而提高检测率;提出了一种自适应、鲁棒的阈值选择方法,该方法首先利用背景差图像的积累直方图的变化点信息来得到全局阈值,利用背景训练图像局部像素的统计信息来得到局部阈值,综合全局阈值和局部阈值的信息,可以在有效地检测前景目标的同时,大大的降低误检率;根据目标运动的连续性特性,给出了一种快速算法。2.提出了一种自适应子类判别分析(Subclass Discriminative Analy-sis:SDA)颜色空间学习的Mean Shift跟踪算法,在SDA颜色空间中,跟踪目标与其相邻背景之间的区分度能够最大化;提出了一种基于log似然比函数的方法来选择可信的目标像素来在线更新SDA颜色空间,从而减小背景干扰像素对SDA颜色空间更新的影响。3.提出了一种基于多特征信息自适应融合的粒子滤波跟踪算法,该算法基于一种同时考虑目标模型表达能力和目标模型判别能力的自适应融合策略,该策略根据当前跟踪环境自适应调节每个特征信息的权值,各特征信息自适应融合,增加了描述目标观测的可靠性,从而提高目标观测模型的鲁棒性。在跟踪目标时,采用了粒子滤波跟踪算法,将多特征信息自适应融合的观测模型结合到粒子滤波跟踪算法中,实现了较复杂环境下的可视目标跟踪。4.针对复杂背景条件下采用目标的单一核直方图模型往往很难实现对具有多模态外观的目标进行鲁棒的跟踪,提出一种混合核直方图模型来对目标进行建模;基于粒子滤波跟踪框架,给出了一种混合核直方图模型的更新算法。多组试验结果表明所提出的算法在姿态变化、遮挡、以及相似物干扰等复杂情况下均能稳定可靠地跟踪目标,且跟踪结果优于基于单核直方图模型的粒子滤波跟踪算法。
胡建明[6]2016年在《基于正则化核学习模型的时间序列多步预测的研究与应用》文中研究说明统计学习涉及到大量为分析和理解数据而开发的模型,并与计算机科学尤其是机器学习相互融合、促进与发展。在这些模型中,使用正定核进行估计和学习的核方法变得越来越流行,已被广泛应用于诸如回归、预测和分类等问题。但是在将核方法模型应用于实际具体问题如预测、聚类时,还存在着不够灵活、主观选择等不足因素。此外,时间序列预测是根据过去及现在的有关信息,建立适当的模型挖掘事物内在规律及其趋势,从而为社会经济活动中的决策提供科学依据及技术支撑。尽管时间序列的研究早已开展,但由于现实中时间序列的多样性与复杂性,它一直是学术界研究的重点和难点课题。本论文就如何利用基于正则化框架下的核方法对时间序列的多步向前预测展开深入的研究。正则化框架理论为再生希尔伯特空间中的函数学习提供了一般意义的处理办法。基于实际问题的不同,所采取的损失函数也不同,最终获得的模型也不一样。本文第叁章在正则化框架下采用二次损失函数,分别从频率论角度和贝叶斯视角进行考察,获得了正则单核学习模型(核岭回归(KRR)和高斯过程模型(GPR)),且就这两种模型的相同和差异进行了对比,并将所获得的正则单核学习模型应用于时间序列的多步迭代向前预测。为克服模型多步向前预测误差将逐步放大的不足与缺陷,本文第叁章提出了基于数据驱动的经验小波分解(EWT)信号滤波方法对时间序列数据进行预处理,从而降低噪声数据对预测过程的干扰。另外,第叁章构造了叁个基于降噪的单核方法的多步预测模型,即两个多步向前预测的复合模型(EWT-KRR,EWT-GPR)和一个多步向前预测的组合模型。其中该组合预测模型是在现有的常见模型(ARIMA)和单核学习模型(LSSVM、SVM和ELM)对预处理之后的时间序列进行多步向前预测的基础上,利用高斯过程模型对预测值进行组合和优化,将确定性预测值转化为不确定预测信息,从而获得更为精确的预测值,同时提供预测的风险。在对所提模型训练过程中,本章提出了运用核距离学习来度量输入数据之间的相似度,同时,提出用耦合模拟退火算法选取模型的参数,以克服模型参数值容易陷入局部最优和稳定性不足的缺陷。在使用单核学习模型(包括上述的核岭回归和高斯过程模型)对时间序列进行预测时,需要为该模型预先选定核函数以进行相应的模型训练与验证。然而,选择合适的用于度量数据之间信息的单一核函数,并非易事。另外,在实际应用中,常会遇到执行多个任务的预测问题,而多次执行单一预测任务是解决问题的方法之一。然而,当预测任务之间存在着相互关联时,多任务同时学习并进行预测就显得非常有必要。鉴于此,本文第四章提出了频率论视角下的混合范数多核学习的预测模型,并形成了两种任务模型,即单一任务多核学习模型和多任务多核学习模型,继而产生了单一任务多核学习的时间序列多步向前迭代预测,以及多任务多核学习的多步向前同步预测。在所提出的多核学习模型中,首先将候选的若干个核函数进行线性组合,在混合范数的限制条件下进行核函数选取与模型训练,以便自动挑选出较为合适的特征表述。此外,在执行时间序列的多个预测值输出时,本章提出了采用布雷格曼距离指标度量两个时间序列之间距离来确定多个时间序列之间的相似性,并将此信息融入到了所提出的模型当中。高斯过程预测模型,虽然在时间序列预测的不确定性和风险方面表现出巨大的优势,但是在应用的过程中,异常数据的出现可能会极大地降低该模型的推理精度,而且核函数的类型和参数的选择亦影响着该模型的预测性能。另外,在实际应用中,时常会遇到执行多输出任务的预测问题。为此,本文第五章提出了贝叶斯视角下的推广的核学习方法预测模型。它是在多元线性模型的基础上,形成的关于函数的双曲线分布的理论模型。具有矩阵变量的广义双曲线分布的良好特性,同时融入了贝叶斯推理和核技巧。此预测模型克服了高斯过程因异常数据所导致的推理精度下降的不足,对带有异常数据的时间序列预测具有良好的稳健性。在上述所提到的核学习模型基础上,我们自然地延伸出两种特殊的模型,即单一输出的核学习回归模型和多输出的核学习回归模型。在应用于时间序列的多步向前预测时,单一输出的核学习模型产生迭代向前分布预测,而多输出的核学习模型则同时产生多步向前的预测分布,以获取时间序列多步向前预测的不确定性和风险。另外,在对所提模型训练过程中,本章提出了用耦合模拟退火算法最大化似然函数以获取最佳模型参数。而且,针对多输出的时间序列预测,本章提出了采用布雷格曼距离指标度量两个时间序列之间的距离进而确定时间序列之间的相关性,并将此作为先验信息融入所提出的模型。为了验证本文建立的模型的预测有效性并拓展其实际价值,本文将它们应用于中国华北地区某风场的风速预测领域中。实验结果表明,相对于传统预测模型,它们的预测性能与精度都有较大的提高。
吴文昊[7]2011年在《基于显示调整与尺度变化的图像编辑》文中进行了进一步梳理图像编辑是一门新兴的学科,随着其应用增加涉及的领域范围越来越广,前沿的研究课题更是层出不穷。图像编辑的研究内容涉及到模式识别、人工智能、计算机视觉、图形处理等交叉学科,目的是运用人工辅助或者自动智能识别来对图像进行各种编辑与调整从而满足不同应用需求。图像编辑是一门可以发挥人类无穷想象力去创新和实践的学科,由于现有图像编辑范围非常广泛,本文集中研究图像编辑中近年来比较热门且具有代表性的显示调整编辑和尺度变化的算法与应用。以前的编辑算法通常带有许多限制条件,如用户需要多次进行交互编辑,算法处理的时间复杂度过大等。本文在研究已有图像编辑算法基础上,分析了图像数据局部和整体关系,设计并实现了一种快速交互的显示调整编辑和尺度变化编辑算法,且对图像编辑的自动显示调整编辑进行了探索。本文主要贡献如下:1)分析了用户接口在图像编辑中的重要性,在此基础上提出了一种简便快速的线条式用户接口框架,使得用户快速而方便的设计编辑意图。当用户进行交互后,基于不同的编辑目的用一种通用的框架公式来初始化用户编辑部分。本文还提出了一种基于颜色和谐的自动显示调整编辑方法,对图像显示调整编辑的未来发展趋势-自动显示调整编辑处理进行了最初的尝试与探索。2)充分地挖掘了图像数据局部和整体的信息,在基本显示调整编辑中运用了数据局部与整体关系特点,采用限制性的k-d树对图像像素点进行分类。该方法首先根据相似物体对应的多维尺度距离较近原理,结合像素点位置与颜色的相关信息对图像的所有像素点进行聚类,然后根据用户初始化编辑进行预处理,最后在每个聚类采用快速的多维插值算法对初始化编辑进行扩散。由于每个聚类都相对独立,算法较容易移植到并行运算中,使得性能得到很大的提高,且可以满足实时反馈与高清处理要求。3)图像尺度变化编辑框架中,提出了一种新的搜索算法HashRetar。传统的图像尺度调整编辑,算法中的patch匹配耗费了大量处理器时间,本文为了解决匹配效率问题提出了一种基于patch的能量函数,根据能量函数作为索引采用相应的hash方法来处理patch匹配。HashRetar与原有算法相比,不仅可以进行自动尺度变化编辑,性能也有较大的提升,且可以给予用户及时反馈。从多组实验结果和性能分析可知,本文提出和实现的算法可以很好的满足人们对图像显示调整编辑和尺度变化编辑的编辑要求,提升了用户体验效果。因此,这类方法还可以广泛的应用到艺术设计,视觉特效等领域。
田彦[8]2011年在《基于视频的人体姿势预测与跟踪》文中认为基于视频的人体姿势预测与跟踪,在智能视频监控和人机交互等领域中具有广泛的应用,正获得越来越多的关注。但是,由于受到高维状态空间、复杂背景、遮挡、光照变化和外观变化等因素的影响,视频中人体姿势的预测仍然是一个非常困难的问题。本文主要研究单目视觉下人体姿势的预测和跟踪问题,涉及的具体问题包括:如何从图像中提取多种线索用于预测2D人体姿势;如何在挖掘隐变量的同时保持数据间的局部结构;如何同时得到数据的分割和噪声点;如何综合多种线索得到人体运动模型。本文的主要贡献概括如下:1)在大多数2D人体姿势预测中,基于颜色和形状的肢体检测被用于初始化模型,但是由于模板的局限性,肢体检测的办法只能在特定环境下使用。受到流形学习Isomap的启发,本文首先使用测地距局部最大准则来得到人体最外部关键点位置。初始化工作结束后,使用类似置信传递的方法,利用运动学限制、外观限制和角度限制,分层测算出人体其他关节点位置。其中,角度限制基于这样的假设:人体运动是非刚体运动,但是可以用刚体运动来近似局部肢体变化,所以人体剪影上角度的突然变化意味着关节点的存在,而且角度变化的越大,关节点存在的概率就越大,本文用余弦定理来建模这种概率模型。2)在辨别式3D人体姿势预测中,回归模型学习图像特征和人体姿势间的统计关系,并将其用于预测测试图像中的人体姿势。但是,参数回归模型建立观测数据和目标数据问的单模态关系。而非参数模型过于依赖局部信息,很难扩展到高维数据,当数据维数增加时,这种算法在高维空间会遇到近邻稀疏问题。除此之外,这种基于记忆的方法需要存储所有的训练数据,以至于会大量增加空间复杂度。本文提出一种具有非参数模型灵活性的全局参数模型,将人体姿势预测问题看作是密度函数估计问题,使用隐高斯混合回归LGMR建模数据空间的联合概率密度,并通过全局条件概率密度函数显式地得到回归函数。同时,本文使用保局投影学习目标数据的流形空间,利用其保持局部信息的特性,显式地建立原始空间和流形空间的全局双向映射。3)针对隐高斯混合回归模型依旧存在的过拟合问题,本文提出基于变分预测的半参数回归模型VLGMR。变分分布作为真实后验分布的近似,满足一系列简化推导的条件,然后在后验分布和变分分布KL距离最小的准则下,得到对数似然比最大的预测结果。4)典范对应分析CCA联合观测数据和目标数据的信息来寻找基矩阵,以最大化低维空间投影的相关性,但是这种方法不能保持数据的局部结构信息。而LPP等方法只能分别求取观测变量和目标变量各自的低维空间表示,不能结合两者的信息求取保持局部信息的隐含空间表示。本文提出对称局部保持隐变量模型CLPLVM,使得图像特征和姿势数据在低维空间的投影的达到最大相关性时,也能够保持数据间的局部结构信息。5)由于视频中存在大量的时域冗余信息,视频中人体运动的建模与单张图片中人体姿势的建模有很大不同。同样的运动类型应该具有相似的隐含信息。本文通过求取图像特征和运动数据的低秩表示,从运动视频中提取字典,用字典表示每帧中运动的人体姿势,这样人体运动的矩阵表示就变成低秩矩阵表示,而且,在恢复人体运动表示的同时,还检测出原始数据的噪声点。6)利用运动捕获数据学习人体运动模型,往往得到的结果存在泛化能力不强的问题。本文使用深层学习的同时,将图像信息融入条件受限波尔兹曼机的代价函数,通过图像信息调整人体运动模型,使预测出的人体运动更符合当前帧信息。
王法松[9]2005年在《基于自适应评价函数的独立成分分析算法研究》文中研究表明独立成分分析(ICA)是近十年来伴随着盲源分离(BSS)发展起来的一个统计信号处理的新工具,在信号处理(SP)和神经网络(NN)领域引起了很大的兴趣,目前已成为这些领域的研究热点,受到越来越广泛的关注。本论文主要讨论了基于参数与非参数自适应评价函数的ICA算法的基本原理、算法及其稳定性,并基于信息论原理提出了适合于超高斯与亚高斯混合信号,对称与非对称混合信号的参数和非参数自适应ICA算法,给出了算法的稳定性分析。 ICA是对多维数据进行分析和建模的一个重要工具,它的目的是寻找在统计上相互独立的非高斯混合信号的线性变换,使变换后的分离信号在统计上相互独立或尽可能的独立。与传统的信号分解技术如主成分分析(PCA)和奇异值分解(SVD)等的主要区别在于ICA从信号的高阶统计特性出发,从而使分离出的信号不仅不相关而且相互独立,正因为ICA的这些特点,它被广泛应用于生物医学信号处理、语音信号处理、通信信号处理、图像处理、特征提取和数据挖掘等领域。 本论文获取信号分离的准则主要从信息论和统计的角度出发,主要包括:信息最大化准则,极小化互信息准则和极大似然估计准则,并且详细推导了这些准则在一定条件下的等价性。本论文提出的基于自然梯度的ICA算法,由于其分离性能与源信号的概率密度函数(PDF)有着直接的关系,于是基于概率密度函数的参数与非参数估计方法提出了一系列自适应的参数和非参数ICA算法。 针对超高斯分布与亚高斯分布的混合源信号的盲信号分离问题,首先提出了一种有效的分离算法—拓广的Infomax算法,采用非线性函数Pearson混合模型和修正的双曲正割函数的平方模型来近似源信号的PDF,弥补了传统ICA算法只能分离超高斯混合源信号的局限性,分别得到了各自的目标函数,然后用自然梯度下降法来优化提出的目标函数,并证明了该算法的渐近稳定性,与原有的Infomax算法相比,所提算法具有更广泛的应用范围。 基于两类参数模型—Gaussain混合密度模型和Pearson系统模型,研究了具有对称分布(包括超高斯分布与亚高斯分布)和非对称分布源混合信号的盲分离问题。Pearson系统是包括非对称分布族的一大类分布,但是它的优点只体现在非对称分布和分布接近于高斯分布的源信号,而对于对称分布的源信号却没有明显优势,为了解决这个问题,即当源信号是对称分布或拥有较强的非高斯性时,引入一个Gaussian混合密度模型。通过这种方法,可以有效的解决以上遇到的问题,而且可以加快算法收敛速度,增强算法的稳定性。运用极大似然方法得到目标函数并推导分离算法,提出了一种有效的基于灵活评价函数的ICA算法,该算法在一定意义上实现了对源信号概率分布的真正全“盲”,与原有的ICA算法相
马樱[10]2008年在《基于视频流的步态识别》文中研究表明在智能环境研究中,生物特征识别目前已经成为一个流行的研究方向。步态识别,非接触式远距离的身份识别研究--基于运动视觉的第二代生物特征识别技术,是根据拍摄的行走视频,通过人体走路的方式辨别人体身份。和其它生物特征相比,无需接触和干扰,不具有侵犯性,其信息可以在相对较远的距离秘密地得到并进行识别。本文从理论和实际应用的角度,对以视频为输入的步态识别进行了一些新的探索。本文的主要研究内容与创新点如下:1.针对步态特征表达要求简单、有效、易于进行分类识别等的要求,本文提出了一种基于视频的融合不同步态特征的识别算法。适用于在小范围内进行身份的准确认证。在大范围内可用于降低搜索范围以便为进一步采用其它更精确的方法进行识别奠定基础。2.目前文献报道的步态识别算法,基本上可以分为基于形状特征的方法和基于运动学特征的方法,本文提出了一种基于静态形状特征和动态运动特征相结合的步态识别算法,充分利用了步态在一个周期当中形状的变化和自身内在的运动模式的变迁。3.基于人体侧面图像是准对称的这一事实,本文提出了一种基于人体对称性分析的步态识别算法.对于选取人体前胸侧面轮廓和人体背部侧面轮廓到人体对称轴之间的距离矢量作为特征进行步态识别进行了分析、对比。4.提出了两种融合多重特征进行步态识别的算法。第一种算法利用求和策略,融合了人体前胸侧面轮廓到人体重心的距离矢量,和人体背部侧面轮廓到人体重心的距离矢量,然后用于步态识别,第二种融合算法利用求积策略,融合了人体侧面轮廓的形态学模型进行步态识别。通过多特征融合的识别,算法的识别率比采用单一特征进行步态识别的识别率有所提高。5.在上述研究的基础上,对本文所提出的算法在多种条件下进行了实验验证。建立了自己的步态数据库,对于本文各算法进行了比较全面的测试,因此,对本文算法的评价在简单环境下基本上是客观准确的。
参考文献:
[1]. 线性与核高斯模型及其混合模型的研究[D]. 王井东. 清华大学. 2004
[2]. 视频监控中运动目标检测与跟踪算法的研究[D]. 李亚玲. 南京邮电大学. 2011
[3]. 关于若干回归模型的研究[D]. 敬晓英. 长安大学. 2011
[4]. 基于深度学习的说话人识别建模研究[D]. 酆勇. 重庆大学. 2016
[5]. 视频监控中运动目标检测与跟踪方法研究[D]. 徐治非. 上海交通大学. 2009
[6]. 基于正则化核学习模型的时间序列多步预测的研究与应用[D]. 胡建明. 兰州大学. 2016
[7]. 基于显示调整与尺度变化的图像编辑[D]. 吴文昊. 复旦大学. 2011
[8]. 基于视频的人体姿势预测与跟踪[D]. 田彦. 北京邮电大学. 2011
[9]. 基于自适应评价函数的独立成分分析算法研究[D]. 王法松. 中国地质大学. 2005
[10]. 基于视频流的步态识别[D]. 马樱. 昆明理工大学. 2008
标签:计算机软件及计算机应用论文; 自动化技术论文; 时间序列论文; 高斯混合模型论文; 时间序列预测法论文; 预测模型论文; 核函数论文; 高斯论文; 线性模型论文; 数据建模论文; 图像融合论文; 函数图像论文; 特征函数论文; 线性系统论文; 人工智能论文; 数据融合论文; 人体模型论文; 非线性论文;