具有真实感的特定人脸模型合成方法的研究

具有真实感的特定人脸模型合成方法的研究

姜大龙[1]2004年在《真实感三维人脸合成方法研究》文中进行了进一步梳理随着计算机多媒体和网络技术的迅速发展,人们对各种人机交互界面的人性化要求越来越高。三维人脸合成技术作为虚拟人合成技术的一个重要组成部分,近30年来在动画工作者们的不懈努力下取得了长足的进步和发展。真实感三维人脸合成技术的应用范围非常广泛,其成果可以应用于虚拟主持人、虚拟会议、辅助教学、医疗研究、电影制作、游戏娱乐等等,具有重大的理论意义和应用价值。本文在三维人脸建模、基于MPEG-4的人脸动画、人脸动画重定位、细微纹理动画、人脸动画驱动等人脸合成的关键问题上展开研究,取得如下成果:1)在三维人脸建模方面,如何便捷、快速、准确的构造三维人脸模型一直是计算机动画工作者在努力解决的难题。本文提出一种从二维人脸照片到三维人脸模型的构造方法。该方法输入简单,只需要一张正面人脸照片;建模速度快,比国际上同类的三维重构方法快15倍左右;整个重构过程完全自动。该技术还可以应用到基于合成的人脸识别方法中,扩充了训练数据,能够在识别算法不变的前提下,大幅提高人脸识别准确率。2)MPEG-4的三维人脸动画框架具有通用性强,便于扩展、数据量小等特点。本文提出了一种构造特定人脸模型FAT(facial animation table,人脸动画表)的方法,可以驱动本文的标准模型以及与标准模型拓扑结构相同的人脸模型。3)动画重定位(animation retargeting)是近年来国际上热门研究课题。本文在已有标准模型FAT的基础上,提出了一种构造任意拓扑结构三维人脸模型FAT的方法,从而实现了人脸动画数据的复用,并解决了驱动任意人脸模型的难题。该方法只需要在模型上提取若干特征点就可以应用,具有自动化程度高,速度快,通用性强等特点。4)传统的人脸动画只采用一张固定的纹理,纹理上的褶皱无法表现。本文提出一种PERI(partial expression ratio image,局部表情比率图)的概念,并建立了PERI库,利用PERI包含细微纹理特征的特性来表示纹理上的皱褶。在此基础上提出用MPEG-4的FAP(facial animation parameter,人脸动画参数)来参数化控制细微纹理特征的动画方法。为解决不同角度纹理视觉效果的真实性,又提出了多方向PERI技术,从而实现了具有细微纹理特征的真实感三维人脸动画方法。5)动画数据是驱动一个动画系统必不可少的组成部分。本文介绍了通过视频来获取动画数据的方法,还介绍了用运动跟踪设备来采集人脸特征运动的数据。最后提出了一种解决文本驱动中唇动与手语同步问题的方法。

沈荣荣[2]2007年在《基于径向基函数的三维特定人脸重构的研究》文中研究说明创建逼真的三维人脸模型是计算机图形学领域一个极富挑战性的课题。随着虚拟现实、影视制作、游戏娱乐等应用的发展,这一研究课题越来越受到人们的关注。三维特定人脸模型重构技术对于快速构建逼真的特定人物模型,进而实现逼真的人物动画具有重要的理论意义和实用价值。本文首先介绍了三维人脸模型的应用前景及国内外的研究现状,并分析和总结了现有的三维人脸建模技术,在此基础上,提出了基于分层设计的规则网格的一般人脸模型构建方法,基于特征点模板的人脸特征提取方法,基于径向基函数的分层分部位三维特定人脸重构方法和基于正侧面人脸照片的近似全视角人脸纹理合成与映射方法,具体内容如下:(1)基于分层设计的规则逻辑网格的一般人脸模型构建方法,该方法根据人脸的生理结构,从Poser中获取原始人脸模型数据,筛选后取部分数据,通过分层设计的规则逻辑网格方法构造出一般人脸模型。该模型结构简单,构建操作可参考性好,为特定人脸模型重构奠定了良好的基础。(2)基于特征点模板的人脸特征提取方法,由于正侧面人脸照片中人脸特征不是一一对应的关系,无法直接从人脸照片中获取特定人脸的全部三维特征点,因此本文提出了采用正侧面人脸特征点模板分别提取正侧面人脸照片中人脸特征信息的方法。该方法可方便有效地从图像中获取特定人脸的三维特征点。(3)基于径向基函数的分层分部位三维特定人脸重构方法,由于人脸结构复杂,采用单个约束方程构造人脸的方法未能精确地刻划细致的人脸部位,且计算量大,因此提出了一种基于径向基函数的分层分部位三维特定人脸重构方法,实验结果表明,该方法不仅使重构后的人脸部位更符合自身特征,而且明显降低了计算量。(4)基于正侧面人脸照片的近似全视角人脸纹理合成及纹理映射方法,分析了传统的基于正侧面人脸照片构建全视角纹理的不足之处,提出了一种近似的全视角人脸纹理合成及纹理映射方法。实验结果表明,该方法纹理合成简单有效,纹理映射效果较逼真。(5)采用面向对象的设计方法,设计实现了一个基于正侧面人脸照片的三维人脸重构原型系统。通过原型系统的实际运行测试,表明上述方法正确有效,重构得到的三维特定人脸模型效果逼真。

常江龙[3]2009年在《三维人脸表情合成研究》文中指出面部表情是人们传递情感信息的重要手段,在日常交流中占有重要的地位。在各种计算机服务日益便捷的今天,人们希望计算机能够和人一样进行情感交流,特别是能够表达出拟人化的面部表情。人脸表情合成技术作为当今计算机应用领域的一个热点问题,其成果在影视及游戏娱乐、人机交互、虚拟现实、远程会议与教育、辅助医疗等方面有着广泛的应用。该领域的研究经过多年的发展,取得了长足的进步,并涌现出较多有效的人脸表情合成方法与模型。然而,由于面部表情具有丰富而复杂的变化,要快速生动的利用计算机进行表情的重现并付诸实用化,目前仍有不少问题亟待解决。如何设计和构建同时具有高度真实感和较高实用性的表情合成系统,仍然是一个富于挑战性的研究课题。本文以研究和建立具有真实感和实用性的三维人脸表情合成系统为目标,对三维人脸数据处理、三维人脸建模、基于生理建模的表情合成、基于统计建模的表情合成等相关课题进行了深入的探讨和研究。分别从生理建模和统计建模两个角度出发,研究了人脸表情合成问题,并提出了相应的表情合成模型。在此基础上,设计和构建了面向一般人脸的多模式三维人脸表情合成系统。本文中工作的创新点及主要贡献可总结如下。第一,为了提高三维人脸数据处理的准确度和自动化程度,提出了一个基于对应匹配的三维人脸精细配准方法.该方法把三维人脸的对应问题转化为二维图像的对应匹配。通过若干自动检测的特征点位置提供先验信息,对于全图像的对应关系进行插值,得到“粗”对应:将图像进行光照补偿后,进一步采用光流法进一步修正对应关系,得到“精细”对应。该算法自动化程度很高,通过两个阶段的处理后,所得的三维人脸对应较为精确,并对光照不敏感。在此基础上,进一步构建了三维人脸的统计模型,并将其作为表情合成平台的基础。第二,在分析和总结人脸生理解剖知识的基础上,提出了一种新的用于表情合成的自适应三维人脸生理模型。该模型包括一个改进的肌肉模型、一个下颌骨模型、一个单层皮肤模型以及相应的皮肤的应力机制。其中的皮肤模型具有简约的结构,并设计了相应的应力机制来模拟真实皮肤的应力变化。该模型的优点在于结构简单,合成效率很高,并保证了表情合成的真实感。同时,为该模型设计了一种自适应匹配方法。该匹配方法将生理模型参数与人脸形状特征相联系,对于新的人脸,通过形变模型自动获得输入人脸的三维外观,并利用其形状特征,可以自动生成其生理模型参数。该匹配方法计算量小,速度快,匹配结果精确,并能完全实现自动化。第三,在对大量三维人脸数据进行统计分析的基础上,提出一种基于双线性分析的三维人脸表情模拟技术。通过对三维人脸形状样本的双线性分析,将三维人脸的身份特征与表情身份相分离,各自构成独立的线性子空间。该双线性模型规模较小,适用于不同的二维和三维人脸应用课题。第四,为了提高已有双线性模型对人脸与表情的表达能力,提出了一种肌肉参数驱动的双线性表情合成方法。该方法一方面采取分块处理的策略,对于人脸的各个区域建立双线性模型,取得了比总体处理更好的人脸重建和表情模拟效果:另一方面,通过研究生理模型参数与统计表情参数间的映射,在不同的表情合成方法间建立了对应关系,可以根据不同的肌肉参数,获得对应的表情参数,再利用双线性模型来生成实际表情。该方法能够生成内容与力度变化都较为丰富的人脸表情。第五,提出了一种基于流形分析的非线性表情合成模型。该模型中,不同的人脸表情被投影到不同的低维表情流形上,并采用人工监督学习的方法训练和获得不同表情流形间的非线性变化轨迹。该模型比线性化模型更能够有效描述表情状态间的非线性变化关系。最后,利用上述工作,设计并实现了一个面向一般人脸的多模式人脸表情合成系统.该系统可以为输入的普通二维人脸自动生成其对应三维模型,并利用不同的方式合成具有真实感的人脸表情效果,为后续的研究工作提供了一个可扩展的实用化平台。

宗智勇[4]2012年在《多视角三维人脸建模的关键技术研究》文中研究指明人脸包含着极为丰富的外表属性和内心情感信息,研究人脸不仅是重塑造型的一种艺术需要,而且在工业设计、电影电视、医学模拟、虚拟游戏等领域还具有广泛的实用价值。随着计算机技术的兴起和不断发展,如何利用计算机自动地重建具有真实感的三维人脸造型已成为计算机图形学领域研究的一个热点课题。自Parke在1972年第一次利用计算机生成了一个人脸面部模型以来,真实感三维人脸建模研究已经取得了许许多多丰硕的成果,但是,由于人脸本身的复杂性,目前的研究在算法的效率、真实感效果和广泛的应用性方面仍存在许多问题。本文综合分析了前人的研究成果中存在的优点与不足,并在此基础上对真实感三维人脸建模的基本流程、主体方法和关键技术进行了详细设计与改进,采用了一种从多角度人脸照片中恢复出三维人脸信息进而重构三维人脸模型的办法。具体的研究工作主要包括以下几方面内容:1.关键特征点的简化标定技术。针对传统的人脸特征点手工标定方法过于繁琐并且精确度不够理想的问题,本文设计了一个特征点简化编辑器,通过半自动的人机交互方式,把自动检测和精确调整两种方法结合起来。先是运用改进的ASM算法提取出68个特征点,再利用空间投影对照的方法标定出模型上的对应特征点,然后应用编辑器进行手工细化调整,最后由程序自动对数据按本文简化的MPEG-4标准分组保存。2.特定人脸网格模型的生成技术。综合常用人脸模型构建方法的优缺点,本文采用了一种基于不同角度人脸照片重构三维人脸模型的方法,以自由变形的人脸几何网格作为标准人脸模型的基础,再通过对整体模型的粗变换构建统一坐标系统,运用散乱数据插值调整非特征点位置,采取网格细化处理保证准确性和光滑性,以此实现由关键点之间的对应关系而形变一个标准模型到特定的个性化模型。3.无缝全景人脸纹理的合成技术。对常用的一些图像拼接与融合方法进了概述,并重点分析了简单的带加权因子的人脸纹理合成方法和图像金字塔算法的基本原理,在分析与论述的基础上,本文采用了一种将加权因子拼接和改进的拉普拉斯图像金字塔算法融合起来的方法,在图像对应的不同金字塔分解层上进行拼接,然后再将各个拼接层进行反分解变换重构成一幅全景人脸纹理图。4.真实感模型的纹理映射与渲染技术。考虑到三维人脸可由圆柱面近似包围,本文采用柱面纹理映射的方法建立二维纹理到三维模型的对应关系,并且利用OpenGL提供的纹理贴图与渲染的编程技术完成了三维人脸模型的真实感视觉要求。实验证明,本文在多视角三维人脸建模过程中采取的一系列改进与优化措施取得了良好的效果,在实际建模过程中获得了效率与质量的双重提升,具有普遍适用的价值。

康壮[5]2014年在《3D人脸建模与姿态识别的研究及其在路考系统中的应用》文中进行了进一步梳理在计算机视觉研究领域中,如何利用计算机对感兴趣的物体进行定位、描述以及相应的研究是一项十分重要的研究内容。人脸,作为我们日常生活中用于情感表达与互相交流的最直接最重要的载体以及人们区分个体之间的有效手段,自然也就成为了计算机视觉中的一个重要的研究对象。与人脸相关的应用也十分的广泛。其中,以科目三路面考试监测与评估系统为代表的路考系统就运用到了人脸图像处理技术来对考生头部进行姿态分析进而判别考生头部动作是否违规。但当前的路考系统都只利用了视频流中人脸的二维信息来对考生头部动作进行分析。这些二维信息只是人脸在二维平面上的投影,是人脸所包含的三维信息在平面空间的简约,存在着信息的丢失,因而在利用这些信息对考生头部动作进行分析时,存在着一定的局限性。本文以提高科目三路面考试监测与评估系统中对考生头部动作的分析能力为目的,从人脸的三维信息方面着手,利用人脸的三维信息对人脸的姿态进行识别与分析。因为基于三维信息的人脸姿态识别所处理的信息包含了人脸的空间信息,这是人脸本身固有的信息,相比于基于二维信息的人脸姿态识别,其在分析姿态时所能利用到的信息更多,分析能力更强。本文首先对单张正面无明显遮挡的目标人脸图片利用ASM方法提取其人脸特征点信息,并利用所提取出的人脸特征点信息对轻量级的网格类通用三维人脸模型Candide-3进行修改与调整使之生成对应的特定三维人脸模型,随后在单张正面人脸图片中提取出目标人脸的纹理信息,对调整后的特定三维人脸模型进行纹理映射从而生成具有真实感的三维人脸模型。然后根据所建立的特定三维人脸模型,提出一种利用该模型对二维图片中人脸的姿态进行分析与识别的方法。最后将基于特定三维人脸模型的人脸姿态识别方法引入到科目三路考系统中,用于对考生头部的运动过程进行分析与判别。

程日彬[6]2006年在《真实感三维人脸合成技术研究》文中进行了进一步梳理人脸是我们最熟悉的器官,但真实感人脸合成却是计算机图形学领域中最困难的问题之一。自从上世纪70年代Parke建立了世界上第一个人脸合成系统以来,具有真实感的人脸合成就一直是一个富有挑战性并且值得深入研究的课题之一。人脸合成和表情动画技术可被广泛应用于各个领域,比如电影制作、游戏娱乐、可视电话以及人机接口等领域。 本文在分析和总结了前人工作的基础上,对真实感人脸合成方法进行了深入的研究。主要的研究内容包括以下几个方面: (1) 在分析人脸固有生理结构特征的基础上,参照MPEG—4标准中人脸定义参数的特征点区域分布,结合本文需求,定义了本文的人脸特征点分布。 (2) 研究了利用立体视觉原理恢复出特定人脸的特征点信息,并用这些特征点信息对一般人脸模型进行变形修改,最终得到一个包含特定人脸特征的特定人脸模型。模型变换主要分两步完成,整体变换和局部变换。 (3) 研究了图像金字塔法处理拼接裂缝,光滑边界的方法。首先从原图像迭代构造出高斯金字塔和拉普拉斯金字塔,构造金字塔是一个图像分辨率降低分解过程;再从金字塔顶层开始迭代重构原图象,通过低通滤波和带通滤波两个过程很好的光滑边界,从而消除接缝,形成无缝的纹理拼接图。 (4) 采用柱面纹理映射技术实现特定人脸模型的纹理贴图,并对人脸模型进行光照处理,再现具有一定真实感的三维人脸。 (5) 理论研究的同时,我们采用Visual.Net和OpenGL图形库设计实现了一个真实感人脸合成系统平台。系统应用本论文中提到的算法进行真实感人脸合成,实验结果验证了算法的可行性。

曹宁哲[7]2016年在《完整虚拟人头部建模及面部表情合成研究》文中进行了进一步梳理随着虚拟现实技术、计算机图形学技术和计算机视觉技术的快速发展,三维虚拟人逐渐发展成为一门新兴的学科,并吸引了越来越多的人从事相关的研究。由于人类的面部表情和情感非常丰富,所以三维虚拟人头部的研究更是成为了研究的热点。三维虚拟人头部的研究不仅具有巨大的研究价值,还具有广阔的应用前景,比如在医学整容、电子商务、视频教学、游戏开发等领域总能看到它的身影。在研究中,人们常常利用三维扫描仪或者建模软件来建立头部模型,但是这些方法建立的模型都存在一些问题,最主要的就是数据量太大,不容易控制。因此,建立一个数据量比较少且能够完整地表达头部的结构,同时又易于控制的头部模型就成为本文的研究重点。随着研究人员的增加和相关工作的积累,出现了很多不同的头部模型,这些模型要么是结构不够完善,要么就是模型过于复杂,不容易控制。针对该问题,本文将建立一个结构完整能表达头部特征的模型。本文首先将软件导出模型简化并去除面部网格后的模型和标准Candide-3模型结合在一起,合成一个通用的模型。然后,利用Bezier曲线模拟眼睑的内外边缘和上眼睑沟实现眼睑的重建,同时利用两个半径不同的球体相结合的方法完成眼球模型的建立,并用四角面片模拟牙齿,就可以得到一个完整的虚拟人头部模型。接着,利用从输入的单幅正面人脸照片上提取的特征点信息对模型面部的特征点、面部非特征点以及后脑勺的点进行调整,得到一个和输入照片的人脸相匹配的特定头部模型,利用不同的方法对不同的模块贴纹理,就可以得到一个真实的头部模型。最后,利用人脸动作单元对头部模型面部和表情合成相关的顶点坐标进行调整,合成面部真实感的表情动画。实验结果表明,建立的头部模型能够给人很强的真实感,且模型容易控制,基于该模型合成的虚拟人面部动画比较真实。

邹自强[8]2003年在《基于MPEG-4的人脸建模和人脸动画》文中指出人脸建模和动画一直是计算机图形学中非常活跃的研究领域,它在电影制作,计算机游戏,视频会议,人机接口等领域都有广泛的应用。MPEG-4是新一代的多媒体压缩标准,采用基于对象的编码方式,允许将场景中的对象进行独立编码。人脸是MPEG-4中一个很重要的对象,它用人脸定义参数(FDP)和人脸动画参数(FAP)来描述人脸的特征和运动。 本文的研究工作包括人脸建模和人脸动画两个方面。在人脸建模方面,提出了一种“自动化”人脸模型特定化的方法。首先用Cyberware激光扫描仪获取一个特定人的人脸的几何数据和纹理图像;然后由特定人的人脸的几何数据和纹理图像,可以获得人脸模型的特征点的三维坐标,采用基于插值函数变形的方法进行一般人脸模型的校准;最后使用纹理映射的方法将纹理图像贴在人脸模型上,经过渲染可以得到特定人的人脸模型。在模拟人脸表情和动作方面,本文给出了一种新的基于MPEG-4人脸动画的方法。该方法首先根据MPEG-4人脸模型规范对人脸模型进行功能区域的划分,每个功能区域都有一些与FAP相关的控制点;然后采用伪肌肉模型的方法,实现了FAP集中所有的低级动画参数,这些动画参数模拟了每个功能区域的肌肤弹性形变以及脸部的刚性运动;建立了一个从下至上由复杂到简单,由低级到高级的多层次的人脸动画控制模型,这种控制方式方便了人脸动画的生成。最后,我们实现了一个与MPEG-4兼容的三维人脸动画系统。该系统用FDP流对人脸模型进行特定化,特定化的结果描述了人脸的基本特征;用FAP流驱动人脸模型,实时地模拟了面部的表情和动作。

罗琰钦[9]2009年在《基于汉语驱动人脸语音动画的研究》文中提出近年来,人脸动画在计算机图形学是一个极具挑战性的研究领域。人脸动画广泛的应用于教学、数字娱乐、游戏、人机交互、远程会议、影视制作、医学手术、人脸识别等领域。我们基于MPEG-4标准和中文语言学理论,以TTS引擎、OpenGL作为主要的开发工具,实现了一个基于汉语文本驱动的人脸语音动画系统。该系统主要由四部分组成:文本分析系统;语音合成系统;人脸动画系统和语音与动画同步系统。系统的执行流程是:一方面,语音合成系统接收输入的中文文本,分析处理后,合成语音并产生带有时间信息的音素流;另一方面,基于肌肉模型建立具有真实感的特定人脸模型,使用音素帧参数和表情帧参数驱动模型网格点移动,从而实现人脸动画;最后将合成的语音与人脸动画同步,就实现具有真实感的、带有表情的人脸语音动画。本系统建立的协同发音模型有效地解决了中文协同发音的问题,这是本论文的一个创新点。协同发音是指在连续说话过程中,一个音素的发音受到相邻语音段影响的现象。语音合成系统将中文可视音素划分为15组,可获得带有时间信息的中文可视音素序列,成功解决了TTS引擎不能直接产生中文音素和中文可视音素的问题,这是论文的第二个创新点。此外,系统在通用模型的基础上进行特定化修正,通过模型校准、纹理映射方法,生成具有高度真实感的人脸模型。系统还通过定义表情标签、表情过渡、表情与可视音素混合等处理,实现了带有表情的人脸动画。由于本系统实现的人脸动画,只是通过嘴唇来模拟说话和表情动作,而并没有考虑人脸其它部位在说话过程中的动作变化。因此,在人脸建模方面,对人脸其它部位(如眼睛,舌头等)的模拟是未来研究的一个方向。

吴思宁[10]2000年在《具有真实感的特定人脸模型合成方法的研究》文中进行了进一步梳理人脸是人们最熟悉的器官,但人脸合成、表情模拟等对于图形学领域的研究者来说,仍是一个具有挑战性并且值得深入研究的课题。本文在国内外在该领域研究的基础上,结合课题的需要,提出了一个人脸编辑的系统,实现了从图象构造人脸模型的方法,采取了纹理映射的方法来增强真实感,并在总结了汉语发音规律的基础上对汉语的口型进行了模拟。 我们在课题中提出了Kriging的整体变形的方法,并提供了友好的界面以便利用鼠标对模型进行适当的修改,通过运用我们提供的技术可以获得较为满意的变形效果。 在具有真实感的人脸模型显示中,我们采用了子剖分的曲面生成方法对初始的三角形模型进行细化,从而构造了光滑的人脸模型,改善了显示效果。为了作到人脸动画的实时显示和增强真实感,我们采用了纹理映射的技术,我们将多副人脸图象合成一副纹理图象,并利用OpenGL提供的纹理映射功能把纹理贴到三维人脸模型上,获得了较为理想的效果。 汉语口型的模拟是本文的另一个重要部分,我们提炼出了汉语的七种基本口型,利用唇部的抛物线模型获得了七种基本口型的数据,并归纳出汉语拼音与音素、音素和口型的关系,当输入拼音流时,系统进行分析,将其分解成口型单位,并给出口型单位间的时间比、连接等关系,利用这些控制模型作出适当的口型动作。 本文的研究和实验表明,通过采用合理的技术,构造具有真实感的人脸模型完全是可能的,而人脸模型的构造、合成、模拟等将在改善人机接口等许多领域发挥重要的作用。

参考文献:

[1]. 真实感三维人脸合成方法研究[D]. 姜大龙. 中国科学院研究生院(计算技术研究所). 2004

[2]. 基于径向基函数的三维特定人脸重构的研究[D]. 沈荣荣. 江苏大学. 2007

[3]. 三维人脸表情合成研究[D]. 常江龙. 中国科学技术大学. 2009

[4]. 多视角三维人脸建模的关键技术研究[D]. 宗智勇. 南京师范大学. 2012

[5]. 3D人脸建模与姿态识别的研究及其在路考系统中的应用[D]. 康壮. 武汉理工大学. 2014

[6]. 真实感三维人脸合成技术研究[D]. 程日彬. 西北大学. 2006

[7]. 完整虚拟人头部建模及面部表情合成研究[D]. 曹宁哲. 西南交通大学. 2016

[8]. 基于MPEG-4的人脸建模和人脸动画[D]. 邹自强. 北京工业大学. 2003

[9]. 基于汉语驱动人脸语音动画的研究[D]. 罗琰钦. 电子科技大学. 2009

[10]. 具有真实感的特定人脸模型合成方法的研究[D]. 吴思宁. 北京工业大学. 2000

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

具有真实感的特定人脸模型合成方法的研究
下载Doc文档

猜你喜欢