基于深度函数的秩检验

基于深度函数的秩检验

张珏红[1]2003年在《基于深度函数的秩检验》文中提出秩检验是基于秩统计量的一种简单实用的非参数统计方法,秩统计量是基于秩的统计量。对于一维样本,由于数据之间存在一种自然的线性序关系,故可按照样本的大小排序,从而得到秩向量。但对于多维样本,数据之间则不存在自然的线性序关系,无法按照样本的大小排序而得到高维样本的次序统计量并由此把一维非参数统计的许多有用的方法直接推广到高维情形,使得对多元数据的统计分析十分麻烦。因此,发展高维统计的非参数方法是统计学家们所关心的一个十分重要的问题。文献[1]中介绍了一种新的方法,即引入深度函数D进行高维数据的排序,从而得到基于深度函数D的秩向量。秩检验之所以在理论上与应用上起着重要的作用,是因为在一定条件下秩向量R=(R_1,…,R_N)在集合R={(r_1,…,r_N)/(r_1,…,r_N)是(1,…,N)的排列}上服从均匀分布,与总体分布无关。只要样本是简单随机样本,且总体分布连续,一维样本的秩向量,就服从集合R={(r_1,…,r_N)/(r_1,…,r_N)是(1,…,N)的排列}上均匀分布。而多维样本的基于深度函数D的秩向量与深度函数和总体分布有关。这使得它的应用受到限制。目前统计学家们还没有形成系统的理论来讨论基于深度函数的秩统计量及其应用。由于线性秩统计量是非参数统计中应用最广的一类统计量,所以本文构造了基于深度函数的线性秩统计量,并对其渐近性质和应用做了一些研究,具体结果如下: 1.给出了R服从R上的均匀分布的条件。 2.证明了当总体分布F属于椭球分布族时,基于统计深度函数的秩统计量R服从R上的均匀分布。 3.证明了基于深度函数的线性秩统计量S'_N=sum from i=1 to N C_N(Q_i)a_N(R_i)在一定条件下与S_N=sum from i=1 to N C_N(i)a_N(R_i)有相同的渐近分布。 4.利用基于深度函数的线性秩统计量检验两d维随机向量的独立性。 5、利用基于深度函数的线性秩统计量讨论两d维样本尺度与位置问题。

张珏红, 刘万荣[2]2003年在《基于深度函数的秩检验的注记》文中指出初步论述了基于深度函数D的秩向量R 在何种情况下服从R上的均匀分布,从而说明线性秩统计量SN的渐近正态性仍成立,然后利用这一性质讨论了多维随机向量的独立性检验,两样本位置与刻度问题,并粗略讨论了检验的功效与分布的关系.

王远林[3]2012年在《中国股票市场股利、股价之间非线性关系的研究》文中进行了进一步梳理经过二十多年的发展,中国证券市场逐步成长壮大,成为世界上重要的资本市场之一,在新兴证券市场中占有重要地位。证券市场对我国优化资源配置,调整经济结构,筹集更多的社会资金,促进国民经济的发展发挥了重要作用。中国证券市场成为建立市场经济体制的重要基础,使得市场化取向的改革成为中国不可逆转的选择。截止2011年12月底,上海、深圳两个市场境内上市公司数(A、B股)共有2342家、股票市价总值214758.10亿元、总股本29746亿股,日均股票成交金额1728.06亿元,投资者开户总数20259.2万户,证券化率达到64%。在人们最初的怀疑眼光中诞生的中国股票市场在短短20年的时间内,走过了发达国家资本市场需要100多年的路程。但是,中国股票市场在运行机制、法律制度、城信文化、参与主体和监管体系等方面与成熟市场相比存在较大的差距,在功能的完备性、运作的规范性、信息的公开性、市场的有效性等方面还有明显的不足,一个突出问题就是上市公司重融资,轻回报,分红不足,特别是同境外成熟市场相比,中国上市公司股利分配缺乏连续性,上市公司频繁变动支付股利的水平和方式。在这样一个背景下,本文对中国股票市场股利、股价之间的关系从理论和实证两个方面进行研究,研究结果对于中国股票市场的效率提升,更有效地发挥股票市场在资源配置方面的基础性作用,对促进上市公司合理制定可持续的红利分配政策,树立回报投资者的正确理念将起到了积极作用。主要研究工作有:(1)对中国股票市场的发展状况和股利状况进行了描述、比较和分析。总起来看,中国股票市场无论在市价总值、流通市值和占国内生产总值的比重方面,都有快速的发展,特别是股权分置改革完成后,在上市股票数、上市公司数、融资金额、股票成交金额和投资者开户数等方面都有了较大的增长,但是,中国股票市场的换手率和市盈率都较高,投机色彩浓厚;从股利方面来看,我国上市公司中分红公司的比率高于美国和中国台湾,比英国、日本和中国香港低;分红比率高于美国,低于英国、日本、中国台湾和中国香港;从股利和股价的关系来看,中国股票市场的股息率低于其他国际市场。(2)从理论上对股利、股价的决定过程进行了分析。首先对股票价格决定的理论基础有效市场假说进行评述,并对近年来各种检验有效市场假说的检验方法进行了评析,指出了检验中存在的一些问题;其次,对股票价格反映信息的过程进行了理论分析,并在考虑容量约束的条件下,建立了风险资产价格和信息成本、公司治理水平和市场监管水平的数理模型,认为股价对信息的反映是不完全的、有选择的,这种反映是不同的投资者通过市场交易进行的,反映信息的深度在一定程度上说明了市场有效性的程度;最后,在对Demarzo和Sannikov (2011)模型进行简化的基础上,使用连续时间方法讨论了考虑学习和信息不对称情况下委托人和代理人之间最优合约的特征,并根据这种特征对公司的股利政策进行了讨论,得到了在公司现金不同情况下股利政策,认为在公司发展的初期,应该尽快地积累现金达到有效水平,以避免遭遇清算;在公司达到现金有效水平后,公司开始发放股利,并且股利的增长水平达到期望收益的水平;在公司发展到一定阶段后,现金流会降低,发放的股利会减少,当公司现金低于有效水平时,公司进入破产清算阶段。并对这个结论的政策含义进行了简要说明。(3)使用线性和非线性Granger因果关系的检验方法,对中国股票市场上股价、股利之间的关系进行了检验。本文认为在中国、日本、英国和德国的股票市场上,股利对股价没有非线性因果影响,而美国股票市场上,股利和股价存在显着地双向非线性因果影响;对于日本和英国来说,股利和股价之间不存在非线性因果关系,而对于中国和德国来说,存在股价对股利的非线性因果关系。同线性因果关系检验的结果相比,发现了存在股价对股利的非线性因果关系,尽管二者之间不存在线性因果关系。认为和其他成熟市场相比,中国股票市场股利、股价之间的关系有一些特殊性,这表现在二者之间不存在Granger意义上的线性因果关系,也不存在股利对股价的非线性Granger因果影响,但是存在股价对股利的非线性Granger因果关系,这说明股价中含有股利的信息。(4)使用最近提出的非线性关系的分析方法——基于秩检验的单位根检验和非线性协整检验方法,对中国股票市场股利和股价之间的关系进行了研究,发现了用通常协整检验方法无法发现的一些关系,在中国股票市场上,股利和股价之间存在显着的非线性协整关系,这表明从长期看,股利和股价之间存在非线性的均衡关系。(5)在使用连续时间方法建立股利和股价波动率之间关系的理论模型基础上,使用多元GARCH模型,根据我国股票市场上股利和股价的有关数据,对股利、股价波动率之间的关系进行了实证研究,根据实证研究结果,认为我国股票市场股利、股价之间波动率存在传递效应,并且,这种传递效应具有持续性。本文认为这种传递效应的来源在于股利和股价都是其相应实体经济的衍生产品,实体经济的波动最终会传递到股利、股价的波动中,因此,减小实体经济的波动程度,可以减小股利和股价的波动情况。主要创新点有:(1)借鉴Shiller在研究美国股票市场时发展的一套处理股利数据的方法,得到我国上海证券交易所上市A股从1994年到2010年的股利月度数据,使用Diks和Panchenko (2006)提出的一种新的非参数检验方法,对中国股票市场股利、股价之间的非线性Granger因果关系进行了检验,认为不存在股利对股价的非线性Granger因果影响,但是,存在股价对股利的非线性Granger因果关系,而使用通常的线性Granger因果检验,认为二者之间不存在Granger因果关系。(2)使用基于秩检验的单位根检验和非线性协整检验方法,对中国股票市场股利和股价之间的关系进行了研究,发现了用参数协整检验方法无法发现的一些关系,认为在中国股票市场上股利和股价之间存在显着的非线性协整关系,这表明从长期看,股利和股价之间存在非线性的均衡关系。(3)使用连续时间方法建立股利的决定模型、股利和股价波动率之间关系的模型,在此基础上,使用多元GARCH模型,对股利、股价波动率之间的关系进行了实证研究,认为我国股票市场股利、股价之间波动率存在传递效应,并且,这种传递效应具有持续性,这种传递效应的来源在于股利和股价都是其相应实体经济的衍生产品,实体经济的波动最终会传递到股利、股价的波动。

张良勇[4]2014年在《基于非均等排序集抽样的非参数检验》文中研究指明非均等排序集抽样是一种提高抽样效率的方法,适合于样本实际测量困难但主观排序容易的场合.与简单随机抽样和排序集抽样相比,非均等排序集抽样方法能够以相对较少的样本测量值获得较多的中位数或对称点信息,而这些信息对于总体中位数、总体对称点和两总体位置参数的非参数检验问题都是非常有用的.为了提高检验效率和减少抽样测量费用,本文研究了基于非均等排序集抽样的非参数检验,主要研究工作如下:(i)为了检验未知总体的中位数,建立了基于非均等排序集抽样的符号检验统计量,确定了新符号检验统计量的具体分布,证明了新符号检验统计量的渐近正态性,给出新符号检验统计量的Pitman效率因子和功效函数.Pitman渐近相对效率和检验功效的研究结果表明,新符号检验优于基于简单随机抽样和排序集抽样的符号检验.(ii)为了检验未知总体的中位数,建立了基于非均等排序集抽样的加权符号检验统计量,证明了在原假设条件下加权符号检验统计量的分布不依赖于总体分布,证明了加权符号检验统计量的渐近正态性,确定了使加权符号检验的Pitman效率因子达到最大的权重向量,并证明出最优权重向量不依赖总体分布.Pitman渐近相对效率和模拟功效的研究结果表明,基于非均等排序集抽样的最优加权符号检验优于基于排序集抽样的最优加权符号检验.(iii)为了检验未知总体的对称点,建立了基于非均等排序集抽样的符号秩检验统计量,证明了在原假设条件下新符号秩检验统计量的分布具有对称性且不依赖于总体分布,证明了新符号秩检验统计量的渐近正态性,给出新符号秩检验的Pitman效率因子.Pitman渐近相对效率和模拟功效的研究结果表明,新符号秩检验优于基于简单随机抽样和排序集抽样的符号秩检验.(iv)为了检验两个未知总体的位置参数,建立了基于非均等排序集抽样的秩和检验统计量,证明了在原假设条件下新秩和检验统计量的分布具有对称性且不依赖于总体分布,证明了新秩和检验统计量的渐近正态性,给出新秩和检验的Pitman效率因子.Pitman渐近相对效率和模拟功效的研究结果表明,新秩和检验优于基于简单随机抽样和排序集抽样的秩和检验.本论文的研究具有重要的理论和实用价值.研究结果为基于非均等排序集抽样的中位数区间估计、位置参数Hodges-Lehmann估计等方面提供了研究的基础和思路.另外,研究结果在临床医学、环境科学、经济学等领域都有广泛的应用前景.

林露樾[5]2018年在《融合卷积神经网络以及光流法的目标跟踪方法》文中进行了进一步梳理目标跟踪问题是一个在学习样本不充分下的一个半监督学习问题。在实现的角度上讲,可以将其视为在视野中预测被跟踪对象的运动轨迹。换句话说,目标跟踪可以被认为是将被跟踪物体从视频流中的每一帧画面取出,并将其与背景分离开来。目标跟踪在军事导航,公共生活中的社会安全方面上有很广泛的应用。在这篇论文中,本文提出了一种基于贝叶斯方法(Bayesian Method),卷积神经网络(Convolutional Neural Networks,CNNs)以及金字塔LK光流法(Pyramid LucasKanade optical flow,PLK optical flow)的目标跟踪方法,这个方法称为COB算法。基于一种称为通过检测进行跟踪(track-by-detect)的思想,本文算法中包含了叁个主要部分:一个训练好的卷积神经网络被当作一个检测器;一个集成了PLK光流法的跟踪器;以及一个基于贝叶斯方法的整合器。其中基于卷积神经网络的检测器级联在基于PLK光流法的跟踪器之后。之后我们在将卷积神经网络的输出结果以及PLK光流法的输出结果输入到贝叶斯方法中,整合出最后的一个跟踪结果。本文工作的主要贡献包含了如下叁个部分:其一,本文提出了一种自适应的整合方法以面对因训练样本不足而导致的过拟合问题,降低过拟合对整个跟踪算法的影响。此整合方法在跟踪器和检测器之间引入了一种竞争的机制。这个机制使得跟踪器和检测器之间能相互补偿性能上的偏差:一方面利用检测器的结果以清除跟踪器的累计误差,利用跟踪器的输出结果以补偿检测器的漂移问题。其二,本文工作还针对实际中的应用,在整合器中引入了可选的在线学习机制。人们可以使能这个机制使得算法可以牺牲一定的实时性以获得更好的性能表现,或者可以关闭此功能以获得更好的实时性。其叁,本文提出了一个新的网络结构,使得在目标跟踪这个实时性要求较高的问题上有较好的分类性能。此外,在训练网络的过程中,为了使得卷积神经网络性能更好,在深度学习中的一些正则化方法也应用到卷积网络中,以使得检测器对分类中的盲点具有更好的鲁棒性,以此减少错分类的可能性。在此文中,本文介绍了COB算法,通过将卷积网络以及PLK光流法整合到贝叶斯方法的框架中。其中基于卷积神经网络的检测器用于挖掘当前帧的信息,而基于PLK光流法的跟踪器用于挖掘相邻两帧之间的信息。本文介绍了算法的具体实施,包括使能在线学习机制以及关闭在线学习机制的实验。我们的实验基于CVPR2013目标跟踪数据集,在实际测试中,我们进行了广泛的实验来研究COB方法的可行性,统计结果表明,本文提出的COB方法与以前的方法相比总是获得可比的性能。

陈秋雨[6]2011年在《中国黄金期货市场特征及风险控制》文中认为2008年1月9日,作为股指期货探路先锋的黄金期货合约正式挂牌上市,这是中国第一个真正意义上的金融期货品种,上市之初就强烈的吸引了投资者的目光,但仅仅几个月,大部分投资者就出现了亏损并绝望离场,市场流动性极差。为了改善这种状况,2008年3月,银监会正式批准商业银行进入期货市场从事期货交易。然而金融海啸席卷全球后,包括商业银行在内的投资者对金融衍生品谈虎色变,流动性依然没有得到改善。2010年7月,中国人民银行等六部门联合发文要求大力发展黄金市场,提高金融市场的竞争力和应对危机的能力。文件强调了要深入研究黄金市场的发展规律,切实做好黄金期货风险管理。因此研究黄金期货的市场特征及风险控制有着非常重要的理论和现实意义。然而黄金期货在学术研究领域并没得到学者们太多的垂青,相关的学术研究相当少,国内黄金期货上市时间很短,定量方面的研究更是凤毛麟角,且普遍存在样本量小、模型简单、没有运用经济学和金融学理论进行深入分析等缺点。本研究利用金融时间序列方法对中国黄金期货首次构建了完整的计量体系,结束了黄金期货研究零散、局部、模型简单的局面。本研究对其他期货品种有很强的示范作用,同时还有助于提高期货从业人员和投资者的分析手段和风险控制能力。本研究主体分为叁部分:首先,运用了单位根、自相关和非线性独立同分布检验方法对黄金期货市场的鞅式弱有效进行了检验,结果无法判断其是否弱式有效,笔者认为应采取分形理论方法进行深层次检验,并将其区分为均值方程和波动率方程分别进行。其次,为了探讨影响黄金期货市场分形特征的外部因素,笔者使用了协整方法、误差修正模型、格兰杰因果检验、脉冲响应函数等方法分析与中国黄金期货市场关系密切的因素之间的协整关系,这些因素包括有黄金现货、美元指数、国内股票、纽约金、伦敦金和黄金租赁。最后,由于黄金期货市场为分形市场,因此基于有效市场理论的风险控制方法无效,本研究利用极值方法和期望不足理论对其风险进行研究,专注于处理尾部的巨额损失,并构建了黄金期货风险控制体系。本研究的结论:(1)就市场本身而言,黄金期货市场并非有效市场,而是一个具有分形特征的市场,且均值方程和波动率方程均存在长记忆特征。(2)从影响市场的外部因素来看,黄金现货引领黄金期货价格,因此黄金期货市场并未发挥价格发现功能;美元指数、上证指数、深证成指和黄金租赁与中国黄金期货均不存在长期均衡关系;纽约金单向引导中国黄金期货;伦敦金和中国黄金期货存在双向引领关系。这再次验证了黄金期货市场的分形特征。(3)市场的分形特征决定了传统VaR风险控制方法无效,基于极值的BMM方法和POT方法可作为普通风险值,而期望不足可作为谨慎风险值,同时还应考虑重现水平风险值,对黄金期货实行叁限管制为最科学的风险控制体系。本研究的创新点主要有以下几点:一是将分形分析方法半参数模型SEMIFAR运用到中国黄金期货。它允许序列中可能存在确定性趋势外加一个随机趋势,同时考虑长记忆和短记忆,这跟以往人们只考虑其中的一种趋势有所不同。二是首次将重现水平运用到期货风险控制领域。重现水平主要应用在水文学、气候学和股票市场上,期货领域的应用研究近乎空白。叁是将期望不足ES和Mean-ES模型运用到黄金期货领域,弥补了VaR风险评估方法对超越VaR后的风险无能为力的缺陷,并首次提出将极值方法、期望不足和重现水平相结合,对黄金期货实行叁限管制。四是将黄金租赁的核心指标作为中国黄金期货的主要影响因素进行定量分析。另外,研究发现美元指数、中国股市和黄金租赁均与黄金期货价格不存在长期均衡关系。

丁宏[7]2013年在《高精度无线区域定位关键技术研究》文中指出高精度无线区域定位是当前无线定位领域的研究热点,超宽带(UWB:Ultra-Wide Band)技术由于具有高的时间分辨率和强的穿透障碍能力而成为高精度无线区域定位的首选技术。与此同时,超宽带所特有的大相对带宽特性也给高精度定位提出了诸多问题和挑战。考虑到高精度的距离测量能力是UWB定位的突出优势和重要前提,本文重点从UWB测距和非视距条件下的目标位置估计两个方面的关键技术开展研究,取得了如下重要成果:1、在深入分析多径环境下UWB信道模型基础上,给出了一种修正的峰值检测算法,并通过仿真表明,在信道不可分离条件下,修正算法能获得更佳性能。将时间反转技术引入UWB高精度测距,提出了一种基于时间反转处理的到达时间(TOA:Time of Arrival)估计方法。通过向UWB传播信道中发射包含该信道脉冲响应信息的时间反转信号,实现了多径成分的匹配和TOA的精确估计。仿真结果表明,该方法与传统的广义最大似然方法相比,具有更低的TOA估计误差和更低的输入信噪比适应范围。2、针对UWB信道非高斯或存在异常值情况,提出了基于秩统计量进行TOA估计的思想,并根据多脉冲测距的特点,设计了两种不同的秩检验形式:行秩和列秩,进而分别提出了基于行秩和基于列秩的TOA估计方法。这两种方法均利用信号的秩来抑制重尾非高斯噪声或异常值的影响,并且有效保护了首径信号的信息。仿真表明,其在高斯和非高斯噪声下均具有更高的有效性和鲁棒性,并具有计算简单的优点。3、针对NLOS环境下精确定位问题,在深入研究加权最小二乘定位方法的基础上,基于接收信号信噪比与距离测量可靠性的关系,指出依据距离信息设计加权值可避免距离估计方差作为权值的不平衡问题,进而提出了一种将距离信息加权与非视距(NLOS:Non-Line-of-Sight)鉴别结果相结合的加权最小二乘(WLS:Weighted Least Square)定位方法。该方法利用测量节点与被定位节点的距离设计WLS的优化权值,并将NLOS鉴别结果与距离加权阵的设计相结合以进一步提高定位精度。仿真表明,该方法具有明显优于已有WLS方法的定位性能。4、以室内非合作目标定位为背景,针对一发多收和自发自收模式,分别给出了它们在视距和穿墙(TTW:Through-the-Wall)定位下的系统模型,在此基础上,建立了一种基于TTW传输分析的修正测距模型。该距离模型根据距离与墙壁参数和传输路径入射角的关系,重构受到墙壁严重影响的接收信号的时间延迟,可消除TTW传输引起的测量误差,提高位置估计的精度。基于所建立的修正测距模型,提出了一种新的TTW几何曲线定位方法,该方法利用定位参考节点的TOA测量和修正测距模型对实际目标位置进行解算,具有更高的定位精度。论文同时推导了考虑TTW传输的克拉美罗下限表达式。仿真表明,该定位方法有效降低了TTW传输引起的定位误差,具有高精度目标位置估计和低计算复杂度的优势。

何鹏飞[8]2014年在《融合差分进化算法的AEA算法及其在约束优化问题中的应用》文中指出现实世界中,特别是在科学研究和工程实践中存在大量的优化问题。由于问题自身不同的特点,传统的数学方法已经难以独立解决。基于群体搜索的全局优化方法,以及具有的简单性和健壮性,智能进化算法在求解优化问题时表现出了强大的竞争力。它的出现为包括约束问题在内的复杂的优化问题的解决提供了新思路,已经成为进化计算领域的热点。Alopex-based Evolutionary Algorithm (AEA)算法是一种融合了进化算法的群智能特点和Alopex算法的启发方式的新型优化算法。本文在AEA算法的基础上,利用差分进化算法(Differential Evolution)改善AEA算法中的试验种群,提出了一种新的混合型优化算法-MAEA算法,将其用于解决无约束优化问题。基于改进的变异策略以及交叉操作,在平衡局部搜索和全局搜索的同时,又增加了种群的多样性。在种群的迭代过程中,算法陷于局部最优的可行性大大降低,算法的寻优过程也更加合理。通过标准测试函数的测试实验,结果表明MAEA算法的稳定性,解的精度等各项性能指标均有不同程度的提高,强化了算法的寻优能力。将算法用于发酵动力学的参数估计中,和其他算法的比较结果表明MAEA算法更具竞争力。针对约束优化问题,本文提出了一种新型自适应惩罚函数以及约束参数处理策略。通过引入控制参数ε,保留了利于种群进化的不可行解信息,引导种群进化。随着参数的逐步减小,搜索的区域逐渐收敛直至可行域,对不可行域进行有效搜索并对可行域边界进行充分发掘。通过引入自适应惩罚函数法,对于不同的问题特征,自适应调整惩罚系数对个体进行相应惩罚,避免了惩罚的力度的不合理性。通过标准函数的测试实验,表明融合了新的约束处理方法的MAEA算法具有较好的稳定性和准确性,在处理一些工程问题是也具有一定的适用性。

户保田[9]2016年在《基于深度神经网络的文本表示及其应用》文中研究指明近年来,深度神经网络在诸如图像分类、语音识别等任务上被深入探索并取得了突出的效果,表现出了优异的表示学习能力。文本表示一直是自然语言处理领域的核心问题,传统的文本表示的维数灾难、数据稀疏等问题,已经成为大量自然语言处理任务性能提高的瓶颈。近年来,通过深度神经网络对文本学习表示逐渐成为一个新的研究热点。然而,由于人类语言的灵活多变以及语义信息的复杂抽象,深度神经网络模型在文本表示学习上的应用更为困难。本文旨在研究深度神经网络对不同粒度的文本学习表示,并将其应用于相关任务上。首先,对词向量的学习进行了研究。提出了一种基于动名分离的词向量学习模型。该模型将词性引入到词向量的学习过程,同时保持了词序信息。受人类大脑的动名分离结构的启发,在学习词向量的过程中,该模型根据词性标注工具得到的词性,动态的选择模型顶层的网络参数,从而实现模型的动名分离。与相关向量学习方法进行实验对比,结果显示该模型能够以相对较低的时间复杂度,学习得到高质量的词向量;通过其得到的常见词的相似词更为合理;在命名实体识别和组块分析任务上的性能,显着地优于其它对比的词向量。其次,对语句的表示学习进行了研究。提出了基于深度卷积神经网络的语句表示模型。该模型不依赖句法分析树,通过多层交迭的卷积和最大池化操作对语句进行建模。语句匹配对自然语言处理领域的大量任务非常重要。一个好的匹配模型,不仅需要对语句的内部结构进行合理建模,还需要捕捉到语句间不同层次的匹配模式。基于此,本文提出了两种基于深度卷积神经网络的语句匹配架构。架构一,首先通过两个卷积神经网络分别对两个语句进行表示,然后通过多层感知机进行匹配。架构二,则是对两个语句的匹配直接建模,然后通过多层感知机对匹配表示进行打分。两种匹配架构都无需任何先验知识,因此可被广泛应用于不同性质、不同语言的匹配任务上。在叁种不同语言、不同性质的语句级匹配任务上的实验结果表明,本文提出的架构一和架构二远高于其他对比模型。相比架构一,架构二更能够有效地捕捉到两个语句间多层次的匹配模式,架构二在叁种任务上取得了优异的性能。第叁,对统计机器翻译中短语对的选择进行了研究。提出了上下文依赖的卷积神经网络短语匹配模型。该模型对目标短语对进行选择,不仅考虑到了源端短语与目标端短语的语义相似度,同时利用了源端短语的句子上下文信息。为了有效的对模型进行训练,提出使用上下文依赖的双语词向量初始化模型,同时设计了一种“课程式”的学习算法对模型进行从易到难、循序渐进的训练。实验表明,将该模型对双语短语的匹配打分融入到一个较强的统计机器翻译系统中,可以显着提高翻译性能,BLEU值提高了1.0%。自动生成进行了研究。构建了一个较高质量的大规模中文短文本摘要数据集,该数据集包括240多万的摘要,同时构造了一个高质量的测试集。提出使用基于循环神经网络的编码-解码架构从大规模数据集中自动学习生成摘要,构建了两个基于循环神经网络的摘要生成模型。模型一通过使用循环神经网络对原文进行建模,并将其最后一个状态作为原文段落的表示,利用另一个循环神经网络从该表示中解码生成摘要。模型二在模型一的基础上,通过动态的从编码阶段的循环神经网络的所有状态中综合得到上下文表示,然后将当前的上下文表示传递给解码循环神经网络生成摘要。两种模型都是产生式模型,无需任何人工特征。实验表明,两种模型能够对原文进行较为合理的表示,生成具有较高信息量的摘要文本。特别地,模型二生成的摘要文本质量显着优于模型一。综上所述,本文以深度神经网络为手段,以文本表示为研究对象,对自然语言中不同粒度的文本即词、句、段的表示学习及其应用进行了深入研究。本文将所提出的方法应用到了序列标注、语句匹配、机器翻译以及自动文摘生成问题上,并取得了良好的效果。

张彩伢[10]2008年在《两类统计推断问题》文中研究说明本文主要对两类统计推断方法进行了研究.一类是有关随机偏微分方程的参数估计,另一类是有关分布的非参数检验.众所周知,偏微分方程可用于随时间和空间变化的复杂系统的建摸.许多领域中的数学模型都可以用偏微分方程来描述,而实际上,大量现象都是随机现象,因此,自然地将随机分析的方法引入到偏微分方程中,便有了随机偏微分方程(Stochasticpartial differential equations)(SPDE).人们利用SPDE建立有关利率,界面动力学,神经心理学和湍流学等随机模型时,不断地取得了显着的成效,显示了SPDE对于人类认识自然现象和社会现象基本规律的重要性.有关SPDE的概率理论的研究始于上世纪70年代,包括不同类型方程的解的存在性,唯一性以及解的性质等问题,Itǒ(1984),Rozovskii(1990)和Da Prato&Zabczyk(1992)等作了较详细的讨论.有关SPDE的统计推断研究,包括方程的参数估计问题等,则始于上世纪90年代初.Hüebner等(1993)最先讨论了两类特殊的SPDE的参数估计问题,后来,Hüebner&Rozovskii(1995)进一步将结果推广到以下抛物型SPDE其中A_0,A_1分别是满足一定条件的偏微分算子,θ是未知参数,W_Q(t,x)是带有协方差算子Q的Wiener过程.Prakasa Rao(2000,2003)则对下列两种具有特殊偏微分算子形式的SPDE模型作了讨论和其中△=(?)~2/(?)x~2,b(θ)是形式已知的未知参数θ的函数,ε为干扰项.显然,模型(0.0.2),(0.0.3)所包含的参数函数形式比(0.0.1)更具有一般性.当上述方程(0.0.2)和(0.0.3)的解存在时,可以定义为如下形式其中{e_i(x),i≥1}是算子Q的正交系,{U_i(t),i≥1)是U(t,x)的Fourier系数.事实上,对于SPDE的参数估计问题,可以从不同的角度进行讨论.按样本资料的性质,可以基于连续样本轨道,也可以基于离散样本观测点来给出参数的估计量;根据参数估计的方法,则有极大似然估计和贝叶斯估计等;有关估计量的渐近性,包括相合性和渐近正态性的讨论,根据实际问题的需要,可以从不同的情形进行研究.例如,Hüebner&Rozovskii(1995)是基于Fourier系数{U_i(t),i=1,…,N}在给定的时间区间[0,T]上的连续样本轨道对方程(0.0.1)中的参数θ给出了极大似然估计,并研究了当Fourier系数的个数N↑∞时估计量的渐近性.而PrakasaRao(2000,2003)则是基于Fourier系数U_i(t)在给定时间区间[0,t]上的离散观测{U_i(t_j),t_j=j△,0≤j≤n,i=1,…,N},对方程(0.0.2)和(0.0.3)中的参数θ给出了极大似然估计和贝叶斯估计,并研究了当离散观测点数n↑∞时估计量的渐近性.在本文的第一章,我们利用Fourier系数U_i(t),i=1,…,N在给定时间区间[0,T]上的连续样本轨道,对方程(0.0.2)和(0.0.3)中的参数分别给出了极大似然估计.在本章第二节,我们考虑一种新的情形,即当小干扰项ε→0时估计量的渐近性质.Prakasa Rao(2000,2003)在要求方程(0.0.2)中b(θ)<0和方程(0.0.3)中b(θ)>0的条件下得到了参数估计量的弱相合性和渐近正态性.我们除去了函数b(θ)满足符号条件的要求,证明了估计量的强相合性和渐近正态性.在本章的第叁节,我们还对模型(0.0.3)的估计量性质作了进一步讨论.证明了当Fourier系数的个数N↑∞时参数估计量的强相合性和渐近正态性.本文研究的另一类统计推断问题是有关分布的非参数检验,包括拟合优度检验和比较多个多元总体分布的检验.有关这些课题的研究,无论是在理论上还是实际应用中都具有非常重要的意义.统计中的许多方法都依赖于正态性的假定.有关正态分布的拟合检验,已有大量的文献做了研究.本文第二章考虑的是一般分布的拟合检验.具体提法如下:设X_1,…,X_n是一简单随机样本,有共同分布F(x),x∈R~d,检验假设问题其中F_0(x)是形式已知或最多含有几个未知参数的分布函数.对于一元情形的一般拟合优度检验的研究,始于1900年Pearson提出的χ~2检验,后来发展了许多方法,其中的理论都已比较成熟,并得到了广泛的应用.在本章第二节,我们将对各种类型的一元分布拟合优度检验作综合介绍.对于多元情形的一般拟合优度检验问题(0.0.5),直到最近的二,叁十年才开始有文献讨论.Shorack&Wellner(1986)和Einmahl&Mason(1992)分别根据经验过程理论对(0.0.5)给出了检验;Justel等(1997)利用Rosenblatt(1952)的概率积分变换(Probability Integral Transfom)将一元情形基于经验分布函数(EDF)的Kolmogrov-Sminorv检验推广到了多元情形.在一元情形的拟合优度检验中,还有一类非常重要的检验,那就是Greenwood(1946),Weiss(1959),Hall(1986)和Balakrishnan&Kamnan(2004)等给出的基于一元间隔(Spacings)的各种检验.由于多元间隔(Multivariatespacings)概念一直没有给出明确的定义,这类基于间隔的检验在多元情形未曾得到推广.最近,Li&Liu(2007)利用统计深度函数(Statistical depth function)给出了多元间隔的定义,并利用多元间隔讨论了多元容许域(Tolerance region)的构造,但没有讨论有关多元拟合优度检验问题.研究表明,统计深度函数和连接函数已经成为多元分析中非常重要的工具.在本章第叁节,我们借助统计深度函数,不仅将一元情形基于经验分布函数(EDF)的各种检验,包括Kolmogrov-Sminorv检和Cramer-von Mises型检验,都推广到了多元情形,同时给出了多元χ~2拟合优度检验,并将Li&Liu(2007)提出的多元间隔概念应用到了多元拟合优度检验中.这些检验都是具有仿射不变性(Affine invariant)的非参数检验.同Justel等(1997)给出的检验统计量比较,我们给出的统计量更便于计算.在这一节,我们还讨论了如何将多元分布拟合检验问题转化为有关连接函数的检验.第四节对部分检验作了随机模拟,结果表明,检验具有良好的功效.在第叁章,我们继续利用统计深度函数这一重要工具,对多个多元总体的分布比较问题进行研究.众所周知,当各总体都满足多元正态分布时,可以利用似然比检验的思想给出检验统计量.而当正态性不满足时,我们必须考虑非参数检验方法.关于多元两样本的位置参数检验,已有大量的文献作了研究,具体可参见Puri&Sen(1971),Brown&Hettmanperger(1987),Randles&Peters(1990),Choi&Marden(1997),Topchii等(2003)等学者的研究论文.对于多元多样本位置参数的检验,Puri&Sen(1971),Hettmansperger&Oja(1994),Hettmansperger等(1998)和Um&Randels(1998)等曾给出过符号检验,秩检验及中位数检验.考虑下面两类更具有一般性的问题:(1)已知各总体都属于同一位置-形状分布族(Location-scale distribution family),需检验相互之间的位置参数和尺度参数之间是否有显着差异;(2)各总体的分布形状未知,需检验各总体的分布函数之间是否有显着差异.至今,对这些课题研究的文献不多.在多元两样本情形下,Rousson(2002)和Liu&Singh(1993),Zuo&He(2006)分别对问题(1),(2)作过研究.在本文的第叁章,我们考虑更具有一般性的多元多样本情形,利用统计深度函数对问题(1),(2)提出了叁种非参数检验方法.设总体X_i是概率空间(Ω,F,P)上的d维随机向量,且有未知的连续分布函数F_i(x),x∈R~d,i=1,…,k.X~(i)={X_1~(i),…,X_(ni)~(i)}是取自于总体X_i的简单随机样本,i=1,…,k,并设不同样本之间相互独立.考虑假设问题H_0:F_1(x)=F_2(x)=…=F_k(x)=F(x)对(?)x∈R~d成立, (0.0.6)若已知各总体的分布函数形式相同,则问题(1)对应的备择假设等价于下列位置-尺度模型其中θ_1,…,θ_k是R~d上的d维向量,且至少存在1≤i≤k,使得θ_i≠0=(0,0,…,0)';σ_1,…,σ_k是R~d上的d维向量,且至少存在1≤i≤k,使得σ_i≠1=(1,1,…,1)',x/σ_i=(x_1/σ_(i1),…,x_d/σ_(id)).若各总体的分布函数形状未知,则问题(2)对应的备择假设为H_1:存在i≠j和x∈R~d,使得F_i(x)≠F_j(x).(0.0.8)Rousson(2002)利用投影和深度函数,将一元两样本问题的Wilcoxon检验和1967年Mardia提出的有关二元两样本问题的非参数检验推广到了多元两样本情形,对两个多元位置-尺度模型给出了检验.在第叁章第二节,我们将借鉴Rousson(2002)的思想,把一元多样本问题的Kruskal-Wallis检验和1970年Mardia提出的有关二元多样本问题的非参数检验推广到多元多样本情形,对模型(0.0.7)给出检验.Liu&Singh(1993)基于数据深度定义了品质指数(Quality index)用它来衡量两个多元分布函数F(x)和G(x)差异大小,其中D(x;F)是x点关于分布函数F的深度.当D(·;·)具有连续的分布函数,且F(x)=G(x)时,有Q(F,G)=1/2.当F(x)和G(x)未知时,取Q(F,G)的估计量为Q(F_m,G_n),其中F_m和G_n分别是对应F(x)和G(x)的样本经验分布函数.当深度函数D(·;·)为马氏深度(MhD),且F(x)=G(x)成立时,Liu&Singh(1993)证明了统计量Q(F_m,G_n)的渐近正态性,有下列结论((1/m+1/n)/12)~(-1)(Q(F_m,G_n)-1/2)(?)N(0,1),当min(m,n)→∞时.(0.0.9)并猜想对一般的深度函数也有该结果.Zuo&He(2006)称统计量Q(F_m,G_n)为Liu-Singh统计量,在深度函数满足一定的正则条件下,证明了Liu&Singh(1993)的猜想,并给出了当F≠G时,Q(F_m,G_n)的渐近分布.在第叁章第叁节,我们将基于Liu-Singh统计量对模型(0.0.8)提出新的检验,该检验具有仿射不变性.首先,利用Liu&Singh(1993)所给出的品质指数,定义一个新的参数来衡量k个多元分布函数F_1(x),…,F_k(x)之间的差异程度.显然,当k个分布函数都相同,即原假设(0.0.6)成立时,λ=0.因此,对于一般的多元多样本问题,即模型(0.0.8),我们自然可取检验统计量为其中F_(ni)是样本X~(i)={X_i~(i),…,X_(ni)~(i)}的经验分布,Q_(ij)=Q(F_(ni),F_(nj)),i,j=1,…,k.当λ_n取值偏大时,我们拒绝原假设(0.0.6).在Zuo&He(2006)所给出的正则条件下,且原假设(0.0.6)成立时,我们证明了检验统计量λ_n有下面的渐近分布其中W是r个独立的X~2(1)分布的随机变量的线性组合.特别地,当各个样本容量相等,即n_1=n_2=…=n_k=:m时,有最后一节,我们通过随机模拟对本章所给出的叁种检验的功效作相互比较.结果表明,广义的Kruskal-Wallis检验,最适合于含有位置参数变动,而尺度参数保持不变或变动相对偏小时的多元多样本问题的检验;当模型中含有尺度参数变动,位置参数保持不变或变动相对偏小时,本章提出的基于Liu-Singh统计量的检验是叁种检验方法中表现最佳的,特别是当样本取自于重尾分布时,具有很强的功效.随着样本容量的增大,广义Mardia检验的功效得到显着的提高.本文收录了作者叁年来所撰写的部分论文,参见文中的附表.最后,限于作者水平有限,文中难免会有不当或谬误之处,敬请诸位不吝批评和指正.

参考文献:

[1]. 基于深度函数的秩检验[D]. 张珏红. 湖南师范大学. 2003

[2]. 基于深度函数的秩检验的注记[J]. 张珏红, 刘万荣. 湖南师范大学自然科学学报. 2003

[3]. 中国股票市场股利、股价之间非线性关系的研究[D]. 王远林. 东北财经大学. 2012

[4]. 基于非均等排序集抽样的非参数检验[D]. 张良勇. 北京理工大学. 2014

[5]. 融合卷积神经网络以及光流法的目标跟踪方法[D]. 林露樾. 广东工业大学. 2018

[6]. 中国黄金期货市场特征及风险控制[D]. 陈秋雨. 浙江大学. 2011

[7]. 高精度无线区域定位关键技术研究[D]. 丁宏. 国防科学技术大学. 2013

[8]. 融合差分进化算法的AEA算法及其在约束优化问题中的应用[D]. 何鹏飞. 华东理工大学. 2014

[9]. 基于深度神经网络的文本表示及其应用[D]. 户保田. 哈尔滨工业大学. 2016

[10]. 两类统计推断问题[D]. 张彩伢. 浙江大学. 2008

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于深度函数的秩检验
下载Doc文档

猜你喜欢