顾忠伟[1]2003年在《灰色挖掘及其在证券分析中的应用研究》文中研究说明证券分析是证券投资领域的基础工作,如何在证券市场获利并降低投资风险,是每个投资者都关心的话题。关于证券投资分析的方法,国内外的有很多定量、定性的分析理论和实际作法,这些理论和实践各有其特点和应用范围。本研究试图将数据挖掘技术和传统的灰色系统理论结合,应用这种基于灰色系统理论的数据挖掘(我们称之为灰色挖掘)的技术来指导证券分析研究。 目前数据挖掘以及灰色系统理论在证券分析中的应用,国内外学者都做了不少研究,但是研究的层次还不够深入,所用到的挖掘方法也很有限,具有指导意义的实际应用就更少了。至于灰色挖掘的应用则更是微乎其微,甚至灰色挖掘本身这个概念都是作者第一次用到。作为一种新的尝试和探索,本文在总结前人成果的基础上,将一些成熟的数据挖掘技术结合灰色系统理论,构建了一套灰色挖掘体系,对灰色挖掘进行了系统地阐述;同时提出和改进了一系列灰色挖掘模型。这些模型包括灰关联模型、灰聚类模型、灰预测模型、灰神经网络模型、灰马尔可夫模型、灰序列模型、增长率和发展态势挖掘模型等等。除此之外,作者还将这些模型应用于证券分析领域,分别在证券分析领域的基本分析方面和技术分析方面做了卓有成效的实证应用研究。 我相信我的这些研究既是对灰色挖掘的应用创新,也是对传统数理统计技术在证券分析中应用的有益补充。
聂亚可[2]2001年在《序列挖掘及其在证券分析中的应用》文中研究说明与证券市场飞速发展不相称的是证券分析技术进展的缓慢,证券分析中知识的自动获取已经成为制约我国证券分析发展的“瓶颈”。因此,我国证券分析软件的发展方向就是可验证与修正的智能型软件。在这种情况下引入代表数据库和人工智能最新技术的基于数据挖掘的决策支持系统(DSS)进行证券分析成为一个必然的选择。本文首次对数据挖掘技术及其在证券分析中的应用进行了较深入的研究,将时间序列挖掘技术、序列挖掘技术以及云模型处理形态概念相结合应用于证券分析并取得了成功,是一种有意义的尝试。 论文首先介绍并分析了数据挖掘和证券分析的特点及研究现状,指出将数据挖掘应用于证券分析的可行性和迫切性。同时对证券数据的特征进行了分析,提出了适用于证券数据的挖掘模型。并在此模型的基础上展开对数据挖掘的研究。 其次,通过对云模型理论的分析,提出了用云模型将连续空间的价量时间序列数据转换到由字符表示其形态的离散空间。经过这一处理后的形态字符序列保持了语义概念的模糊性,同时也使得挖掘的效率大大提高,挖掘结果更为直观。 再次,对时间序列挖掘,特别是时间序列相似性搜索进行了深入的分析,提出了用时间序列相似性搜索对相似序列进行定位,用基于序列挖掘的中缀挖掘算法进行模式发现,是一种全新的思路。事实证明这两种算法的结合是可行的。 最后,建立了基于以上研究成果的S-Mining系统。在对该系统的大量实验数据进行分析比较后指出系统中各参数的取值对模式挖掘的影响及参数选择的正确方法;以深万科的成交数据为例说明系统的挖掘过程,并且用两种方法验证了系统预测结果的可靠性。对于未预测准确的结果,结合证券市场和个股的实际情况进行了分析,找出了预测失败的原因,同时指出结合证券市场和个股的实际情况进行模式评估的重要性。
林香[3]2007年在《证券分析中数据挖掘模型的研究及应用》文中研究表明证券分析是现代金融分析的基本研究对象。证券市场在我国的短短几十年内迅猛发展,越来越多的人将资金投入到证券中,证券市场尤其在近几年异常活跃。而随着证券市场的快速发展也对证券分析系统提出了更高的要求,因此对证券分析系统的研究也成为金融分析研究的一个重要课题。同时数据挖掘技术近几年被研究越来越多,尤其在证券分析领域中,数据挖掘技术由于其具有强大的发掘潜在信息的能力,被广泛应用。在证券分析中,股票预测是金融数据挖掘的一个重要研究方向。股票时间序列除了具有非线性、非平稳和动态等一般时间序列具有的特征外,还具有高噪音、非正态、尖峰厚尾等特征,因此股票时间序列预测更具有挑战性,并有广阔的应用价值和市场前景。同时相似股票时间序列检索也是证券分析中的一个研究重点。随着证券市场的繁荣,股票价格的波动显得更加复杂,从大量股票的历史数据中快速查找出与其具有相似波动规律的股票从而进行预测或者投资组合分析是证券分析系统中不可缺少的功能。针对以上两个关键问题,本文重点研究了基于遗传BP神经网络混合模型在股票预测中的应用。传统的研究只能对短趋式的预测才有比较好的预测效果,同时大部分的模型都只适用于他们所实验的单一种类的数据而并不能适用于其他类型的测试数据,准确率偏低,连续预测值波动性小等问题。本文针对上述问题提出一种改进的遗传BP神经网络模型,通过实验表明,该模型适用于长期预测,同时预测结果准确率高。同时我们还建立了相似股票时间序列检索库,我们先对股票序列进行特征提取,然后使用模糊聚类方法对时间序列进行聚类分析,在模糊聚类分析方法中我们对其有效性指标进行了改进,提高了聚类效果。最后,基于以上理论算法的研究,我们利用软件工程的思想建立了金融证券分析系统,包括数据的获取,数据库的建立,到算法模型的实现以及结果的展示等。
谭华[4]2008年在《不确定时态数据挖掘方法及其在证券行情预测中的应用》文中指出随着金融全球化与自由化的推进,金融行业的运行效率与水平在很大程度上决定了一个国家的经济竞争力,而信息化技术越来越成为影响金融行业创新能力与发展水平的重要因素。近年来,许多金融机构开始运用先进的信息技术与智能决策支持技术对业务系统中积累的海量数据进行深入分析,以发现各种有价值的规律。数据挖掘技术作为一种新兴的智能决策支持技术,已经开始在金融行业的部分领域得到应用。在此背景下,研究如何从金融数据中挖掘出各种信息,更好地认识、掌握并利用其规律,无疑具有重要意义。与此同时,金融市场的信息具有不确定性众多、非线性和信息数据的模糊性及非结构性等特点。金融市场中的不确定性包含时间的不确定。这些问题都值得研究者们进行深入研究。不确定性方法与数据挖掘技术有一定的重迭性,两者在单独使用时都具有一定局限性。数据挖掘中存在不确定性问题,金融时间序列分析中也存在不确定性问题,并且传统数理统计方法不适用于从大量的数据中主动发现各种潜在规则,而不确定性方法在单独进行预测时会遇到小数据量等问题。本文根据具体选定的证券市场行情预测对象,将不确定性方法和数据挖掘技术的各自优势结合起来,得到一种基于不确定性方法和数据挖掘技术的不确定时态数据挖掘方法(UTDM)。该方法能更好地发挥不确定性方法和数据挖掘技术的优势,为证券市场的预测提供更好的技术分析方法,从而为投资决策者提供更为精确的定量分析结果。在对不确定性方法和数据挖掘技术的相关理论、研究发展现状及不足进行深入讨论的基础上,选取不确定性方法和数据挖掘技术中几种具有代表性的方法:在不确定性方法中选取模糊集方法、模糊相似关系下的模糊粗糙集及灰色理论;在数据挖掘中选取关联规则、神经网络等方法,用于构建证券市场的有效分析方法。在此基础上分别得到模糊相似关系下的模糊粗糙集挖掘预测方法、趋势特征挖掘预测方法、时间序列模糊关联规则挖掘预测方法及多灰色神经网络预测方法,用这些方法分别解决证券市场中短期的个股及股指的预测问题。论文后续部分则以此为基础进行展开。本文通过模糊相似关系下的模糊粗糙集和数据挖掘技术对股票价格进行预测研究,从证券市场的大量数据中得到强规则。利用模糊集和粗糙集方法将股票价格进行预分类,并按时间属性进行分组,通过给出的模糊相似关系下的模糊粗糙集计算每组的真值,利用数据挖掘技术获得候选属性,最终得到相应时间段内的有用规则,根据所得规则预测某一具体时间段内股票价格的变化趋势。将模糊粗糙集扩展到模糊相似关系下的模糊粗糙集,并应用到对股票价格的预测中,能较原模糊粗糙集方法得到更多的有用规则,准确率更高。将股票中的时间序列转换为以价格变动率为变量的时间序列进行分析,并对趋势特征提取、聚类算法进行改进,将时间序列的预测问题转化为频繁和有效特征集来发现问题,进而对趋势特征模式进行挖掘预测,根据连续一段时间内的涨跌情况判断市场的发展趋势。将时间序列模糊关联规则应用于证券市场的交易规则抽取。选用聚类方法对模糊集属性进行离散化,构造模糊集和隶属函数,引入时间维度,提出适合股票交易规则抽取的时间序列模糊关联规则算法,对一定时间段内股票间及行业间的关联关系进行最大限度的挖掘预测。提出将3种灰色预测模型,即残差GM(1, 1),无偏GM(1, 1)和pGM(1, 1)与神经网络预测模型有机组合起来,建立一种新的多灰色神经网络组合预测方法,并通过对中国证券市场综合指数进行模拟预测进行验证,对证券市场综合指数的预测及比较说明了该组合预测精度的有效性。
陈佐[5]2007年在《时间序列相空间重构数据挖掘方法及其在证券市场的应用》文中认为金融市场是融通资金的场所。金融市场实现了投资需求和筹资需求的对接,能有效的化解资本的供求矛盾。金融投资分析方法一直是金融领域的研究热点。随着金融市场的飞速发展,投资分析方法也得到不断的创新和进步。传统的时间序列模型的应用一方面依赖于某些假设条件,因而应用受到限制;另一方面,由于经济和商业时间序列的结构经常是逐渐变化的,应用结构固定的全局模型来描述并不十分合适。随着信息技术在金融行业的普及以及人们收集数据能力的大幅提高,在金融市场的飞速发展过程中,积累了海量的包含丰富信息的数据。数据挖掘方法为人们分析金融时间序列提供了新的思路和视野。本文以相空间重构技术为基础,以时间序列作为研究对象,分析面向时间序列数据的数据挖掘方法,并将研究结果应用于实际金融市场,以发现金融时间序列中隐含的规律、模式和知识,为市场分析和投资决策提供新的思路、方法和辅助决策信息。本文从研究所处的背景出发,详细讨论了数据挖掘技术以及时间序列数据挖掘与金融数据挖掘的相关研究现状,并分析了相空间重构的相关理论和方法。为应用相空间重构进行时间序列数据挖掘的可行性提供了理论基础和技术保障。通过对比时间序列模式挖掘的不同思路,本文指出时间序列数据挖掘框架TSDM所存在的问题。系统地提出了应用小波聚类进行序列时间模式挖掘的方法。应用小波变换的多分辨率特性和基于网格的划分方法,可以实现任意形状和不同精度的聚类。采用以事件指导的投资策略将方法应用于中国证券市场。结果表明,以时间模式预测事件为指导的投资策略能获得高于持有策略的收益;时间模式挖掘能有效识别事件点;事件序列与非事件序列存在显着差别。在讨论了嵌入定理和时间序列的可预测性的基础上,本文从现有模糊神经网络存在的问题入手,结合非线性的空间聚类方法EM算法,对原有TS模糊神经网络模型进行改进,提出了基于相空间重构的EM聚类模糊神经网络预测模型。通过对重构空间进行EM模糊聚类,实现数据对象的分类训练以及隶属度的计算,以减少输入规则的条数简化神经网络的结构。同时,将该模型分别应用于深成指数和上证指数。结果表明,该预测模型的预测误差低于传统的BP模型,有效地提高了预测精度。本文从序列异常的角度提出了时间序列的偏差异常检测方法。应用CC算法同时对嵌入维和嵌入延时进行估计进行重构以构造多维空间,应用偏差异常检测方法抽取异常模式,再通过符号离散化将问题转化为分类问题构建决策树实现异常的分类和预测。以决策树的分类标识为指导构建交易策略,在证券市场上进行了应用。结果表明,尽管在股市大势呈现下降趋势的情况下,应用分类标识为指导的交易策略仍能获得较高的收益。本文应用相空间重构技术将时间序列分割成长度相同的子序列集合,并将其映射到多维特征空间,从而将有序的时间序列一维数据挖掘问题转换成为多维空间的无序数据集合的挖掘问题。本文的研究不仅为金融时间序列分析提供了新的方法,也为数据挖掘技术提供了新的研究思路。
周超良[6]2013年在《基于关联规则的股市板块指数建模分析与算法研究》文中指出股市中存在大量数据,投资者需要对这些数据进行分析和利用,数据挖掘的产生给股市分析带来了新的方法。关联规则挖掘发现大量数据中项集之间的有意义的关联或相关联系,是数据挖掘中的重要领域。股市中存在一种显着的板块联动现象,即属某一基本面类别或同时具有某一概念国素的一类股票所呈现的齐涨齐跌的现象。本文基于关联规则对股市板块指数建模分析并进行算法研究,分析股市中的股价趋势与行业关系,有助于投资者选取投资组合和进行合理决策。本文介绍了数据挖掘和股市的背景知识,分析了数据挖掘在股市分析中的意义,综述了当前数据挖掘的各项主要功能在股市挖掘中的应用,指出了股市中板块分析对投资者的价值。经典关联规则算法Apriori需要频繁扫描数据库,且产生大量候选项。本文对该算法进行了改进,提出了采用垂直数据格式的布尔矩阵,增加标志位,同时改进产生候选项的连接方法。然后将改进算法应用于股票板块指数分析,探索了股市各板块之间的关系,并对结果进行了分析,阐述了如何选取有价值的规则。时序关联规则可以发现各项集的时序关系,可以用来分析各板块的涨跌时序关系,本文对经典时序算法E-Apriori和EH-Apriori算法的时间窗口技术进行分析,并综合对Apriori的改进,提出了时序挖掘的改进方法,然后应用于板块指数挖掘,并对结果进行分析,挖掘出来的板块指数之间的时序联系对投资分析有一定的价值。最后,本文构建了原型系统对以上算法进行了验证,允许用户设置各项参数,并进行数据和结果的展示,验证新算法的实用性。
吴琳[7]2011年在《基于最小二乘支持向量机的时态数据预测研究及应用》文中认为在现实世界中,信息系统往往会涉及到时态数据,即与时间相关且含有时间属性的数据。时态数据是按一定的时间重新划分的带有时刻的数据,用于研究数据潜在的规律特性。将时态型数据通过一定方式变形后,人们经常可以在其中发现原始时间序列所不具有的规律。随着时态数据量的日益庞大,以及人们对隐藏在数据内的潜在规律和信息的需求,时态数据挖掘便应运而生。支持向量机(SVM)是建立在统计学习理论和结构风险最小化原则之上的一项新的技术,解决了时态数据挖掘中的非线性和不确定性等问题。最小二乘支持向量机(LS-SVM)是一种改进的支持向量机。最小二乘支持向量机通过一系列的变形,最终将标准SVM的二次规划问题转化为求解线性方程组问题,提高了求解问题的精度和收敛的速度。本文将在深入分析时态数据、时态型、时间粒度等概念以及支持向量机理论的基础上,采用由原子时态型构造其他时态型的方法,构造一个以p为时间粒度的时态数据模型,并设定初始的最小二乘支持向量机训练参数——控制回归误差的可调参数r以及径向基核函数的参数s2,接着对选取的原始金融市场的股票数据进行规范化预处理。由于最小二乘支持向量机的参数r和s2必须在训练前由用户给定,并没有一定的理论依据,具有一定的主观性和先验性,因此,为了得到更好的预测效果,本文改进了一种基于群体智能的优化算法——粒子群优化(PSO)算法,对模型的参数进行优化。得到优化的参数后,本文将训练最小二乘支持向量机模型,最后给出基于最小二乘支持向量机的时态数据预测。基于最小二乘支持向量机的时态数据预测能够不仅解决时态数据挖掘中的非线性和不确定性等问题,而且提高了求解问题的精度和收敛的速度。本文将基于最小二乘支持向量机的时态数据预测应用于金融行业,对金融市场存在的海量数据进行更加深入的分析,以寻求其中有价值的信息和规律,具有重要的应用价值。
肖菲[8]2005年在《数据仓库在证券业务分析系统中的应用》文中研究指明随着信息技术与社会经济的发展,世界经济日益呈现全球化、网络化、信息化与知识化的特征。企业每天都会产生大量重要的数据信息,然而其中仅有一小部分会在相关的业务分析中被使用,大多数企业都处于“数据过剩,信息不足”的状态。将数据仓库技术、联机分析处理和数据挖掘技术用于现代企业业务分析中则可以大大提高企业的分析决策能力。其中,数据仓库侧重于数据的存储和组织,联机分析处理侧重于数据的分析,数据挖掘则致力于知识的自动发现,若把叁者结合起来,就可以使它们的能力得到更加充分地发挥。 本文对数据仓库在证券业务分析系统中的应用相关理论进行了探讨,重点阐述了数据仓库的设计以及基于数据仓库、联机分析处理和数据挖掘的证券业务分析系统的体系结构,并结合证券公司的实际需求提出了数据仓库、联机分析处理和数据挖掘在证券业务分析系统中的具体应用方案。对于数据仓库在证券业务分析系统中的应用研究具有重要的实际参考价值。 本文共分五个部分。第一部分主要说明了论文研究的背景,研究的目的和意义,数据仓库技术和证券业务信息化国内外研究现状综述以及本文的创新点;第二部分主要介绍了数据仓库技术,包括数据仓库的概念、特征和数据组织,数据仓库系统的体系结构,数据仓库的分析工具,比如联机分析处理和数据挖掘等等,数据仓库技术在证券行业应用的意义和现状以及主要的数据仓库厂商和产品;第叁部分对证券业务分析系统进行了设计,介绍了该系统功能模块的分析和设计,从总体上对系统的技术路线进行了选择,设计出了系统的体系框架以及网络连接图,说明了系统开发和运行的环境;第四部分详细讲述数据仓库在证券业务分析系统中的应用,首先介绍了数据仓库系统的设计及实现步骤,然后将OLAP技术引入到证券分析领域,利用OLAP工具使用户能够从不同的角度观察、比较股票交易数据以及利用多元线形回归分析法预测股票价格,最后通过数据挖掘技术挖掘股票之间的关联规则,使投资者了解各种股票的走势及股票之间的关系,从而作出正确的投资决策;第五部分对本文研究的问题进行了总结并提出了研究的前景和今后研究工作的重点内容。
谢忠[9]2005年在《基于数据挖掘技术的证券投资辅助决策支持系统》文中认为与证券市场飞速发展不相称的是证券分析技术进展的缓慢,证券分析中知识的自动获取已经成为制约我国证券分析发展的“瓶颈”。因此,我国证券分析软件的发展方向就是可验证与自我学习的智能型软件。在这种情况下引入基于数据挖掘技术的决策支持系统(DSS)进行证券投资分析成为一个必然的选择,论文对数据挖掘技术及其在证券分析中的应用进行了较深入的研究。论文首先分析介绍了决策支持系统产生的背景、定义和传统决策支持系统的体系结构及决策支持系统的发展概况,以及决策支持系统的相关技术――数据仓库、数据挖掘等技术,阐明了建立决策支持系统和数据仓库系统为证券分析智能化服务的必要性和可行性。其次分析了数据挖掘和证券分析的特点及研究现状。证券走势是巨量个别决策的综合结果,预测非常困难,因此论文提出了运用数据挖掘技术,实现从海量数据中提取有用信息的自动化方法,指出将数据挖掘应用于证券分析的可行性和迫切性,分析了数据挖掘技术在证券市场这种群体博弈环境下的特殊应用,并对一些数据挖掘方法做了相应的改进,提出了适用于证券数据分析的挖掘模型。论文最后提出了一个基于数据挖掘技术的证券投资支持系统(StockLogic系统)的设计方案,并加以了实现,给出了一个原型,对发现和总结证券市场运行的规律有着重要的现实意义,对证券投资参与者起到了辅助决策作用。该系统提供了一个集成、开放的证券分析系统框架,该框架模型采用功能模块的方式集成,提供各种接口,具有较强的扩展性。StockLogic系统提供了板块分析、股票关联规则发现、股票价格序列相似性挖掘图形化搜索等功能,具有很高的实用价值,并用上海和深圳证券市场的交易数据对系统的主要功能模块进行了测试。
王中[10]2005年在《数据挖掘技术及其在证券领域的应用》文中研究表明本论文从四个方面探讨了数据挖掘理论与技术及其在证券领域的应用。第一,研究用于客户分析的聚类方法。通过挖掘客户的历史交易数据,基于客户关系管理理论提出并实现了证券行业的客户划分模型:客户自动聚类机制、同类别内客户分组机制以及模型动态更新机制。在客户自动聚类机制的实现方面,建立了资金规模、手续费收入、息差收入、操作频率等四项指标体系,通过对数据的统计相关性分析定义了加权聚类相似度公式,并通过对聚类结果的分析建立了证券行业的客户聚类效果评价指标;在同类别内客户分组机制的实现方面,提出并实现了根据客户的操作风格使用动态贝叶斯模型进行客户分组的方法。最后,使用CURE聚类算法实现了模型动态更新机制。第二,提出并实现了运用关联规则和序列模式的挖掘构造证券网上交易客户行为模型的方法,并用该模型构造Markov链转移概率矩阵,实现了网上交易行情自动推送算法,有效地提高客户网上交易实时行情的响应速度。第叁,提出并实现了证券业客户流失分析RFM-ROI模型,运用信息论中信息增益理论对RFM-ROI模型进行了基于数量分析的实证。根据RFM-ROI模型,在数据挖掘的基础上用分类方法构建了客户流失分析决策树,归纳出证券行业客户流失分析的业务规则,并提出了解决决策树剪枝问题的停止阈值方法。第四,运用时间序列模式分析的概念和方法进行股票趋势的K线模式挖掘,提出了在短期趋势预测中时间窗口匹配的插值算法,然后用径向基函数神经网络挖掘出股市历史走势中隐含的时间序列模式。
参考文献:
[1]. 灰色挖掘及其在证券分析中的应用研究[D]. 顾忠伟. 浙江大学. 2003
[2]. 序列挖掘及其在证券分析中的应用[D]. 聂亚可. 重庆大学. 2001
[3]. 证券分析中数据挖掘模型的研究及应用[D]. 林香. 厦门大学. 2007
[4]. 不确定时态数据挖掘方法及其在证券行情预测中的应用[D]. 谭华. 湖南大学. 2008
[5]. 时间序列相空间重构数据挖掘方法及其在证券市场的应用[D]. 陈佐. 湖南大学. 2007
[6]. 基于关联规则的股市板块指数建模分析与算法研究[D]. 周超良. 首都师范大学. 2013
[7]. 基于最小二乘支持向量机的时态数据预测研究及应用[D]. 吴琳. 东北财经大学. 2011
[8]. 数据仓库在证券业务分析系统中的应用[D]. 肖菲. 武汉理工大学. 2005
[9]. 基于数据挖掘技术的证券投资辅助决策支持系统[D]. 谢忠. 重庆大学. 2005
[10]. 数据挖掘技术及其在证券领域的应用[D]. 王中. 天津大学. 2005
标签:计算机软件及计算机应用论文; 数据挖掘论文; 支持向量机论文; 时间序列论文; 聚类论文; 数据仓库论文; 模糊聚类分析论文; 预测模型论文; 序列模式论文; 数据挖掘算法论文; 客户分析论文; 证券论文; 模糊理论论文; 模糊算法论文; 不确定性分析论文; 数据分析论文; 统计学论文;