中国石油化工股份有限公司九江分公司 江西 九江 332004
摘要:文章分析了大数据的特点及其背景下统计学所面临的方法与技术瓶颈,阐述了色谱经济分析法与统计学的关系及因其独特的分析功能和技术手段能够满足统计学应对大数据所需要的某些功能。在对色谱经济分析法的基本概念和理论介绍后,以消费者行为的分析为例演示了色谱经济分析法的基本过程,并展望了色谱经济分析法作为统计学的创新方法在大数据中的应用前景。
关键词:大数据;统计学;色谱经济分析法
引言
大数据由于潜在的巨大经济价值和科学价值,已成为多个学科的研究热点。从统计学这一方法论学科的研究角度来看,对海量且种类繁多的数据进行分析并从中萃取价值是大数据应用的本质,这决定了大数据与统计学之间的必然关系。
1色谱经济分析法基本框架
统计学应对大数据的机遇和挑战需要引入新的理论和方法,所引入的理论和方法能较好针对大数据的特征,有效解决其所面临的方法和技术瓶颈。在这一点上,色谱分析法具有满足这些功能的许多条件。色谱分析法是分析化学分离与分析多组分复杂混合物的有效工具和科学研究不可或缺的技术手段。其原理为:待分离的各组分在两相之间反复进行分配,其中一相为固定相,另一相为流动相。各组分与两相都可能发生作用,但主要由于固定相的吸附能力不同、以及分配系数和离子交换能力等的微小差异,当流动相推动的时候,两相间反复多次质与量的发生反应,最后分离开来,分离时会产生一种反馈信号,该信号会被检测,信号检测便成为定量和定性分析的根据l2]0该方法具有分辨率高、分离效率高、检测能力强等特征。
2色谱经济分析法塔板理论模拟
化学中对于一个复杂的样品,如果不经过预处理,那么任何一种现代化的分析仪器也无法直接分析出全部的表征和信息,尤其是在组分成分未知或样品浓度较低时,采取必要的预处理措施能够有效地提高分离效率,如采用吸附、解析、萃取、浓缩、稀释、衍生化等方法处理样品。相对于化学物质的未知性质,复杂经济现象中的待分离组分的行为方式是相对确定的,且行为结果的表现形式通常是可预测的,因此色谱经济样本预处理过程相对于化学色谱法处理对象更具针对性,效果也更明显。色谱经济样本预处理是一个去冗余过程,面对纷繁复杂的海量数据,从中筛选出待分离对象的行为的表征信息,摒弃与分离过程不相关的数据和信息,根据化学色谱理论与实践,在已知流动相和固定相的前提下,样本预处理的效率能够接近100%。色谱经济柱系统的工作原理可通过一系列初步模拟过程来体现,模拟过程是揭示隐藏在复杂数据中一般规律的过程。色谱经济柱系统的模拟分析严格遵循色谱分析法的原理,先置换出固定相和流动相,使得研究对象在经济领域运用色谱分离思想的前提是:色谱柱是特定环境约束下的某种经济行为发生的时空概念,同时分离对象必须是经济主体的某种选择行为,且对于分离目标的核心特征是连续的。假设流动相是促使行为发生的倾向,固定相是阻碍行为发生的倾向,则分配比是固定相和流动相对待分离现象的作用大小之比。
期刊文章分类查询,尽在期刊图书馆具体到企业责任行为[6}的例子中,企业除了将收益用于承担外部责任外,还会进行部分保留(如用于企业对内的投资行为等),则流动相为外部消费倾向,固定相为对内保留倾向,分配比是消费倾向对企业的作用与保留倾向对企业的作用之比,则塔板理论的基本假设在本例中具体如下:(1)色谱柱是一个多期消费过程,每一期消费过程为一个塔板,在每个塔板内选择消费和选择保留的个体可以很快达到平衡;(2) 假定定收益为载气,以脉冲方式增加,收益每增加一次时,企业会进行一次外部消费与内部保留的选择;(3)假定待分离对象开始时都在0号塔板上,且企业之间的纵向相互影响忽略不计;(4)企业的分配比(保留倾向与消费倾向之比)在各个塔板上均为常数。
3色谱经济分析法速率理论的模拟
塔板理论忽略了色谱柱内固定相和流动相作用过程中会发生扩散和传质,故未能全面反映其分离本质。而色谱经济分析法的速率理论充分考虑了混合组分在柱中的假设企业对外消费行为滞后的时间间隔为p=1,即企业在R期形成的收益使用决策并没有在P期实现,而是在PP+1期才进行消费。在色谱柱中,表现为原本在t期应该进人下一塔板的企业在P+1期才完成该行为。假设Pt=3时,塔板1中25个单位的企业里有10个单位可能由于消费场所区域分布问题,不得不延迟消费。由于消费行为滞后的时间间隔为P=1,这10个单位的企业在P=4才进人下一个塔板(塔板2),表现为P=3时塔板1中的企业仅有15个单位进人到下一塔板,而有35个单位留在原塔板。同理可以传质阻力项和分子扩散项的分配情况。三种因素共同作用的情况三个因素共同作用下的分配情况(k=1:1)比例不同,最终流出色谱柱的时间发生偏离。速率理论将经济干扰因素纳人色谱经济分析法体系,用“平均分配比不变”替代了“分配比不变”,更加接近经济现象的现实状况。是速率理论三个因素作用下的分配情况,相对于塔板理论下的理想分配情况,更好地反映了复杂经济现象分离过程,色谱峰整体上发生延展,保留时间变长。
4模拟说明
色谱经济分析法的分离原理意味着具有相同行为特征的消费群体通过色谱柱后得到的流出曲线呈峰形,消费群体的选择特征和规模大小决定了峰的形状和面积,当企业的特定行为倾向愈显著,色谱峰对应的保留时间愈短,峰高愈大,峰宽愈小;当同一类型企业的规模愈大,峰面积愈大。消费群体的行为选择差异在色谱经济分析法中最终会表现为相对分离的色谱峰,当群体的行为差异越大时,色谱峰重合的部分越小,分离效果会越好。据此,可根据混合消费群的最终流出曲线将不同类型的消费群体进行分离,并根据不同消费群体的保留时间和峰高确定该消费群的行为特征。塔板理论假设待分离对象的分配比是确定的,每期都有固定比例的企业会选择消费,现实中由于经济运行的多变性和微观主体行为的交互性,消费行为会提前或滞后,消费金额也在不断波动,以至于每期选择消费的个体所占速率理论三个因素的存在使分配过程带有一定的偶然性和随机性,弱化了消费行为的群体特征,让隐藏在数据本身中的规律变得难以观察和识别。大数据能够弥补这方面的不足,当观测数据足够多时,就能消除或者减弱偶然性和随机性,使隐藏在复杂信息下的共性和规律得以体现。海量的消费数据蕴含着消费行为的群体性特征,这些特征依附于数据进人色谱经济分析系统,通过设置流动相和固定相,使这些目标数据实现自动整合和排序,使隐蔽在复杂数据下的规律得以体现和检测。在色谱经济柱系统的模拟过程中.当约束每增加一次,企业会做出对应的消费决策(消费或保留),当个体进行消费的次数大于塔板数时,信号检测系统就识别该个体从色谱柱流出。
结束语
总之,统计学引人色谱经济分析法有望解决大数据下统计学方法和技术瓶颈问题,同时,这样一个跨学科借鉴的研究尝试以及所进行的一系列置换研究必然对相关的研究提供新的视角和思路。
参考文献
[1]苏立强色谱分析法[M].北京:清华大学出版社,2009.
[2]达世禄色谱学导论[M].武汉:武汉大学出版社,1999.
[3]游士兵,郑开元,于雪,包莉丽.色谱经济分析法的理论思考fJl.科决策,2012.(8).
[4]沈萍,张佩,毛错苑,李跟强.游士兵.色谱经济分析法五换系列研究:分配比[J].统计与决策,2017,(17).
[5]沈萍,游士兵,毛错范,张佩,李跟强.色语经济分析法笠换系列研究:保留时间[J]统计与决策,2012,(13).
论文作者:余丽
论文发表刊物:《防护工程》2017年第5期
论文发表时间:2017/7/11
标签:色谱论文; 经济论文; 分析法论文; 数据论文; 统计学论文; 企业论文; 理论论文; 《防护工程》2017年第5期论文;