1佳木斯市中心医院药剂科 154002;2黑龙江省医院 150036
摘要:随着科学技术的提高和计算机的广泛应用,化学、药物及其相关学科也在突飞猛进地发展,研究方向也呈现出从宏观状态研究到微观结构理论、从描述性向推理性、从定性到定量、从静态到动态的发展趋势。通过研究人们认识到:决定物质性质最关键的因素是分子的结构,分子结构一经确定,物质的性质也随之而定。这一研究对于化合物的分子结构性质数据的发展有一定的参考价值。
关键词:定量构效关系;数据统计;药物化学
Abstract:with the extensive application and improve the computer science and technology,chemistry,medicine and related disciplines have developed by leaps and bounds,the research direction also emerged from the macro research to micro structure theory,from description to reasoning,from qualitative analysis to quantitative analysis,from static to dynamic development trend. Through the research,we realize that the most critical factor determining the nature of the material is the structure of the molecule,the structure of the molecule is determined,and the nature of the substance is also determined. This study has a certain reference value for the development of the molecular structure of the compound.
Key words:quantitative structure activity relationship;data statistics;drug chemistry
定量构效关系以数学和统计学手段建立起化合物的化学结构与生物活性之间的定量关系。QSAR在化学与生物学之间架设起了一道桥梁。在探讨了几种定量构效关系方法的基础上,通过水杨酸镁的质量检测实验进行了应用分析,结果表明引入定量构效关系的实验分析结果可以起到补充、取长补短的效果,为建立更好的检测机制提供参考。定量构效关系(Quantitative Strueture-Activity Relationship QSAR)研究的主要思想是通过对一系列结构相似的有相同药理作用的化合物进行分析,以化合物的结构参数或理化性质参数为自变量,生物活性为因变量,以数学和统计学手段建立起化合物的化学结构与生物活性之间的定量关系。理论上,QSAR在化学与生物学之间架设起了一道桥梁;应用上,QSAR所建立统计模型可以预测新化合物的活性,并指导新化合物的设计。研究成果同时具有理论价值和实用价值,目前已应用到各个领域,已成为药物结构改造的一个有力工具。在QSAR研究过程中,由于数据类型的多样性以及建模方法的不同,需要分析计算的数据量很大,如何从中选择出与研究对象最密切相关的,单靠人力计算已很难解决。因此,使用数学统计分析方法已显得越来越重要。
本文就常用的数据统计方法及其选择原则等进行介绍,为从事相关工作的研究人员提供参考。
1 定量构效关系方法
1.1 主成分分析
在实际研究中,相关性较高的变量如果个数太多就会增加研究的复杂性,如何用较少个数的变量包含所有的信息就显得十分重要。主成分分析就是将多个变量通过线性变换,将重复的变量(关系紧密的变量)删去,研究如何通过少数几个主成分来揭示多个变量间的内部结构的一种多元统计分析方法。其中心目的是将数据降维,将相互重叠的信息变量删除,重新组合成一组新的两两不相关的几个综合变量,而且这些新变量能尽可能多地保留原始变量的信息。
期刊文章分类查询,尽在期刊图书馆主成分分析在作回归时,是用方差较大的主成分来进行回归拟合,那些方差小甚至为噪声的主成分都已去除,因此主成分分析能将变量中的一些随机误差去除,具有一定的噪声过滤作用。主成分分析可以处理化合物数目相对较少,而结构参数或理化性质参数为自变量相对较多的情况,并可以从一定程度上解决变量间的多重共线性问题。
1.2 偏最小二乘法
偏最小二乘法[4]的数学基础是主成分分析,此方法可同时对多个因变量进行分析,特别适合自变量的个数多于样本个数的情况下进行回归分析。偏最小二乘法第一步先选出最大预测值的模型,主要是通过交叉验证法求出预测残差误差和来实现;第二步用非交叉方法计算模型的表达式,回归系数R2越大,预测值的标准误差越小,说明回归方程拟合度越好,方程的预测性越强。简单的说,偏最小二乘回归≈多元线性回归分析+典型相关分析+主成分分析。偏最小二乘回归得到的模型,可以直接在平面图上观察变量之间的相互关系,能在很好地总结自变量信息的同时,更好地对因变量进行深入的解释。 1.3 人工神经网络分析
人工神经网络以现代神经科学研究成果为基础,通过模拟人脑的组织结构和信息处理功能而建立起来的一种信息处理系统,具有自适应、自组织和自学习的能力。神经网络是一种非线性统计性数据运算模型,由大量的、功能相对简单的节点(或称神经元)相互联接构成,每个节点代表一种特定的单一输出函数,它能够与其它节点通过权重相连接。应用最多的VBB为三层逆向传播网络(BP),分为输入层、隐蔽层与输出层,三个层中的不同节点通过各种连接方法进行网络化设计,每个连接方法对应一个连接权系数。通过连接权系数的不断调整,最终实现整个网络的预期优化。通过神经网络系统进行复杂数学建模的研究发现,因其具有并行性、纠错性、非线性等优点,对非线性、因果关系不明确的定性分类问题相对传统统计方法具有明显优势。但由于其不能提供显性的数学模型,以及标准统计方法评价各类拟合程度,在线性的建模研究中,其优势并不明显。神经网络分析现已被广泛地应用于QSAR 的研究中。随着科学技术的发展,一些新的神经网络统计方法陆续出现,如模糊人工神经网络、概然论神经网络、混沌神经网络、无显著衰变神经网络等。它们不但具有强大的学习功能,而且能够建立更易于解释的QSAR 模型。
2 实验应用研究
本次实验是基于定量构效关系方法对水杨酸镁的完成质量检查实验。
2.1 实验原理
镁盐与氨、氢氧化钠能够生成白色沉淀,水杨酸盐能够和三氯化铁表现为紫色,和稀盐酸生成白色沉淀,纳氏比色管可鉴定重金属。
2.2 实验材料
这里应用到以下实验材料:水杨酸镁2 g、稀盐酸12 g、氢氧化钠2 g、磷酸氢二钠2 g、三氯化铁2 g、乙二胺四醋酸二钠2 mL。
2.3 数据处理与实验结果
这里采用SPSS软件进行了数据的因子分析,SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,这些模块支持本次实验的应用。因子分析结果见图1所示。
图1可以看到:加三氯化铁(因子)特征值非常高,这样能够很好的实现水杨酸盐的鉴别,加入稀盐酸(因子特征值较小)有白色沉淀,对重金属鉴别有用。这样结果表明引入定量构效关系的实验分析结果可以起到补充、取长补短,收到更好的效果,建立更好的模型。
3 结 语
QSAR定量的构效关系,能够实现理化性对化合物的生物活性的分析,为建立更有效模型提供参考,文中在分析这一关系的基础上利用一个实验进行了验证,表明这一方法能够起到较好的效果,这一研究对于,化合物的分子结构性质数据的发展有一定的参考价值。
参考文献:
[1]Martin Y C. Quantitative Drug Design[M].New York:Marcel Dekker,1978:50-120.
[2]杨蕾,王鹏,周德瑞,等.新型氯喹酸酯类除草剂的定量构效关系分析[J].清华大学学报(自然科学版),2004,44(3):323-325.
[3]陈安进,石杰,计算机辅助药物设计中用于建模的计算方法研究进展[J].中国海洋大学学报,2005,35(3):407-411.
论文作者:董宇,王馨
论文发表刊物:《健康世界》2016年第21期
论文发表时间:2016/11/22
标签:定量论文; 神经网络论文; 变量论文; 关系论文; 方法论文; 化合物论文; 成分论文; 《健康世界》2016年第21期论文;