新精神活性物质拉曼谱图强荧光背景去除方法研究
贾二惠 李 彬 金 川
(公安部第一研究所,北京 102200)
摘 要 :针对新精神活性物质拉曼谱图信号其普遍存在的强荧光背景问题,充分挖掘原始信号的统计特性和荧光背景变化趋势,通过线性回归分析科学引进“广义信噪比”,提出了一种新的有效去除强荧光背景的基线校正方法。该方法利用线性回归对拉曼谱图原始信号曲线漂移变化进行刻画,根据广义信噪比归一化阈值判断提取信号中的基线点,再通过相邻基线点线性连接从而得到最终的基线。经理论分析和仿真实验结果证明该算法是一种灵活实用、快速简易的高效算法。
关键词: 新精神活性物质 拉曼谱图 荧光背景 广义信噪比 基线校正 线性回归
当今世界,在海洛因、大麻等第一代传统毒品和以冰毒、摇头丸等第二代传统合成毒品仍旧泛滥的情况下,第三代毒品即新精神活性物质已凸显且异常活跃。近年来,新精神活性物质对社会的危害呈上升趋势愈演愈烈,面对新精神活性物质新产品变化多样层出不穷、以及美国内芬太尼类物质滥用等各国存在的问题,全面开展新形势下的禁毒之战是全世界全社会共同面对的重大课题,现代快速检测识别技术对新精神活性物质滥用扩散的遏制无疑将发挥积极作用。
拉曼光谱分析技术因其无需制样、无损、快速、信息丰富、水干扰小、可重复、灵敏度高、强稳定性及高分辨率等众多优点,已成为分析化学及工业、安检及反恐等领域物质结构信息测定与快速识别鉴定的有效技术[1-6]。本研究借助现代拉曼检测技术,针对新精神活性物质拉曼谱图信号其普遍存在的强荧光背景问题,充分挖掘解析原始信号曲线的统计特性,通过线性回归分析创新引进“广义信噪比”,提出了一种快速去除强荧光背景的基线校正方法,该方法的应用在实际中将为拉曼光谱特征峰的准确提取及其后续的定性定量分析提供正确可靠的过程数据,有效去除强荧光背景是新精神活性物质拉曼谱图信号数据处理的关键环节[7-10]。
1 算法原理
一般而言,随着激光激发波长的渐增,新精神活性物质拉曼谱图信号漂移变化总趋势呈现了从平缓、突增、上升、下降、缓降直至平缓,而所检测物质的真实拉曼光谱特征峰叠加在强荧光背景信号之上,新精神活性物质受激光激发产生的荧光光谱等背景信号却远强于物质拉曼特征峰的真实信号,图1为典型示例图。
图1 1-(4-氯苯基)-2-乙氨基-1-戊酮拉曼谱图原始信号
由此可见,新精神活性物质拉曼谱图原始信号其特有的强荧光背景将严重影响待测物质拉曼光谱特征峰的准确提取及其后续的定性定量分析,有效去除强荧光背景是新精神活性物质拉曼谱图信号数据处理的重中之重。
为叙述方便起见,现引进“广义信噪比”如下:
首先,基于线性回归刻画新精神活性物质拉曼谱图信号曲线漂移变化,即对原始信号进行信号数据窗移动和局部窗口线性拟合,从而得到各数据窗口的线性回归拟合线、信号线性漂移下行线、信号线性漂移上行线。其中,线性漂移下行线、线性漂移上行线为与线性回归线平行的、并分别通过下方和上方最大偏差信号点的两条平行线,见图2
图2 “广义信噪比”定义理解辅助图
通过观察分析发现:(1)两条平行线之间的距离d (X) 反映了该信号数据窗口去除基线后真实信号的变化幅度,拉曼信号曲线与线性漂移下行线的交点为准基线点;(2)通过计算得到的准基线点集合包含了全部的真实基线点,还需进一步对准基线点进行判断并从中提取真实基线点(详见下文);(3)当d (X) 比较大时,对应的数据窗口蕴含了拉曼特征峰信号,反映了拉曼谱峰峰位及峰幅度等特征值;当d (X) 很小时,对应的数据窗口蕴含了噪声信号,反映了噪声信号的随机偏差。于是,通过对强荧光背景新精神活性物质拉曼谱图原始信号从左到右逐点进行窗移动和局部窗口线性拟合及系列计算,得到了各点对应其局部数据窗口沿信号漂移线性上下方浮动的变化幅度值d (X) 。因此,现定义广义信噪比如下:
事实上,原始信号的广义信噪比值在谱峰信号与噪声信号处表现特性不同,在信号谱峰处附近其广义信噪比值保持较大,而在其它处的广义信噪比值较小,广义信噪比值较小的所对应的准基线点为真实基线点。见图3、图4。
GSNR (X) =d (X) /RDV
(1)
其中
RDV = min(d (X) )
(2)
3.5 总之,本试验建立的 ddPCR方法灵敏度高、重复性好,特异性强,可进行HPS低含量样品检测和定量检测。为HPS的检测、流行病学调查、质控等提供了一个切实可行的解决方案。
图3 广义信噪比仿真结果示例图
图4 广义信噪比归一化仿真结果示例图
本研究所设计的基线校正方法,首先设置信号数据窗口尺寸WindowSize和广义信噪比归一化阈值GsnrNormThreshold,采用从左到右逐点移动信号窗口,对各窗口的数据进行线性回归与计算获得信号线性漂移上下方浮动的变化幅度值d (X) 、广义信噪比GSNR (X) 和准基线点,然后由广义信噪比归一化阈值判断提取真实基线点,再对相邻基线点采用线性连接形成一条完整的基线。
2 基线校正方法详细设计
鉴于原始信号的广义信噪比在谱峰信号与噪声信号等其它处的特性不同,根据广义信噪比归一化阈值可提取真实基线点,再线性连接相邻基线点,从而最终实现基线校正的目标。
2 .1 基线校正算法的参数选项设计
备注:
60年栉风沐雨,60载别样芳华。60年来,一代又一代开磷人担负起保护和开发祖国磷矿石资源、服务中国农业的神圣职责,用自己的心血和汗水把开磷浇筑成为中国磷化工行业的重要基石。开磷走过的这60年,是艰苦奋斗的60年,是风雨同舟的60年,是砥砺奋进的60年,更是充满希望的60年!
表1 基线校正算法参数选项表
2 .2 基线校正算法程序流程图
关于该基线校正算法的实现,如流程图5所示。
多属性线性评价模型综合了多种权值计算方法对指标进行权值设置,并结合指标归一化值计算出综合评价得分,实现了对信息化建设与应用多角度、全方位的评价,解决了信息化评价困难的问题。
图5 基于随机信号处理的基线校正算法程序流程图
该算法共有两个参数即数据窗口的宽度WindowSize和广义信噪比归一化阈值GsnrNormThreshold,基线校正参数选项见表1。
(2)该数据处理流程实际包含了删除首尾无用信号段,因这不是本文的主题对此不再赘述其具体体现,该项工作亦可在仪器信号采集与数据前处理系统中完成;
(1)在实用中亦可结合仪器信号系统实际情况完善配套软件算法库并优化相应算法具体细节,如添加拉曼光谱spike峰剔除功能等[11];
本底值样地剖面形态的 7Be垂直分布特征反映了降雨携带 7Be沉降的数量和土壤吸附后再渗透分布的变化,与研究区的旱雨季转变和雨季期间的降雨及降雨量的波动情况有关。因为研究区位于滇西高原季风气候地带,3月的本底值样地的土壤表层,由于较长时期干旱形成裂隙结构利于降雨迅速渗透至土壤深层,以致在3月剖面中下部出现间断分布;5月本底值样地由于降雨致使表层土壤颗粒分散并充填土壤裂隙,土壤表层吸收水份并不连续向下渗透,在土壤剖面表层中呈现高浓度值,并且在次表层和底部出现多个峰值层;8月降雨持续进行,降雨后地表细流多于向土壤层垂直方向渗透的水分,致使本底值剖面出现较低浓度的 7Be含量。
(3)本算法亦适用于其它化学谱图信号的基线校正处理。
3 仿真实验与分析
根据上述新精神活性物质拉曼谱图信号强荧光背景去除方法和程序流程图,笔者用Matlab编程实现了该算法,为限于篇幅具体程序省略。本示例对一幅3,4-亚甲二氧基丙卡西酮拉曼谱图原始信号采用所编写的程序进行数据处理,仿真结果如图6、图7所示。
花样游泳有单人、双人、团体等形式,都是只有女子能够参加。花样游泳起源于欧洲,1920年花样游泳创始人柯蒂斯将跳水和体操的动作混合一起表演,起初只作为两场游泳比赛之间的一种娱乐节目,后来逐渐融入舞蹈和音乐,成为一项优美的水上竞技项目。
通过以上及多组仿真实验结果分析可得:(1)采用本研究设计的算法进行数据处理,根据广义信噪比归一化阈值判断能有效提取真实基线点;(2)基于多参数选项的算法更加灵活实用,可通过选择适当的参数值优化应用效果:算法参数WindowSize的选取通常以峰宽值为参考值、一般选取约半峰宽至约全峰宽即可;算法参数GsnrNormThreshold的选取应比较适中,当GsnrNormThreshold太小(与0值靠近)、或太大(与1值靠近),基线范围将会减小、或扩大,从而导致基线贯穿、或基线过校正;当GsnrNormThreshold适当大时,对谱峰兼有一定的去卷积作用(如图7所示);(3)在实际应用中可结合仪器信号系统实际情况确定参数值适合范围。
某日几位男同事闲聊,不知怎么说到了私房钱,众人正在感慨无论怎样都会被老婆发现时,小辉默默地说:“我都存银行。”众人问:“那存折或卡呢?”他憨厚一笑:“烧掉或毁掉,要用的时候再拿身份证到银行去补。”
图6 仿真结果显示图
WindowSize=21;GsnrNormThreshold=0.2
图7 仿真结果显示图
WindowSize=21;GsnrNormThreshold=0.3
4 结论
本研究科学合理引进“广义信噪比”,创新提出了一种有效去除强荧光背景的基线校正方法,利用原始信号的广义信噪比在谱峰信号与噪声信号处的特性不同,通过广义信噪比归一化阈值判断获取基线点,再通过相邻基线点线性连接从而得到最终的基线。该算法具备如下几个特点:(1)算法直观简捷、易于实现,无需平滑去噪等前处理,直接对时间域信号提取能反映原始信号曲线随机特性的广义信噪比,从而快速获取真实基线点;(2)算法含有两个参数选项,灵活易用、稳健高效,根据算法参数值选择准则和经验,通过设置适当的算法参数值(数据窗口宽度WindowSize和广义信噪比归一化阈值GsnrNormThreshold)可优化应用效果;(3)为准确获取待测物质拉曼光谱特征、后续谱图数据处理峰识别提供可靠的自适应阈值判别依据;
通过以上理论分析和众多仿真实验反复验证,该算法是一种灵活实用、快速简易的高效算法。
参考文献
[1] 吴正洁,黄耀熊,王成,等.多种拉曼光谱归一化法对乙醇定量分析的研究[J].光谱学与光谱分析,2010,30(4):971-974.
[2]张涛 孙丹 闻健明 乐爱兵,等.基于拉曼谱的易制毒化学品轨迹综合查缉装备[J].警察技术,2016(4):8-10.
[3]尤晓明,洪利军,李志豪,等.易制毒化学品的现场检测与分析方法研究[J]. 光谱学与光谱分析,2013,33(5):1257-1261.
[4]张涛 ,史艳宁, 贾二惠, 李彬.基于拉曼光谱的危险液体自动识别方法[J].全国第四届近红外光谱学术会议,2012:151-153.
[5]王红球,张丽,王璐,等.拉曼光谱在安检领域中的应用[J].光散射学报,2012,24(4):367-370.
[6]王继芬,余静,孙兴龙,等.毒品及其常见添加成分的拉曼光谱快速分析[J].光散射学报,2012,24(3):312-315.
[7]高国明,李雪,覃宗定,等.消除拉曼光谱荧光背景的新方法及其应用[J].光学学报,2013,33(2): 1-9.
[8]覃赵军,陶站华,刘军贤,等.分段式线性拟合校正拉曼光谱基线漂移[J]. 光谱学与光谱分析,2013,33(2):383-386.
[9] 吴正洁,黄耀雄,王成,等.对强荧光背景拉曼光谱定量分析的研究[J].光谱学与光谱分析,2010,30(7):1798-1801.
[10]陈珊,李晓宁,梁逸曾,等.拉曼光谱的荧光背景扣除及其用于药物聚类分析[J]. 光谱学与光谱分析,2010,30(8):2157-2160.
[11]李晟,戴连奎.一种简单的在线拉曼光谱spike剔除方法[J].光散射学报,2011,23(3):188-194.
Research on eliminating background fluorescence for Raman monitoring of new psychoactive substances .
Jia Erhui ,Li Bin ,Jin Chuan
(The First Research Institute of Ministry of Public Security of China ,Beijing 102200,China )
Abstract :By introducing the concept of generalized signal-noise ratio(GSNR) in linear regression analysis, a new baseline correction method is proposed to eliminate background fluorescence of new psychoactive substances(NPS). The experiment results show that the present technique is flexible, practical and easy,fast to implement.
Key words :New psychoactive substance; Raman spectrum; Fluorescence background; Generalized signal-noise ratio; Baseline correction; Linear regression
DOI: 10.3969/j.issn.1001-232x.2019.06.021
基金项目: 国家重点研发计划项目(2016YFC0800900)。
收稿日期: 2019-05-08
作者简介: 贾二惠,研究员,公安部第一研究所多年从事算法设计与仪器信号数据处理。
标签:新精神活性物质论文; 拉曼谱图论文; 荧光背景论文; 广义信噪比论文; 基线校正论文; 线性回归论文; 公安部第一研究所论文;