一种基于高性能GPU的实时脉内分析实现方案论文

一种基于高性能GPU的实时脉内分析实现方案

庄跃迁

(西南电子技术研究所四川成都610036)

摘要: 传统的雷达信号分选方法,主要依赖于雷达信号的到达时间(TOA)、脉冲宽度(PW)、载频(CF)、脉冲幅度(PA)、到达方位角(AOA)等常规参数,对于宽频率、高捷变、数量巨大且交叠严重的真实战场环境雷达脉冲而言,其分选性能非常有限,已不能满足复杂电磁环境的雷达信号侦察需求。采用高性能GPU,利用其数量巨大的处理单元,在信号分选之前即对雷达信号脉冲开展分析处理,获取其调制样式及调制参数,并将其引入雷达信号分选,可以极大提升雷达信号分选的性能。

关键词: 实时脉内分析;信号分选;图形处理器;调制识别

作为现代战争中最重要的信息化装备之一,雷达广泛应用于陆、海、空、天等各类作战平台,具备预警探测、地面防空、引导打击、精确制导等功能。雷达辐射源具有数量多、分部密度大、分部范围宽、信号交叠严重的特点,而现代雷达频带覆盖宽,调制类型复杂,参数捷变,并越来越多采用低截获技术。在复杂电磁环境下,如何准确有效的截获和识别雷达信号,是电子信号侦察所面临的主要问题。

传统的雷达信号分选,主要依赖于雷达信号的常规参数测量,对于在时域、频域、空域和能量域上严重交叠的雷达信号,其信号分选性能十分有限。如果在信号分选过程中,能够引入雷达信号的调制样式及调制参数等信息,将可大幅度提高雷达信号的分选正确率。这就要求在雷达信号分选处理之前,必须完成雷达脉冲的分析处理工作,获取其调制样式及调制参数等信息。但是这对于动辄上百万的雷达脉冲环境而言,其处理量无疑是相当巨大的,传统的处理器显然已无法满足其处理要求。

今天的教学已进入了一个新时期,尤其终身教育已被认可。摆在每个人面前的未知领域永远存在,如何有针对的使学生带疑而学,如何使教师释疑而教将显得尤为重要。

本文探讨一种基于高性能GPU的实时脉内分析实现方案,利用GPU的阵列并行处理能力,将雷达脉内分析的实时处理变为现实,从而可大幅度提高雷达信号分选的正确率。

1 实时脉内分析

传统的电子信号侦察,通常对接收信号进行中频或视频采样后,即采用大规模可编程逻辑阵列(FPGA)对雷达信号进行数字信道化、信号检测、参数测量等处理,形成脉冲描述字(PDW)。并由数字信号处理器(DSP)对PDW中的信号参数进行分析,对雷达信号进行预分选、主分选和合批处理。再根据目标特征参数库,完成对雷达类型和型号的识别,形成辐射源描述字(EDW)。用户根据EDW列表,人工或自动的选择感兴趣的目标,控制电子侦察设备捕获辐射源的原始脉冲信号,对其进行脉内分析,获取脉冲的调制样式及调制参数,形成脉内特征参数,支撑对雷达辐射源的进一步分析和准确识别。

上述处理流程的问题在于:一方面信号分析的时效性较差,由于雷达信号具有瞬变的特点,在完成辐射源的分选、合批和识别之后,再通过人工或自动的方式进行脉内分析,目标雷达可能已经停止了信号辐射,或改变了工作状态,导致侦察设备无法捕获到与之前EDW相匹配的脉冲信号。另一方面,采用上述处理流程,可分析的脉冲数目极其有限,大多数雷达脉冲及其携带的有效信息都丢失了,从而降低了电子侦察设备的工作效能。第三,传统的电子侦察实时信号分选都是基于简单的参数测量结果,在目前雷达信号日益复杂的环境下,其分选效率和成功率都较为有限,而经过深入分析的脉内特征参数并未在雷达信号的实时分选中起到有效作用。

时域IQ两路信号分别为:

综上,为充分利用雷达信号所携带的有效信息,提高雷达信号分析的实效性,以及分选和识别的准确率,迫切需要将实时脉内分析纳入电子侦察的设备实现之中。

象形居于首位,有其一定的道理。关于汉字的起源,我国古典文献记录了大量的内容,有对前文字时期的记录,这里先不论。而关于创造文字本身的记录,从中我们可以发现汉字的雏形,东汉许慎《说文解字·叙》中“黄帝之史仓颉,见鸟兽蹄迒之迹,指分理之可相别异也,初造书契。”又有记录“仓颉之初作书,盖依类象形。”汉字在产生之初,就属于象形字,所以,造字“六书”之首为象形有其道理。

Jungermannia lanceolata L. 刘胜祥等(1999);项俊等(2006);马俊改(2006)

实时脉内分析是建立在对脉冲原始数据的实时分析的基础上的。电子侦察设备在对中频或视频接收信号进行采样后,先完成数字信道化和信号检测后,交由实时脉内分析,获取包括基本信号参数和脉内特征参数在内的较为完善的脉冲参数。信号分选的维度将可以扩展到调制样式和调制参数,从而在复杂电磁环境下,提高信号分选的能力。如图1所示是传统的构架与基于实时脉内分析的构架的对比图。

图1 传统和基于实时脉内分析的架构对比

雷达信号的基本参数包括了雷达信号的到达时间(TOA)、脉冲宽度(PW)、载频(CF)、脉冲幅度(PA)、到达方位角(AOA)等。传统的信号分选依赖于这几项参数进行动态距离聚类,实现对雷达信号的预分选,从而将密集的雷达信号脉冲流进行稀释,减轻后续处理的压力;再通过对脉冲重复周期(PRI)的分析,将脉冲流分离成各个雷达的脉冲序列,实现对雷达信号的主分选;最后根据分选结果进行综合分析判断与融合,是否调整参数对剩余脉冲进行再次分选处理,输出最终分选结果。

而实时脉内分析不仅为信号分选提供上述基本参数,还包括了雷达信号的脉内特征参数,如表1所示。

表1 雷达信号脉内特征参数

1)可以并行化的处理,充分发挥GPU高带宽、高处理性能的优点;

2 GPU的优势

图形处理器(Graphics Processing Unit,缩写GPU)是一种专用的图像运算微处理器,具有强大的数学和几何计算能力,一直在2D/3D图形加速方面发挥着非常重要的作用,它将CPU从图形处理的任务中解放出来,极大提升了计算机的整体性能。随着技术的发展,GPU的应用已不再局限于图形处理。由于GPU在浮点、并行等运算方面具备强劲的处理能力,因此其在科研、工程、游戏等诸多领域都有着广阔的应用和发展前景。

采用多重相位差分技术求取信号归一化瞬时频率f (n ):

针对复杂电磁环境下每秒数百万计的雷达脉冲,采用GPU对接收脉冲中频信号进行并行分析,可极大提高脉内分析的实时处理能力,从而支持后续的信号分选实现。

3 脉内分析算法

雷达信号脉内分析主要包括两方面,一是根据不同信号类型时域或者频域不同特点进行脉内调制样式识别;另一是脉内调制样式识别基础上,针对不同信号类型的脉内调制参数测量。

3.1 脉内调制识别

考虑脉内分析计算量及实时性要求,选择时域识别法,可识别简单脉冲、二相编码、四相编码、频率编码、线性调频信号和其它调制信号。在时域求取信号相位,解信号相位的周期性模糊,采用多重相位差分法求取信号的瞬时频率,进而识别信号类型,如图2所示。

图2 时域识别法流程框图

石蜡切片经常规脱蜡脱苯入水处理后,按照Tunel细胞凋亡原位检测试剂盒的操作步骤染色,光镜观察,正常心肌细胞核呈蓝色,凋亡心肌细胞核呈棕褐色。于200倍的光镜下每张切片随机选择2~3个视野,计算每个视野中凋亡细胞核数和总细胞核数,计算心肌细胞凋亡指数。凋亡指数=凋亡细胞核数/总细胞核数×100%。

式中,f 0为信号载频,φ 0为信号初始相位,φ (n )为信号瞬时相位函数。信号的瞬时相位为:

式中,φ '(n )是有周期性模糊的,对其进行解模糊处理:

式中,cei(l)为向上取整操作符,φ ''(0)=0。

但对于重庆市医院成本管理研究中心主任、重庆市第九人民医院(以下简称“重庆九院”)原院长张培林来说,科学合理地实行成本管理早已练就得游刃有余。张培林告诉《中国医院院长》,十五年前,重庆九院从市属变区管后,面临“缺品牌、缺人才、缺硬件、缺资金、缺政策”的困境,以政府财政投入为例:1997年至2011年,政府财政投入占重庆九院总收入的4.93%,远低于全国平均数10%、重庆8%。在区域内外竞争激烈的情况下,重庆九院不得不走低成本支撑差异化发展模式,倒逼时任院长张培林拿起了经济学书籍,开始自学成本管理。

青樱心中有气,出了殿门连软轿都不坐,脚下越走越快,直走到了长街深处。终于,惢心亦忍不住,唤道:“小主,小主歇歇脚吧。”

相比于传统CPU所侧重的调度、管理、协调能力,GPU更专注于计算,擅长对大数据进行简单重复操作,适合进行多路并行运算。GPU提供多个核心,其核心数量可多达数千甚至数万个,从而可以支撑大量数据开展大规模的并行计算,同时其访问速度更高,浮点运算能力更强。在本方案中,采用NVIDIA的Tesla P100计算卡,其采用最新的Pascal架构,包含3584个CUDA核心,双精度运算能力为5.3TFLOPS,单精度高达10.6TFLOPS,相当于数字信号处理业界性能最高的TI DSP TMS320C6678 60片同时运行的计算资源。

对于常规脉冲雷达,利用修正傅立叶系数插值测频算法测量信号载频;对频率编码雷达信号,分析出其各个载频信息;对于BPSK雷达,在信号平方和延迟自相关的基础上,分别采用修正傅立叶系数插值测频算法与最小二乘法测量信号载频和码速率,并解调出其码元信息;对于QPSK雷达,在信号四次方和延迟自相关的基础上,分别采用修正傅立叶系数插值测频算法与最小二乘法测量信号载频和码速率,并解调出其码元信息;对于LFM雷达,在信号延时共轭相乘和倒序共轭相乘的基础上,利用修正傅立叶系数插值测频算法测量LFM的调频斜率和中心频率;对于其他雷达信号,进行时频分析,呈现时频分布信息。

对于常规脉冲信号,瞬时频率为一条直线;频率编码信号为多条直线;线性调频信号的瞬时频率为一条斜线;非线性调频信号的瞬时斜率为一条曲线;相位编码信号的瞬时频率为一条直线,但是在相位跳变处有尖峰,BPSK信号的尖峰幅度只有一种大小,QBSK信号的尖峰幅度有两种大小。

3.2 脉内调制参数测量

在信号调制样式识别后,采用各自不同的方法估计调制域参数,脉内调制参数测量算法流程如图3所示。

图3 脉内调制参数测量算法流程图

去除中(fn )的直流分量:

4 基于GPU的实时脉内分析

基于GPU的实时脉内分析,采用高速数据存储处理平台架构,对输入数据提供实时存储、处理能力。支持高达2.8 GB/s的连续写入速度,支持输入数据直接到GPU的实时处理。如图4所示,前端处理分机的数据流进入设备后,经过光纤交换模块完成Aurora协议到PCI-E协议的转换,实现数据到上位机的透明转发。为了提高效率,数据通过DMA直接写入上位机的内存空间。由于操作系统对DMA操作的内存空间限制,通过申请多块64 MB的离散CPU内存空间以及与多进程并行处理相结合的方法实现高速输入数据的实时连续写入。

滥用抗生素的话,即使是健康的宝宝,抗生素也会造成肠道菌群紊乱引起继发性腹泻的,所以儿童医院肺炎之类的病上抗生素的同时都要用上益生菌等药来防止继发性腹泻。我家宝宝2个月的时候过敏性的便血,最后腹泻也来了,便血没止住,越来越厉害,腹泻还越来越严重,当时的情况只能用恐怖这个词来形容,就是被滥用抗生素的结果,打那之后我才知道有抗生素破坏肠道菌群引起继发性腹泻这回事。

图4 数据处理及存储数据流向示意图

对于需要GPU处理的输入数据,由于GPU处理模块具有大于输入数据的处理速度,因而无需缓存。GPU处理模块用于信号处理具有两大优点:

实时脉内分析所提供的脉内特征参数,为雷达信号的动态距离聚类增加了参数分析维度,可提高对密集雷达信号脉冲流的稀释能力和分选成功率。此外,携带有丰富雷达参数信息的海量PDW数据经过存储记录后,可为事后分析提供更加完善的数据支撑。

2)对于处理结果需要显示的应用,处理结果无需数据从GPU的显存中导出,这一特性在中频信号频谱分析的瀑布图中显的尤为突出。

中频信号经过FFT变换后产生的频谱数据需要再显控软件中进行实时显示,传统的做法是处理结果再回写到CPU内存,然后CPU内存再拷贝一份到显示设备的内存中。对于较大的数据量的数据交换(大于2M的FFT长度,100帧以上的处理速度),需要2次800 MB数据的写入操作和1次800MB数据的读取操作。而如果采用CUDA与OpenGL的显存共享机制,则频谱处理结果无需回写到CPU内存,因为数据均是在显卡内存空间中。结合OpenGL的位图重绘能力,可以使2 M长度的FFT中频信号瀑布图的刷新率可达200帧以上。

对于需要存盘的输入数据,高速磁盘阵列虽然已经具有了2.8GB/s的连续写入速度,但是还是无法满足高达5GB/s的光纤交换模块的数据输入速度。因而需要一个缓冲机制来实现输入数据的缓冲。这里需要把PCI-E DMA写操作的内存区域数据搬移到另外申请的联系内存空间作为缓冲区。

5 测试与结论

本文所述脉内调制识别方法通过多相滤波器后150 MHz采样率的中频子带数据上进行,采用蒙特卡洛方法进行仿真,取100次的统计结果。输入信号信噪比从0 dB到20 dB,包含常规信号(NS)、线性调频(LFM)、频率捷变(FSK)、二相编码(BPSK)、四相编码(QPSK)等5类雷达调制类型,调制识别正确率如表2所示:

表2 雷达信号脉内特征参数

如表2所述,本文提出的调试识别方法在13 dB以上能够达到100%的正确率,在11 dB以上也有95%的结果。基于瞬时相位的调制识别对FSK、BPSK、QPSK信号在高信噪比下具有较好的适应能力,对于低信噪比信号的适应性较差。能量聚焦算法对LFM信号具有较好的适应性,在8 dB以上信号正确检测率达到100%,而对于NS信号和FSK信号则性能较差。

本文给出了基于M-Rife算法的载波频率的仿真结果。为了验证整个频段载波频率测量的精度、验证频谱泄漏对测频精度的影响,如图5所示,以1 700 MHz为中心频率,相邻2两个频率分辨单元(fs/nfft)内频率的绝对值。从图中可以看出,传统FFT法(Direct FFT)受频谱泄漏的影响,在1/2频率分布单元中间位置会产生较大的误差,而在频率分布单元整数倍位置取得最佳结果。基于重心法的载波频率估计方法可在一定程度上降低频谱泄漏的影响,其最大绝对误差降低为原来的31.8%。本文所述的M-Rife算法在整个频段均取得较好的结果,整个频段测量最大绝对误差仅为直接FFT法的3.4%。

图5 基于M-Rife的载波频率测量

基于上述算法,在NVIDIA的4个Tesla P100计算卡上开展实现,对1 000组脉冲作为最小批处理单元进行调制识别、载波频率估计的处理能力,经过测试对脉冲的实时处理能力如表3所示。

直接能用语文教材中的学习活动组织教学,对教师来说既省时又省力,学习质量也有基本保证,应该是不错的选择。但是在这个问题上,可能部分教师存在一个认识误区,即教学中照搬教材中的学习活动容易被看成是“没有水平”的标志,部分评课专家可能也持这样的观点。其实,这是不成立的。因为语文教材一般经过了较长时间的研究,理应为教师和学生呈现优秀的活动设计。而课堂教学水平的高低,更多取决于教师在教学组织上的表现,否则大家都去模仿优秀的教学设计,问题不就解决了吗?因此,教师对教材中精彩的适合自己的活动设计不妨大胆选用,节省下来的时间、精力可投入到多读书、多向学生提供学习资料、多与学生交流上,这才是事半功倍的做法。

1.3.2 给药方法 术后,对照组同术前口服氯吡格雷片,皮下注射低分子肝素钠,3~5 d。观察组在对照组基础上给予替格瑞洛片(瑞典AstraZeneca AB,规格90 mg)治疗,90 mg/次,2次/d。经血管冠状动脉造影检查,对于需要再行PCI的患者,术前给予双倍含量的替格瑞洛。两组均进行为期半年的随访。

表3 基于Tesla P100的脉内分析实时性测试

以周边环境100批目标为例,典型的脉冲重复频率为10 kHz,则脉冲数量为100万/秒。对信号分选而言,每个目标能完成分选的最少脉冲数应不少于其一个CPI内的脉冲数量。按每个目标每个CPI周期内平均128个脉冲计算,100个目标对应需要处理每秒12 800个脉冲。因此,GPU阵列处理单元可以支持信号分选完成实时脉内分析处理。

由于美国农业技术发达,种粮食基本上不会出现亏本的情况。美国的农民甚至比一些工人还富裕,在政府的支持下,种粮食的人多了,粮食自然就多了,粮食多、成本低,出口有利润,为什么不出口呢?

6 结论

本文介绍了一种基于高性能GPU的实时脉内分析处理实现方案,该方案突破了传统电子信号侦察基于数字信道化、信号检测、参数测量、信号分选的处理流程,将脉内分析处理放在信号分选之前,通过GPU的高性能计算处理能力,实现信号脉冲的实时脉内分析,为信号分选提供了更高维度的参数支撑,大幅度提高了信号分选的效率,从处理架构上结构性的优化了电子信号侦察的处理流程。经过仿真验证及实际测试,该方法具有较强的可行性,可应用于电子信号侦察相关领域的信号处理方案。

参考文献:

[1]胡国兵,胥嘉佳,李岳衡.雷达调制信号分析与处理技术[M].北京:人民邮电出版社,2014.

[2]邓振淼.雷达信号脉内分析与处理理论及算法研究[D].南京:南京航空航天大学,2007.

[3]姜建华.基于瞬时测频的雷达调频信号脉内特征估算方法[J].数字技术与应用,2017(3):90-92.

[4]王娟娟,梁俊杰,钟强,等.基于瞬时频率的LFM信号脉内分析[J].电声技术,2016,40(9):60-64.

[5]张敏,冒燕,张海黎,等.基于瞬时测频的非线性调频信号脉内特征估算方法[J].空军预警学院学报,2015,29(2):91-94.

[6]吴昊,茅玉龙,曹俊纺.基于循环谱相关的雷达信号脉内分析改进算法[J].火力与指挥控制,2016,41(9):123-127.

[7]王聪,闫秋飞,徐烨.一种基于二次预测的虚假相位跳变判别方法[J].舰船电子对抗,2018,41(3):92-95.

[8]曾德国,陈望杰,倪小康,等.邻信道合并的改进及其测频方法[J].航天电子对抗,2014(2):33-36.

[9]王娟娟,王瑞,李珂,等.基于Rife算法的LFM信号性能分析[J].舰船电子对抗,2018,41(4):36-39,48.

[10]张辉,范雪林,李东风.一种改进的短时傅里叶算法实现[J].通信技术,2017,50(5):1066-1069.

[11]王佩,仇兆扬,祝俊,等.雷达信号侦收自主处理结构分析[J].电子信息对抗技术,2016,31(5):25-29,40.

[12]徐延东,华蓓.面向GPU的内存管理与应用[J].电子技术设计与应用,2017(7):83,86-90.

[13]屈宜丽,蓝才会,任志国.CPU/GPU异构并行系统研究综述[J].自动化与仪器仪表,2016(4):25-26.

[14]陈文斌,杨瑞瑞,于俊清.基于GPU/CPU混合架构的流程序多粒度划分与调度方法研究[J].计算机工程与科学,2017,39(1):15-26.

[15]底涛.一种CPU+GPU的多核异构平台设计方案[J].计算机与网络,2016(3):90-93.

[16]吴衡,郭承军,程亚文.基于GPU的高动态信号快速捕获设计与实现[J].全球定位系统,2016,41(6):55-58.

[17]姚旺,胡欣,刘飞,等.基于GPU的高性能并行计算技术[J].计算机测量与控制,2014,22(12):4160-4162.

[18]丁祥武,李子通.集成CPU-GPU架构上的列存储连接优化技术研究[J].计算机科学,2016,43(11):265-271,308.

Design of real-time intra-pulse analysis of high performance GPU

ZHUANG Yue-qian
(Southwest China Institute of Electronic Technology ,Chengdu 610036,China )

Abstract: Traditional methods of radar signal sorting is mainly depended on conventional parameters,like the time of arrival(TOA),pulse width(PW),carrier frequency(CF),pulse amplitude(PA)and the angle of arrival(AOA).its sorting performance is very limited for the realistic battlefield environment where the radar pulses have wide frequency,quick variation,huge numbers and heavily overlapping,and can’t meet the requirements of the radar signal reconnaissance in the complex electromagnetic environments.Using the high performance GPU,which has the huge numbers of processing units,and doing the process and analysis of the radar signal pulses before the signal sorting to get the pulses’modulation types and modulation parameters,can highly improve the performance of the radar signal sorting where the parameters can be used.

Key words: real-time intra-pulse analysis;signal sorting;graphics processing unit;modulation recognition

中图分类号: TN971

文献标识码: A

文章编号: 1674-6236(2019)19-0100-05

收稿日期: 2019-03-05

稿件编号: 201903034

作者简介: 庄跃迁(1982—),男,四川成都人,硕士,工程师。研究方向:电子侦察和电子对抗技术。

标签:;  ;  ;  ;  ;  

一种基于高性能GPU的实时脉内分析实现方案论文
下载Doc文档

猜你喜欢