(北京智芯微电子科技有限公司)
摘要:本文是讨论可见光通信过程中多路语音混音效果较差的解决办法和思路。其主要讨论领域是可见光通信过程中语音数据的排队和过滤解决方法,混音算法的动态归一法优化及实现。
关键词:可见光通信(VLC);多路语音混音;数据排队和过滤;归一法
1 引言
可见光通信(VLC,Visible Light Communication)是一种在LED照明的基础上实现无线通信的技术手段,利用光源发出肉眼无法察觉的高频闪烁可见光来传输信息。同传统的射频无线电通信及其它无线光通信技术相比,VLC具有无处不在、传输速率高、不占用无线电频谱资源、无电磁辐射、无电磁干扰等优势。它被认为是无线频谱资源受限、无线电信号深度衰落及电磁敏感等情况下最具前景和优势的短距离宽带通信覆盖技术,因此受到了学术和产业界的广泛关注。
同时,可见光通信又有许多缺点:可见光基站覆盖范围较小,需要频繁切换基站;可将光通信过程容易被物体打断光线传播,导致信号中断等缺点。尤其在实时性和连续性要求较高的语音通信中,如果处理的不好,声音质量将非常差。
本文论述如何处理电力巡检等场合下,通过可见光传输多路语音信号的传输优化和混音改进。
2可见光多路语音传输的解决方案
2.1可见光传输语音的难题
A一般的可见光通信基站覆盖范围有限,其覆盖直径一般也不超过10米,因此对于移动终端需要较频繁进行越区切换
B移动终端与可见光基站存在被物体遮挡现象
C由于可见光基站覆盖范围较小,因此需要较多的基站来保证区域内的通信;所以,运动的通信终端容易出现在信号覆盖交叉区等信噪比较低的区域
2.2 多路语音数据的优化处理
要实现多个终端的语音对讲功能,相对于其它通信方式,数据的不连续、实时性差、数据量的不平滑问题更为明显。因此我们需要在服务器和基站之间的语音数据处理上采用数据缓存,非常连接通信,自适应多路数据等技术来解决这些问题;并且根据有缓存的语音数据上对混音算法做优化,来提高混音效果减少噪音。
2.3采用合理机制,解决语音数据包时间不同步的问题。
理想情况下,我们的每一路语音数据都会连续的接收;实际现场中,由于可见光通信的特点,我们收到的数据包是不连续的,不均匀的。这就导致我们的需要混音的多路数据由于通信的原因造成了语音数据包在时间坐标上被严重打乱。由于数据的不连续,导致多个终端在同一时间产生的语音数据,被我们接收到时是不同时间,而且很可能时间偏差超过500ms。解决这个问题,需要在数据接受起始的时候,做一个时间阀值的限制,因为即使是多路数据同时发送,也不可能同时接收到。我们的缓存是蓄水池功能,时间阀值就是让该有水的蓄水池都蓄到了水。另外,在从缓存中取数据的时候,发现获取的语音数据路数和有效的语音路数不一致,则做一个时间阀值等待,直到获取的语音数据和期望的一致。经过这样处理,把不同步的多路语音数据做了同步,保证了混音效果的清晰,避免了不同步的语音数据包混音噪音过大的问题。另外,缓存的时间阀值和等待的时间阀值是可以动态调整的。根据不同的网络环境可以变动来实现最好的实时性和通话效果。
图1:语音数据带阀值缓存示意图
采用非常连接、非阻塞的通信方式,尽量提高实时性,避免由于部分通道的堵塞导致整个系统处理性能下降。
非常连接即采用UDP通信方式。UDP相对于TCP有更高效的数据传输能力,更好的实时性。实时性是语音传输的首要要求。虽然UDP可能有丢包现象,但在丢包的时候必定是网络情况不理想,这时候丢弃一些包换取整体的实时性是可以接受的。
非阻塞通信是指每一路语音接收都采用非阻塞模式,这样就可以在一个线程中做多路数据的接收,避免了用多个线程接收多路数据,造成的系统资源消耗和线程间通信造成的实时性消耗。非阻塞接收数据还有个优点就是在一个线程内可以同时完成语音数据混音的过程,因为在CPU处理过程中,发现没有语音数据接收后,就可以对缓冲中的已经接收数据进行混音计算,而不需要专门做等待或者任务切换来进行混音计算,这样最大效率的提高了CPU的使用效率。
(2)自适应的数据处理机制。传统方式都采用通过令牌授权方式决定终端发声的机制,这种机制虽然简单,但是一般只用在某一时刻只允许一个终端发声的系统中;而且,这种方式需要终端有按键的支持,并且系统要有令牌仲裁机制。本系统采用自动适应多路语音机制,通过判断终端是否有数据交互,来自动处理混音过程。只要接收到终端数据,系统自动混音,终端不使用或没语音时,系统自动不处理。具体实现是对于每个连接,都分配一个连接端口,对每个端口都侦听其数据包,如果有数据包,则认为有数据,且数据缓存中在一定时间内接收到超过一个数量阀值的数据包,认为是有效合法语音数据;否则认为非法无效数据,进行丢包处理。这样处理能够避免网络环境极差的时候,无效数据对整个系统的错误干扰。
3多路语音数据的混音解决方案
3.1混音的基本原理
声音是一种物体震动产生的压力波。响度,音调,音色是其三个要素。在日常生活中,我们人耳听到的声音是周围各种声音混音之后的结果。
混音的基本原理:
对于混音算法的选择,采用简单的混音算法有噪音和溢出的问题,太过复杂的算法又可能导致语音传输实时性不足的问题。
3.2混音的动态归一算法实现
A,采用32BIT变量保存16BIT的PCM数据的累加和,然后再用来做因子和越界判断。这样消除了16位数据累加时产生的溢出问题,进而保证数据的正确性。
B,由于本系统采用了足够的数据缓存,因此我们在归一法混音的算法基础上做了自己的优化。优化的思路针对缓存中的数据做最大值统计,根据统计的结果做归一因子的调整。这样就使整个语音听起来流畅,没有突变的爆破音。
我们的混音算法是,对过去缓存的N个各路语音帧做统计计算,求出最大的混音数据,然后将其作为该部分混音的基数因子,其它数据做成比例计算得到对应的因子。对于后续新的语音数据,我们对新数据和缓存中的最大因子对应的数据做比较,如果新数据比缓存的最大数据大,此时基数因子按新数据修改;如果不大于,则不修改因子;当持续不大于之前最大值超过一定数量,且不溢出,则将因子修改为1.见图2.
6结论
采用本方案论述的处理方法后,在可见光通信过程中,不需要较大的带宽既能实现良好的多路语音的混音及传输。
参考文献:
[1]James B.Rawlings.Tutorial overview of model predictive control.IEEE Control Systems Magazine,2000,20(3):38 – 52.
[2]丁宝苍.预测控制的理论与方法[M].北京:机械工业出版社,2008.
[3]M.Larsson,D.J.Hill,and G.Olsson,“Emergency voltage control using search and predictive control,” Int.J.Power Energy Syst.,2002,24(2):121–130.
[4]Mats Larsson,Daniel Karlsson.Coordinated system protection scheme against voltage collapse using heuristic search and predictive control.IEEE Trans on Power Systems,2003,18(3):1001-1006.
[6]J.Y.Wen,Q.H.Wu,D.R.Turner,S.J.Cheng,J.Fitch.Optimal coordinated voltage control for power system voltage stability.IEEE Trans on Power Systems,2004,19(2):1115-1122.
[7]L.Lin,R.Kumar,et al,Application of model predictive control in voltage stability,Proceedings of the 2007 American Control Conference,New York city,USA,2007,5916-5921.
[8]刘水平,刘明波,谢敏.基于轨迹灵敏度的电力系统模型预测切负荷控制方法[J].中国电机工程学报,2010,30(34):28-35.
[9]Wächter A,Biegler L T.On the implementation of primal-dural interior point filter line search algorithm for large-scale nonlinear programming.Mathematical programming,2006,106(1):25-27.
[10]Cutsem T V,Vournas C.Voltage stability of electric power systems [M].Norwell,MA:Kluwer Academic Publishers,1998:318-320.
[11]Hill D J.Nonlinear dynamic load models with recovery for voltage stability studies [J].IEEE Transactions on Power Systems,1993,2(8):166–176.
[12]钱积新,赵均,徐祖华.预测控制[M].北京:化学工业出版社,2007,9:7-21.
[13]Hairer E,Nørsett S P,Wanner G.Solving ordinary differential equations Ⅱ:stiff and differential-algebraic problems[M].北京:科学出版社,2006:1-614.
[14]Ascher U M,Petzold L R.Computing methods for ordinary differential equations and differential-algebraic equations[M].SIAM, Philadelphia,PA,1998:270-276.
[15]Wächter,A.,An interior point algorithm for large-scale nonlinear optimization with applications in process engineering.PhD.Thesis,Carnegie Mellon University(2002).
[16]Fourer R,Gay D M and Kernighan B W.AMPL:A Modeling Language for Mathematical Programming,2nd ed.Belmont,CA:Thomson Brooks Cole,2003:1-64.
[17]Anderson P M,Fouad A A.Power system control and stability [M].IEEE Press,New York,1993:440-44.
[18]胡泊,刘明波.含二次电压控制器最优协调电压控制的切换直接算法[J].中国电机工程学报,2010,30(25):29-36.
作者简介:
陈河(1979-),男,高级工程师,主要研究方向为电力系统信息化及控制
高金鹏(1986--),男,中级工程师,主要研究方向为电力系统信息化及控制
唐玉健(1984-),男,中级,主要研究方向为电力系统信息化及控制。
李涛(1979—),男,硕士,高级工程师,主要从事智能用电、可见光通信方面的工作。
刘瑞(1984—),男,硕士,中级工程师,主要从事智能用电、可见光通信方面的工作。
基金项目:国家电网公司总部科技项目(SGHAZZ00FCJS1500238)。
论文作者:陈河,李涛,刘瑞,高金鹏,唐玉健
论文发表刊物:《电力设备》2018年第2期
论文发表时间:2018/6/8
标签:数据论文; 语音论文; 可见光论文; 混音论文; 通信论文; 多路论文; 终端论文; 《电力设备》2018年第2期论文;