公诚管理咨询有限公司第三分公司 广东东莞 523000
摘要:如何在列车高速运行状态下保证乘客获得良好的网络通信质量,是高铁无线通信网规划、建设、优化的首要目标和重要内容。基于此,文章给出一种基于大数据的高铁通信网络质量优化解决方案,并通过实际应用验证其可行性。
关键词:高速铁路;通信网络;质量评估体系
近年来,高速铁路以其快捷、准时、安全、环保的特点,在我国乃至世界范围内高速发展。但铁路覆盖面大、沿线情况复杂、无线覆盖弱场多,同时列车的高速运动所导致的频繁越区切换,都对通信质量和安全产生严重影响。为满足高铁场景网络优化的要求,必须对传统手段加以改进,以提升高铁用户业务感知。
1.高铁通信网络质量优化解决方案
1.1 总体思路
通过大数据分析将用户、小区、路线、方向、时间、场景六维度汇聚成一整体,基于高铁用户身份识别、用户定位、乘车方向识别等,对异常事件进行定位分析,快速、准确评估高铁场景网络质量并提升用户业务感知,如图1 所示。重点解决三类问题:
图1 六维一体分析法
①脱网区域判定:实现高铁高风险脱网区域的准确判断与分析。
②入侵区域判定:实现公网用户入侵专网高风险区域的准确判断与分析。
③专网性能监控:实现高铁专网用户体验感知性能与网络性能的监控。
1.2 基础数据获取及处理
基于通信网络信令数据,将移动网络、承载网络中数据流量的关键信息记录,即流量日志,以用户会话为单位,一个会话形成一条XDR 记录。通过对海量XDR 数据的分析处理,基于相关算法应用于实际问题[1]。
1.2.1 高铁用户识别
首先获取高铁专网基础数据,包括高铁沿线专网小区覆盖信息、小区方向序列、TAC、ECI、方位角、经纬度等。获取用户位置定点数据,包括小区序列、方位角、跟踪区、MR 等。以信令作为分析数据源,从实时信令监测数据中匹配数据矩阵,并基于自学习算法进行矩阵数据修正。基于数据矩阵、用户移动速度、首末距离等,综合分析用户占用小区类型、运行距离、移动速率、占用小区时间等多项因素,形成以移动速率为主体判别条件的用户身份识别算法,准确识别高铁专网用户。
①首先根据MME 时间段关联HTTP 数据,根据时间占比情况,将1 条HTTP 数据拆分成多条记录。
②按照1 小时的数据,按照用户和时间进行分组排序,按照2 分钟一组,进行多边形的用户位置定位。
③根据2 分钟的用户定位的经纬度,计算用户在20 分钟内的移动速度和用户占用小区等情况。
④利用信令面S1 _MME 数据,以小时为单位,按照以下规则依次判识:
一是首先识别用户占用高铁专网的首末小区。
二是用户20 分钟之内的移动速度大于100 公里/小时。三是占用3 个以上的高铁专网小区。
四是用户占用高铁首末小区距离大于10 公里。
五是用户60%的会话次数占用在高铁专网上。
⑤最终识别出高铁用户。
1.2.2 高铁用户定位
①当用户记录中的小区数为1 时,直接以该小区经纬度做为该用户位置。
②当用户记录中的小区数为2 时,设小区的经纬度分别为(x1,y1),(x2,y2),以两分钟为一个统计周期,同一统计周期内,同一用户在各小区发生的S1 XDR 时长分别记为T1,T2,则用户位置为:
③当用户记录中的小区数为3 时,将三个小区按经纬度构造一个三角形,选取该三角形重心为用户位置,公式如下:
未选取外心作为用户位置,是因为虽然外心到三顶点距离相等,符合静止用户的位置计算,但用户若处于运动状态,则经过的三个小区极有可能构成一钝角三角形。钝角三角形的外心在三角形之外,不符合现网用户的实际情况,而重心在三角形内,故选用重心作为用户位置点。
④当用户记录中的小区数为N 时,将N 边形拆分成N - 2 个三角形,要求这些三角形包含原N 边形的所有边。然后求出各三角形的重心坐标Oi(xi,yi)及面积Si。重心计算方法同步骤③,Si计算方法如下:设三角形的三顶点A(x1,y1)、B(x2,y2)、C(x3,y3)按逆时针方向排列,则三角形面积为:
1.2.3 乘车方向识别
高铁乘车方向的判别基于用户占用的小区序列来实现,主要为以下几个步骤:
①搜集高铁专网小区信息,通过高铁小区位置分布及现场测试,掌握终端先后占用的小区情况。如记录A线高铁由北向南先后占用小区为A、B、C、D、E、F。
②建立小区编号序列,根据终端先后占用情况为小区进行顺序编号,如:
小区名称:ABCDEF……
小区编号:012345……
③整理原始数据,基于S1 口的XDR 数据将S1_MME与S1_HTTP 数据汇总进行分析,通过提高数据量而提高判断准确性。汇总的字段主要是时间、ECI 及用户标识。原始数据的用户必须占用两个或两个以上高铁小区,因为占用一个小区无法根据预先定义的小区序列判断其方向,也无有效数据证明该用户为高铁用户。其它数据剔除,以减少不必要的分析。
④举例说明算法规则。当高铁用户经A线高铁由北向南时,由于UE 空闲模式下无S1 连接,S1XDR 无用户数据,占用小区与实际测试占用的小区不尽相同,可能依次为B、D、F,对应小区编号1 <3 < 5,对应占用的时间B_time < D_time < F_time。根据以上规则,实际数据处理中即可根据时间判断用户依次占用的小区顺序,再根据占用小区对应的编号进行运算,必有5 - 3 > 0、3 - 1 > 0,将逻辑判断转变为数学运算,达到批量判别的目的。
1.2.4 用户脱网/公网入侵判断
在高铁用户识别的基础上进一步获取高铁用户从高铁专网脱入占用公网小区进行业务,及公网用户占用高铁专网小区进行业务的信息,实现高铁用户脱网或公网用户入侵的判断。从现网海量用户中进行用户识别,识别出高铁用户和非高铁用户。高铁用户判断是否脱网,识别出高铁脱网用户和非脱网用户。非高铁用户判断是否入侵,识别出公网入侵用户和公网非入侵用户。
高铁脱网识别规则:
①首选判断用户为高铁用户。
②识别高铁用户的运行方向。
③同TA list 的TAU 尝试。
④UE 存在专网小区到公网(排除月台小区)的TA 更新。
⑤用户在高铁专网小区重新发起Attach 请求,且3 分钟前有信令。
⑥用户在高铁专网小区掉线。
高铁用户脱网率计算:基于用户维度统计,对存在高铁脱网识别规则的用户进行汇总分析,记录其用户脱网率。
低速入侵专网识别规则:
①用户移动速度小于60kM/小时。
②用户占用非站台附近高铁专网小区。
③用户占用的高铁专网小区数小于等于3。
④占用某一高铁专网小区业务时间超5 分钟。
基于高铁用户脱网、公网入侵用户的聚类分析,可实现对高铁脱网高风险区域与入侵专网高风险区域的准确判断。
1.3 建立高铁专网质量评估体系
传统的高铁专网质量分析只能基于网管指标对高铁专网小区eNodeB 相关指标进行分析,无法实现基于高铁用户、路线、方向纬度数据的分析。而在用户感知体验与网络性能保障中需全面考虑以上因素对网络要求的差异性。
通过大数据分析将用户、小区、路线、方向、时间、场景六维度汇聚成一整体,基于高铁用户定位、身份识别、乘车方向识别等算法,进行用户脱网或入侵的判断,实现脱网/入侵高风险区域/路线/方向的判断,构造高铁专网覆盖质量评估体系。
根据目前湖南现网专网站间距少于10km,高铁运行时速为250km/h,考虑到进出站等减速情况,假设平均时速为210km/h,则列车通过一专网小区覆盖需要的时间约为3 分钟,故计算高铁穿越某专网小区的用户数时间应限制在3 分钟以内。基于3 分钟统计与方向识别,准确判断用户乘车会车的特殊场景,实现网络峰值用户数、峰值业务量、峰值时段的判断,构造高铁专网的容量评估体系。
进一步实施网络接入性能、传输性能、稳定性能、移动性能的分析和判断,构造基于多维度关键算法的高铁专网质量评估体系。基于此体系可实现用户、小区、场景、路线、方向、时间的全方面的网络质量监控与用户体验感知的评估与保障工作[2]。
2.实际应用效果
2.1 高铁脱网高风险区域分析
2.1.1 高铁用户脱网率概况
以某省为例,通过对高铁用户识别,A线高铁与B线高铁日用户数为7.2 万,其用户脱网率为79.73%,说明高铁沿线存在专网小区不连续覆盖的现象。从用户量与用户脱网情况来看,A线高铁用户量4.5 万,远大于B线高铁的2.7 万,但用户脱网率78.02%,低于B线高铁的82.53%。从A线高铁运行方向来看,北往南用户70.88% 的脱网率,低于南往北的83.75%。从B线高铁运行方向来看,西往东用户81.36% 的脱网率,低于东往西的95.67%。
2.1.2 高铁脱网分析案例
以某市为例,高铁用户数据提取时段为6∶ 00 -24∶ 00,平均用户数= 用户数/18 个时段,每小时平均高铁用户数大于1000,且平均每小时脱网用户数大于200 的脱网高风险区域共有14 个。对7 点至23 点高铁用户数据基于XDR 分析,高铁用户在A线高铁甲地、乙地、丙地附近路段出现脱网现象。高铁由南向北行驶,该路段由丁地1HLD3910472523PT-1 主覆盖,有6368 个高铁用户占用该小区脱离专网。从脱网占用小区行为分析,脱网路径为:4725231 →4607162 →4725231 的用户有4140 个,占脱网总数的65%。
通过对高铁用户脱网行为,基于无线侧、XDR两个维度分析,在高铁沿线专网覆盖较差或不连续、公网覆盖良好的路段占用公网小区,疑似存在3 个脱网区域,如图2 所示。从南向北依次分析:
图2 脱网高风险区域
①区域1:甲地存在隧道,怀疑隧道出入口专网不连续覆盖或覆盖差,导致用户在该区域脱网频繁。
② 区域2:该区域为丁地1HLD3910472523PT-1 专网覆盖,该小区拉远天线相距810 米左右,天线方位角覆盖不合理,可能引起专网信号不连续。另外问题区域超出天线的有效覆盖范围,专网出现覆盖空洞。
③区域3:丙地附近存在隧道,怀疑隧道出入口覆盖差、覆盖不连续或隧道无覆盖,导致该区域用户脱网频繁。
经现场核查,本例用户脱网主因高铁沿线特殊场景(隧道)覆盖不连续、专网小区天线间距较大,存在覆盖空洞、弱覆盖的问题。解决方案:区域1、区域3 检查附近的隧道内外覆盖是否连续,在保障覆盖的前提下,通过参数调整,优先驻留专网。区域2 核实专网天线方位角是否合理,保障专网天线沿高铁沿线覆盖。针对专网天线相距过远,覆盖空洞、不连续问题,补点完善覆盖。丁地1HLD3910472523PT-1 在高铁沿线重叠覆盖过多的问题,可考虑在完善问题路段专网连续覆盖后,RF 调整控制覆盖[3]。
2.2 入侵高铁高风险区域分析
2.2.1 入侵高铁高风险区域概况
对公网用户占用专网业务时间超过5 分钟定义为公网入侵用户。以某市为例,高铁专网承载的用户中有30.59% 来自公网用户入侵,高铁专网承载的会话量中有2.22%来自公网用户入侵,入侵专网用户比例大于5% 的小区共有15 个。综合入侵用户数来看,有7 个小区需进行用户入侵专题优化。
2.2.2 入侵高铁专网分析案例
根据XDR 数据分析,A线某路段,约2.2km,公网低速用户入侵专网现象严重。经统计该路段入侵高铁专网的低速率用户2263 个,入侵路径:该路段HL-D3900460104PT-2→HL-D3910472487PT-1(专网)占总入侵用户的27.96%,如图3 所示。问题分析:
图3 入侵高铁高风险区域
①HL-D3910472487PT-1(专网)与4601041 /2 公网小区共址,共址小区入侵用户达到1317 个,占入侵总数58.19%。
②该路段高铁为南北走势,最近距离仅为50 米左右,从无线环境、专网RRU 共小区覆盖特性来看,专网小区覆盖可覆盖毗邻高铁的道路与居民区等。
③该路段专网采用F 频段覆盖、公网采用D 频段覆盖。据悉当前LTE 切换策略,在满足高铁用户优先驻留专网参数设置下,在高铁与公网共覆盖的区域,公网用户入侵专网的可能性增大。
解决方案:
一是检查高铁专网小区天线及参数配置,减少专网天线旁瓣泄露到沿线道路与居民区等。
二是检查专网小区在高铁沿线的连续覆盖,邻区优化、切换测量调整,增加低速率用户入侵专网的难度。
入侵区域判别可准确判断入侵区域、入侵前公网小区及入侵用户数,然后可优化调整低速用户迁出策略。例如开启高铁专网低速用户迁出功能,修改空闲态重选参数,RSRQ 测量、defaultpagingcycle、ReselectionIntraEUTRA、qhyst 加快重选[4]。
2.3 建立高铁感知监控体系
通过高铁质量监控体系,实现从信令面到业务面质量的全面监控,同时可实现与全网小区进行横向对比分析。高铁专网与公网业务KPI 指标对比如图4 所示,基于用户感知KQI 指标对比如图5 所示。
图5 高铁专网与公网业务感知KQI 指标对比
3.结束语
总之,为了保障旅客的正常通信质量、提升用户感知,高速铁路无线网络的优化变得十分必要和迫切。在大数据技术的支撑下,网络优化就是一个进行系统数据提取、收集以及整合分析的过程,其中找到影响网络速度及质量问题的症结是关键,从而有针对性地进行调整。本文的研究重点就聚焦于大数据在高铁移动通讯网络优化中的具体应用,以提升网络优化的效率和准确性,获取最大效益,供参考。
参考文献:
[1]高成岗.高铁专网优化经验及建议[J].中国新通信,2015(5):46-46.
[2]杨胜林.基于机器学习的高铁CDMA网络路测分析系统研究[D].浙江大学,2014.
[3]王政.高速铁路环境下的GSM无线网络覆盖优化[D].华北电力大学,2013.
[4]杜宗格.高铁WCDMA无线网络结构优化研究与实施[D].北京邮电大学,2015.
论文作者:陈真
论文发表刊物:《基层建设》2018年第24期
论文发表时间:2018/10/1
标签:高铁论文; 用户论文; 专网论文; 小区论文; 公网论文; 数据论文; 区域论文; 《基层建设》2018年第24期论文;