摘要:随着大数据时代的来临,大数据概念也被广泛应用至各行各业中,高速动车组作为快捷、高效、经济、环保的新型交通工具,也引入了大数据系统,在一列动车组从设计制造到运用维护期间产生了大量与之相关的数据信息,通过大数据系统对这些数据进行分析对我们研究动车组车辆状態变化及故障预防有着重要意义。
关键词:大数据;高速动车组;运维应用
目前,我国已形成“四纵四横”的高铁干线网,高铁总运营里程达 2.5 万 km,在线高速动车组近 3000 列标准组,运营里程占世界60%以上,动车组保有量占世界50%以上。到 2020 年,中国铁路网规模将达到 15 万 km,其中高铁 3 万 km。届时中国将建成以“八纵八横”主通道为骨架、区域连接线衔接、城际铁路补充的现代高速铁路网。随着大量高速动车组列车投入运营,几大主机厂动车组运维数据都达到 PB 级,已经积累了比较丰富的高速动车组运营和检修数据。运维数据的管理、分析必须借助大数据手段和人工智能技术在数据发掘方面的独特优势。本文分析了目前高速动车组运维面临的挑战,提出构建动车组运维大数据平台的技术思路,对大数据和人工智能技术应用于动车组运维的关键技术、典型应用场景等问题进行梳理、分析和展望,并提出发展建议。
1数据挖掘实施技术路线
大数据技术经过多年发展,经历了技术诞生的促动期、期望峰值,逐步进入成熟阶段,成为主流技术。在数据的洪流中,如何利用大数据产生竞争优势,成为当前装备制造业关注的重点。国内外传统制造业巨头GE、西门子、ABB、三一重工、航天科工等公司纷纷推出自己的工业大数据分析平台,积极推进传统制造向智能制造、生产型制造向服务型制造的转变。一些科研单位也着力于将人工智能及大数据技术应用于工业、交通行业,以解决日常运维所面临的挑战。动车组大数据运维的总体实现思路是,以轨道交通装备、用户和制造企业作为应用对象和数据来源,通过构建大数据平台,对高速动车组运维过程中产生的数据等进行统一采集、存储、管理。该平台利用大数据等先进信息技术手段挖掘运维数据价值,从地面故障预测与健康管理(prognosticandhealthmanagement,PHM)和车载PHM两个层面,构建突破时间和地域限制的远程运维服务新模式。
在实现数据采集及存储管理的基础上,按照对车辆运营安全、正常行车及乘客舒适度影响的程度,以及“整车—主要系统—关键部件”的层次,分析数据挖掘的业务对象,形成转向架走行系统、牵引系统等各个专题需求。根据具体的需求,从数据中心提取列车运营历史数据和试验数据,针对选取的应用对象进行数据整合(重采样、数据降维、剔除异常、补缺等操作),基于机理分析及专业知识,初步选择模型特征及对应的输出参量,同时采用随机森林等机器学习方法从整合后的全部数据字段自动搜索模型特征,将两种方法选择的特征相组合,采用机器学习方法构建模型。开展模型训练及测试工作。将提取到的数据源按照90%和10%比例拆分为训练和测试数据,由于动车组运营数据中设备故障数据比例较少,可采用多折交叉法验证。将测试、验证后模型部署于生产环境数据中心并接入动车组运营实时数据,对相关设备运营状态进行检测、评估。在此过程中,对设备发生故障的数据进行标注,以强化模型的学习能力,进而优化模型。最后,根据模型诊断结果,给出预警信息;有针对性地制定设备维护计划(包含维护时间节点、需要的配件和工具及技术支持等),优化配件管理;通过数字化技术资料及虚拟远程可视化技术,完成故障的快速处置。
2典型应用场景
牵引变压器作为动车组列车牵引系统重要设备之一,属于列车重点的监控及维护对象,本文以此为例介绍基于大数据的人工智能技术在动车组运维工作中的应用。
期刊文章分类查询,尽在期刊图书馆牵引变压器在工作中会产生大量的热损耗,引起电气部件温度升高,如果超过电气部件所能承受的温度范围,牵引变压器将不能正常工作,甚至会破坏电气部件的绝缘性能,影响列车的安全、正点运行。正常运行过程中,牵引变压器产生的热量通过油循环进入散热器,最后由冷却风通过滤网散发出去。因此,确保滤网清洁对牵引变压器正常运行至关重要。由于滤网清洁程度与列车运行地域环境、气候(柳絮季节、大雪等)等因素有关,难以通过传统的解析或简便的测试方法获悉,目前主要是通过分地域、不同季节,制定不同定期清洗周期,维护成本较高。
基于大量的历史运营数据,采用机器学习方法判断牵引变压器温度是否发生异常;基于历史数据统计分析及滤网清洗记录,识别出滤网清洗前后时段对应的样本数据,并进行标记,以随机森林机器学习建立滤网堵塞判断模型;在判断变压器温度异常的基础上,根据列车运营数据,通过滤网堵塞模型识别滤网堵塞程度,从而可以根据需要灵活地开展滤网清洗维护工作。
首先,对列车运营数据进行聚合、选取特征数据及目标参量,以牵引变压器温度为目标,采用 RNN 循环神经网络建立温度预测模型。对过去 6 个月动车组列车运营数据(每列车 1~4 车 5852 个、5~8 车 6274 个测点参数)进行重采样、异常值剔除及修正、PCA 降维等预处理,得到 1~4 车 128 个、5~8 车 139 个特征参量,以 90% 数据建立温度预测模型,另外 10% 用于测试。全部测试数据显示,模型平均均方误差 MSE=0.085,最大绝对误差 3.183 ℃,最大绝对误差大于 1 ℃的数据占比为0.543%,取得了较好的预测效果。该预测模型可以作为牵引变压器温度异常检测的参考基准。然后,通过牵引变压器实际测试温度与预测温度差值及其变化规律判断是否发生温度异常。检测到牵引变压器温度异常后,在判断变压器本身、油循环冷却系统正常情况下,通过滤网堵塞模型计算发生堵塞程度,堵塞程度指标超过 0.5 则认为滤网出现堵塞,需要清洗。
3 轨道交通智能化运维发展建议
当前,轨道交通行业运维向着全生命周期服务、多样定制、适应不同环境、可持续性、改善人员环境等各方面发展,以适应人们出行对安全、绿色、多元化的需求。为此,需要统筹规划列车、基础设施、运营指挥等各环节数据资源,构建包含基础设施、移动装备、运营指挥、检修、旅客服务五位一体的数据中心,保障安全监测管理与服务。如何有效地利用动车组在设计、生产、运营、维护过程中产生的庞大的数据资源?如何应用大数据技术解决动车组主机厂、用户所关心的“痛点”问题 ? 这些问题应当是大数据应用于轨道交通行业很好的切入点。基于大数据技术,开发具备自感知、自识别、自决策、自学习功能的智能列车,实现动车组行车、运维、监控、旅客服务的智能化。对用户而言,列车安全运营、降低运营成本、高效先进的维护机制始终是重点关注问题;对主机厂来说,不断优化的产品、提升制造效率、优化供应链始终是追逐的目标。大数据通过与当前先进的人工智能等技术结合,挖掘动车组产品数据价值,提升主机厂的竞争力,消除用户所关注的“痛点”问题。
结论
基于大数据的人工智能技术在轨道交通运维领域应用还处于探索阶段,由于普遍缺乏故障样本数据,因此,一些在互联网企业、图像识别领域有较好应用效果的技术无法直接应用于动车组运维。本文结合动车组列车运维特定的需求,提出了构建动车组运维数据中心的技术思路,采用基于数据驱动和机理分析相结合方式构建动车组设备故障检测模型,通过数据中心提供的大量历史数据及高效的数据资源管理服务完成模型训练、验证和部署,取得了较好效果,为进一步推广到动车组其他设备、子系统及全列车运营维护奠定坚实基础。
参考文献 :
[1]宋德刚,牛齐明.高速动车组大数据PHM系统研究与应用[J].铁路计算机应用,2018,27(10):44-48.
[2]胡晓依,孙加林,姚建伟,侯茂锐,成棣.基于大数据分析的高速动车组车轮磨耗统计分析研究[J].中国铁路,2017(12):13-17.
论文作者:祝晨
论文发表刊物:《科学与技术》2019年第04期
论文发表时间:2019/7/9
标签:车组论文; 数据论文; 滤网论文; 模型论文; 列车论文; 变压器论文; 技术论文; 《科学与技术》2019年第04期论文;