摘要:高速公路具有行车速度高、通行能力大、运输成本低等优点,是经济发展的大动脉,对沿线经济的发展具有重要的推动作用。当前,在我国高速公路交通流量不断增长、通车里程不断延长的背景下,高速公路交通安全压力日益增大,形势严峻。高速公路交通安全日益成为全社会关注和探究的关键性问题。
关键词:高速公路,交通事故,数据挖掘,事故致因,事故严重程度
高速公路在社会经济发展中具有极高的的地位和作用。但是现阶段,高速公路交通事故导致的财产损失和人员伤亡仍居高不下。因此,深入研究高速公路交通事故发生机理和内在规律并提出相应的对策来降低事故发生率和严重程度,具有很强的经济价值和现实意义。
1交通事故信息采集技术概述
1.1 事故信息采集方法
事故信息采集按照采集的先后顺序可分为:事故现场信息采集、事后信息采集两类。通过对现场信息采集,获取与事故相关的物证资料,为事故处理、责任认定提供证据;其次是查明事故的起因;此外,通过对现场的勘查,获取及时准确的事故调查资料,可为相关研究提供数据基础。事后信息采集的目的在于对事故发生的地点、当地民俗、事故目击者进行调查。
1.2 事故信息采集内容
事故的信息采集主要从事故相关人员信息、事故相关车辆信息、事故发生时的道路信息、事故发生时的周围环境信息、事故现场痕迹信息、事故发生过程信息、事故发生原因信息、事故后果、其他信息等方面入手。
2 高速公路交通事故分布特征
2.1 高速公路交通事故形态与原因分布
2.1.1事故形态分布
高速公路具有与城市道路、普通公路显著不同的交通环境,因此其事故形态与城市道路、普通公路相比具有显著差异。高速公路交通事故形态主要分为车辆间事故(碰撞运动车辆、碰撞静止车辆)、车辆与人事故、单车事故三类。
2.1.2事故原因分布
大量统计分析结果表明,人的因素是导致高速公路交通事故的最主要原因,有75.51%的事故是由机动车违法导致的;此外,由于驾驶人操作不当导致的事故占事故总数的 14.81%。令人意外的是,行人违法上道路行驶导致了 717 起事故,占到了事故总数的 8.03%。这充分说明我国交通参与者的安全意识严重缺乏和对交通参与者进行安全教育的必要性。
2.2 高速公路交通事故驾驶人驾龄分布
驾龄在一定程度上能够反映驾驶人的驾驶经验和水平。但是实际上我国存在大量驾驶证驾龄很长而实际驾龄严重不足的驾驶人。因此,仅以驾龄指标研究驾驶经验与交通事故间的关系很难得到精确的结果。
2.3高速公路交通事故环境特征分布
2.3.1时间分布
很多统计分析结果表明,高速公路交通事故发生时间无明显的时段特征,夜间(18 时-6 时)事故率高于白天(6 时-18 时)。
2.3.2天气条件分布
在对行车不利的天气条件(非晴)下,高速公路交通事故比例占事故总数的 38.57%,远于全年不良天气的比例。
期刊文章分类查询,尽在期刊图书馆
3高速公路交通事故数据预处理
3.1数据预处理
数据预处理就是把原始的数据加工成可操作的形式,包括数据清洗、数据变换、维规约等。数据预处理是数据挖掘中必不可少的环节。真实的数据可能包含了大量的缺失值,也可能由于人工录入错误而导致异常点存在,这对模型算法的训练非常不利,造成计算资源的大量浪费。不仅如此,由于数据挖掘的对象多为抽象数据,如果不对数据进行预处理,则可能导致从毫不相关的数据项间挖掘出规律,而这样的数据挖掘是没有任何意义的。
3.2数据清洗
我国的基层交警在处理道路交通事故时,各类数据的采集主要依靠人工的手段来完成,不可避免的导致数据的缺失和异常等。遗漏数据值填补、噪声数据平滑、异常值的识别和去除、不一致问题解决等是数据清洗的主要工作。针对高速公路交通事故数据中的缺失、异常值,主要采用下列方法处理。
3.2.1缺失值处理
(1)删除记录。对于属性缺失严重的高速公路交通事故数据,可以直接将其排除在数据挖掘的对象之外。
(2)利用缺省值填补缺失值。即通过采用均值、中位数、众数等对一个属性的所有遗漏值进行填补。例如,当事故数据中的“天气”属性出现缺失时,我们可采用该属性的众数“晴天”来填补,因为高速公路交通事故发生在晴天的概率超过 60%。
(3)利用最有可能的值填补缺失值。可以根据数据中的其他属性值来推理缺失值,连续型数据可以通过回归分析推断最有可能的取值。缺失值如果无法通过推理得出,则考虑删除记录或利用缺省值填补。
3.2.2异常值处理
(1)删除记录。对于属性存在明显异常的高速公路交通事故数据,可直接将其排除在数据挖掘的对象之外。
(2)将异常值视为缺失值,并采用缺失值处理方法进行处理。
(3)平均值修正。当属性为连续型的数据出现缺失时,可用该属性值在其他所有事故数据中的均值来填补;当属性为离散性的数据出现缺失时,可用该属性值在其他所有事故数据中的中位数或众数来填补。
(4)不作处理。
3.3数据变换与降维
事故数据具有多维度、离散性和模糊性等特征,分析难度极大。通过数据变换,可将高速公路交通事故数据转换、归并成适合数据挖掘的描述形式。数据降维用于减少所考虑的随机变量或属性的个数,降低无效属性对建模的影响,提高建模的准确性和速度。
参考文献:
[1]傅 以 诺,顾 方 平.道 路 交 通 事 故 致 因 理 论 概 要[J].道 路 交 通 与 安全,2010,10(03):45-46.
[2]折欣.道路交通事故致因分析方法研究[D].上海:同济大学,2008.
[3]Xi J,Zhao Z,Li W,et al.A Traffic Accident Causation Analysis Method Based on AHP-Apriori[J].Procedia Engineering,2016,137:680-687.
[4]Shawky A M,Kishta M,Al-Harthi H A:Investigating Factors Affecting the Occurrence and Severity of Rear-End Crashes,Ulengin F,Li K,Boltze M,editor,World Conference on Transport Research - Wctr 2016,Amsterdam:Elsevier Science Bv,2017:2103-2112.
作者简介:赵永斌,男,1980.11—,本科,工程师 联系电话:15004643246
论文作者:赵永斌1
论文发表刊物:《基层建设》2019年第16期
论文发表时间:2019/9/2
标签:事故论文; 交通事故论文; 数据论文; 公路论文; 缺失论文; 驾驶人论文; 属性论文; 《基层建设》2019年第16期论文;