大数据分析什么地方容易发生严重交通事故?

推荐会员: tutu 所属分类: 案例分析,行业精选 发布时间: 2016-09-27 11:01
我们利用了今年上海开放数据创新应用大赛(SODA)初赛提供的2014.10.1-2015.4.9的交通事故样例数据,将交通事故发生的地点落在地图上,结合空间算法和文本识别,统计出每条道路上发生的事故数量,绘制出了这张“上海交通事故”地图。
在图上,红色的点表示事故发生地点;蓝色线条代表道路,颜色越深、线条越粗,说明该条道路上发生的交通事故数量越多;橙黄色区域为根据事故点热力识别出的事故高发地区。

如上图所示,事故高发路段主要是由市中心向外延伸的若干主要道路和环城快速路,如沪杭高速、沪金高速、沪渝高速、申嘉湖高速、外环高速、浦星公路、沈海高速等,而市中心道路则相对较少。
而从高发地区上看,则呈现为一条穿过市中心的、东北-西南走向的连绵带状区域,如宝山杨行码头附近-四川北路区域-松江老城,另外在宝山、松江沪杭高速沿线、沪金高速沿线和外高桥多有分布。而浦西地区的高发地区明显比浦东更加蔓延和密集。
我们不妨总结一下,容易发生事故的地区都有什么特点?
我们选出了16个事故最为高发的地区,并收集和统计了关于这些地区的各种指标,包括:
*事故密度(单位面积事故数量)
*区域面积
*路网密度(单位面积土地上的道路长度)
*早高峰出行量密度(工作日7-9点的单位面积出行量)
*事故发生地与交叉口的距离
*工作日事故数量占全部事故数量的比例
*白天(早7点到晚8点)事故数量占全部事故数量的比例
这些指标中,有些是对事故发生情况的客观描述,对事故发生率并无直接贡献,但可能有助于我们对事故发生的原因进行推测。
这16个事故高发地区落在地图上长这样:

接下来,我们采用系统聚类法将16个事故高发路段分为了3类,情况结果如下图所示(“红-白-蓝”的渐变分别代表指标相对值的“高-中-低”;表中数值为归一化以后的结果,非绝对数值):

分类后的空间地图大概长这样:

据此,我们可以大致总结一下事故易发地区的几个特征。
第一类事故高发地区:人多车多,路况复杂的中心城区。
这一类地区包括四川北路、甘泉路石泉路、鲁班路大木桥路等,多位于市中心。
从十六个事故高发区的特征来看,路网密度和出行量密度高,事故密度相应也较高。简单关联一下道路密度与事故率的关系,可以看到二者在0.01的水平上显著相关。绘制出散点图长这样:

如上图所示,路网密度越高的地区,事故密度也越高,说明二者间可能存在着某些关联。
这可能是因为路网越密,单位长度道路上的交叉口就越多,意味着行车速度变化越频繁和视线遮挡越多,因而交通事故率就愈高。
当然,如果只是道路密度高不足以诱发众多的交通事故。但当这些密密麻麻的道路上挤满了车的时候,情况就不同了。
事实上,道路拥挤程度(交通饱和度)与事故率的关系非常复杂。根据学者景天然的研究,当交通饱和度上升时,事故率先增后减,事故率在交通饱和度为0.7-0.8时达到峰值。换句话说,道路较为拥堵的时候最容易出事故,而车流较少和严重拥堵时则相对安全。

图片来源:景天然.城市道路条件与交通事故率的关系[J].同济大学学报,1992(20)3:335-340.
由于我们不掌握各条道路的交通饱和度数据,仅能探究单位密度的出行量与事故率之间的关系。先来看看上海哪些地方的出行量密度最高呢?

左上图是上海典型早高峰日的出行量密度分布图。如果我们将这张图与事故高发地点的图(右上)进行比较的话,会发现二者间有着一定程度的相似,如在中心城区密集和向外扩散的方向;但从细节而言,二者又有若干不同,如宝山地区的出行密度并不高,但事故率很高;浦东花木地区出行密度高,但事故率并不高。
总的来说,在我们的研究样本范围内,出行量密度与事故率在0.01的水平上具有显著相关性,绘制出散点图如下图所示:

换句话说,出行量密度越高的地区,发生交通事故的概率也越大。
当然,这个结论并不是绝对的。出行量密度只是影响交通事故率的众多因素之一。事实上,在许多路网密度和出行量密度都不算太高的郊区,同样可能有较高的事故率。
第二类事故高发地区:接驳轨交通勤,助动车盛行的近郊。
虽然从第一类地区上去看,出行量和道路密度与事故率有很高的相关性,但第二类地区则表现出完全不同的特性。
比如嘉定北、航中路西、闵行开发区、美兰湖等,该类地区在出行量和道路密度上都没有明显的,但其事故比例都很高。
这是为什么呢?我们不妨先来看看这些地区都位于上海的哪里。

没错,第二类事故高发区多位于郊区的轨交站点附近,有着大量与轨交接驳的需求,但该类地区的公交车和出租车均不够便利。
以美兰湖北地区为例,该地区的公交站点密度仅为2.6个/km2,远低于市中心四川北路宝山路的11.7个/km2,只有不到四分之一。

为了弥补这些地区公交不发达的缺陷,助动车和黑车大量出现在轨交站点周边。至于助动车、黑车跟事故的关系嘛,你懂的。
在第一、第二类以外,还有第三类地区。它们同样位于郊区,但却并不在轨交站点附近。
第三类事故高发地区:高速公路沿线和货运码头附近。
第三类事故高发区主要包括宝山杨行、外高桥、沪嘉高速北等地区。这些地区不仅位于比第二类地区更为偏远的郊区,而且往往在高速公路沿线或码头附近,担负着上海对外交通的重任。
当然,除了交通更偏远以外,这些地区有一个非常显著的特点:夜间事故率高。
是的,之前我们对于事故率的分析大部分集中在空间上,假如我们按照时间序列去判断的话,就可以发现:上海的交通事故量在全天时间段上的分布相对平稳(除了在中午12点有个明显的低谷)。

但是,我们所清楚的是:上海这座城市的出行量并不是每个小时恒定的,而是有明显的早晚高峰特征。那么,虽然事故发生的总量每个小时波动不大,但增加了出行量的时间分布后,我们会发现,事故发生几率的小时差异立刻就变得异常明显了,请看下图:

为什么夜间的事故率这么高呢?简单地说,夜间行车本来就有道路环境不够明亮、驾驶员状态下降等不利因素,而在高速公路和码头,夜间还有许多执行任务的货运汽车,使得这些地区的夜间事故率进一步提高了。
总结一下,上海容易发生交通事故的主要有以下三类地区:
1.人多车多、出行量大、路况复杂的中心城区;
2.接驳轨交通勤、助动车盛行的近郊;
3.高速公路沿线和货运码头附近。
因此,当我们在市中心闲逛的时候,尽量观察周边复杂的交通环境;当我们在郊区出了地铁站后,尽量小心飞驰而来的助动车;当我们需要前往货运车辆经常出没的地区时,尽量避免在后半夜出门……
当然,安全第一,小心总是很重要的。但事实上,根据上海市公安局交通警察总队提供的数据,上海2014全年有记录的交通事故只有1172起,跟全市304万辆注册机动车、3168万人次的中心城日均出行量相比,实在不算什么。
交通事故,毕竟是小概率事件。
城市和人生的道路上本就有各种风险,怎么能因为害怕风险就拒绝上路呢?
来源:城市数据团
关键词:

版权声明:本站原创和会员推荐转载文章,仅供学习交流使用,不会用于任何商业用途,转载本站文章请注明来源、原文链接和作者,否则产生的任何版权纠纷与本站无关,如果有文章侵犯到原作者的权益,请您与我们联系删除或者进行授权,联系邮箱:service@datagold.com.cn。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

This site uses Akismet to reduce spam. Learn how your comment data is processed.