Accidentes de tránsito en Fiestas Patrias

Accidentes de tránsito en Fiestas Patrias

¿Están sobrerepresentados en las noticias de Fiestas Patrias?

Overview

What was made: 

Analicé los datos de accidentes de tránsito proporcionados por CONASET con la idea de explorar si acaso se justifica la excesiva cobertura de los accidentes de tránsito en Fiestas Patrias.

Background and objectives: 

Busqué "fiestas patrias" en Google y encontré muchas noticias acerca de la mejor empanada y accidentes de tránsito. Lo primero que se me vino a la mente fue buscar datos para ver la tendencia de los accidentes en Fiestas Patrias. La idea de esto fue indagar mayormente y determinar si acaso era posible hacer una predicción de los accidentes de tránsito para el presente año, cosa que finalmente hice y presento en los resultados.

Outcome: 

Aprendí que septiembre no es el peor mes en cuanto al número de accidentes de tránsito y sus consecuencias y que además en los últimos años existe una preocupante tendencia al aumento en el número de accidentes, lesionados y víctimas fatales. Junto con ello la serie de accidentes de tránsito presenta un comportamiento no estacional, que se traduce en una predicción que resulta en un aumento de 6,5% en los accidentes esperados para septiembre de 2017 respecto del mismo mes del año anterior.

How it was made

Obtención y limpieza de datos
  • Los datos originales se encuentran disponibles en la página de CONASET.
  • Lo que hice fue llevar dichos datos a una estructura ordenada que se conoce como tidy data usando Google Sheets.
  • Si te interesan los datos ordenados puedes examinarlos en Google Sheets.
Feeling during this step: 
0
No
Importando los datos en R
  • Usé RStudio para analizar los datos y obtener gráficos de calidad aceptable.
  • Puedes consultar el código en Github.
Feeling during this step: 
0
No
Análisis exploratorio

Lo primero fue explorar los datos mes a mes para el año 2016:

datos_2016

Luego quise ajustar la escala para poder observar mejor las variaciones:

datos_2016_zoom

Claramente se observa que septiembre no fue el peor mes del año 2016, así que quise comparar con lo ocurrido en el año 2015 para detectar algún tipo de estacionalidad.

En mismo análisis para el año 2015 es el siguiente:

datos_2015datos_2015_zoom

Se puede observar que entre los dos años no existe un patrón que tienda a repetirse año a año. Debido a esto es que decidí comparar lo ocurrido en un mes del año 2016 respecto del mismo mes del año 2015.

La cantidad de accidentes por mes entre los años 2015 y 2016 es la siguiente:

comparacion_2015_2016

Se puede observar un aumento tomando cada mes de 2016 y comparando con el mes respectivo de 2015.

¿Qué tan importante es la variación a 12 meses? para ello obtuve los porcentajes de variación a 12 meses:

variacion_2015_2016

¡En porcentaje hubo un aumento importante! sin embargo, los porcentajes pueden resultar engañosos. Un mes puede haber tenido un accidente y luego dos accidentes al año siguiente lo que da un aumento de 100%, pero luego el mes siguiente puede haber tenido 50 accidentes y al año siguiente 55 lo que da un aumento de 10%.

Hasta este punto había detectado un aumento importante en magnitud y en porcentaje, así que me decidí a explorar la serie completa.

¿Qué nos dicen los promedios respecto de los meses del año? Para ello construí el gráfico de promedios mensuales:

promedio_por_mes

Podemos ver que, en promedio, septiembre se encuentra por debajo de diciembre y marzo.

¿Qué ocurre en perspectiva? ¿Existe un aumento consistente cada mes de septiembre? los datos indican que si y también indican que existe una tendencia al alza en la candidad de accidentes de tránsito.

tendencia_accidentes

Puede haber varias causas que explican esto. Una razón plausible es el aumento del parque automotriz, tal como señala El Mercurio, lo que sigue la tendencia mundial y de los Estados Unidos. 

Dos preguntas que consideré interesantes luego de ver la tendencia en cantidad de accidentes son:

  • ¿Cómo cambia la cantidad de fallecidos?
  • ¿Cómo cambia la cantidad de lesionados?

Para responder aquello construí dos gráficos:

tendencia_fallecidostendencia_lesionados

 

 

Feeling during this step: 
0
No
Inferencia

Para analizar lo anterior con más detalle preferí hacer una exploración de series de tiempo. Descarté otros análisis como estudiar la correlación para poder hacer inferencia (o predicciones) acerca del número de accidentes que podemos esperar en el presente mes.

Lo primero fue intentar graficar la tendencia de la serie usando promedios móviles:

media_movil_accidentes_3m

Luego descompuse la serie para ver la tendencia y la estacionalidad de la serie:

descomposicion_serie

Este último paso es importante. Gráficamente sugiere que la tendencia de la serie es predominante y que la estacionalidad muestra un caracter cíclico. Para hacer un buen análisis no basta con esto, hay que testear estadísticamente si acaso la serie es estacionaria o no.

Un análisis estadístico básico (prueba de Dickey-Fuller) sugiere que se rechaza la hipótesis de que la serie es estacionaria. En términos simples, esto quiere decir que la serie no presenta un caracter constante, por lo que el efecto de la tendencia hará que los promedios y la volatilidad que se pueden extraer no son constantes en el tiempo.

De entre muchos métodos para predecir qué ocurrirá con el número de accidentes en el año 2017, mi elección fue un modelo ARIMA (Autoregressive Integrated Moving Average model) el cual entrega la siguiente predicción:

prediccion_accidentes 

Acotando la serie para observar con mayor detalle la predicción para 2017 se tiene lo siguiente:

prediccion_accidentes_2

Se esperán alrededor de 7755 accidentes para el presente mes de septiembre, magnitud que puede variar entre 6628 y 8880 con un 95% de confianza.

Feeling during this step: 
0
No
Conclusiones
  • La cobertura de accidentes de tránsito en fiestas patrias está sobrerepresentada.
  • Entre las causas del aumento que pude encontrar en la prensa se cuentan el aumento del parque automotriz y la conducción imprudente. Antes de sacar conclusiones apresuradas se debería analizar el impacto de cambios en la regulación (e.g. Ley Emilia) y en el control por parte de las autoridades. Estos aspectos no forman parte del análisis de esta nota, pero es razonable analizar el impacto de estas medidas en base a datos y no a creencias.
  • En este estudio, bastante preliminar, podemos inferir que de no haber un cambio importante en la conducción, se mantendrá una tendencia creciente en el número de accidentes de tránsito.
  • Aunque nuestra predicción es bastante poco precisa, podemos esperar que este mes tendrá una elevada cantidad de accidentes, alrededor de 7755 accidentes, magnitud que puede variar entre 6628 y 8880 con un 95% de confianza.
  • Esta predicción supone un aumento de 6,5% respecto de los accidentes registrados en septiembre de 2016.
  • No existe una relación observable que indique que el mes de septiembre concentra los accidentes automovílisticos ocurridos durante el transcurso del año.
Feeling during this step: 
0
No