Asignar nuevos usos a los datos para que las carreteras sean más seguras
seguridad
Generar conjuntos de datos integrados espacialmente basados en fuentes administrativas, privadas, de redes sociales y fuentes más tradicionales puede ayudar a allanar el camino para generar inversiones y políticas inteligentes y beneficiosas desde el punto de vista social.
Reducir la mortalidad en las carreteras a la mitad (Objetivo de Desarrollo Sostenible 3.6) podría salvar 675 000 vidas al año. Sin embargo, las inversiones nacionales en regulación, cumplimiento, educación e infraestructura necesarias para lograr esta ambiciosa meta con frecuencia son inalcanzables. Las limitaciones de recursos exigen que los países tomen decisiones inteligentes respecto de dónde y cómo invertir. Saber dónde y cuándo se producen los accidentes de tránsito puede ayudar a priorizar las inversiones en los lugares más importantes. Desafortunadamente, muchos de los países que afrontan estas difíciles decisiones cuentan con pocos datos sobre los accidentes de tránsito y carecen de la capacidad para analizar los datos que sí tienen. Los datos oficiales sobre los accidentes de tránsito solo reflejan el 56 % de las muertes en los países de ingreso bajo y mediano, en promedio.1
Existen informes sobre los accidentes de tránsito, pero están perdidos bajo pilas de papeles o son recopilados por operadores privados, en lugar de convertirse en datos útiles o divulgarse entre las personas que necesitan la información para tomar decisiones en materia de políticas. En Kenya, donde las cifras oficiales informan 4,5 veces menos la cantidad total de muertes,2 la rápida expansión de los teléfonos celulares y las redes sociales brindan la oportunidad de utilizar los informes sobre las condiciones de tránsito que publican las personas que viajan como una posible fuente de datos sobre los accidentes de tránsito.
La minería de macrodatos (big data), combinada con la digitalización de los registros impresos oficiales, ha demostrado la diversidad de formas en las que pueden utilizarse los datos para orientar el análisis de los espacios urbanos, la planificación y la gestión.3 Los investigadores trabajaron en estrecha colaboración con el servicio nacional de policía para digitalizar más de 10 000 informes de situación presentados entre 2013 y 2020 de 14 estaciones de policía en Nairobi para crear el primer conjunto de datos administrativo digital y geolocalizado de accidentes individuales en la ciudad. Combinaron datos administrativos con datos de fuentes colaborativas mediante una aplicación de software para dispositivos móviles y una plataforma de tráfico de servicio de mensajes cortos (SMS), Ma3Route, que tiene más de 1,1 millones de suscriptores en Kenya. Analizaron 870,000 tuits relacionados con el transporte enviados entre 2012 y 2020 para identificar y geolocalizar 36 428 informes de accidentes mediante la formulación y la mejora de los algoritmos de geoanálisis sintáctico y procesamiento del lenguaje natural.4
Para verificar la precisión de los informes de fuentes colaborativas y la eficiencia de los algoritmos, el equipo enviaba a una empresa de reparto en motocicletas al lugar del accidente informado minutos después de recibirse cada nuevo informe de accidente para preparar un subconjunto de informes. En el 92 % de los casos, se verificó que el accidente se había producido en la ubicación indicada o cerca de esta. Mediante la combinación de estas fuentes de datos, los investigadores pudieron identificar el 5 % de las carreteras (puntos negros de accidentes) donde se produce el 50 % de las muertes por accidentes de tránsito en la ciudad (mapa CD4.2.1).
Este ejercicio demuestra que abordar la escasez de datos puede transformar un problema inextricable en uno más manejable. En este caso, invertir en la seguridad de una red vial de 6200 kilómetros es inabordable. Digitalizar y analizar los datos administrativos y las variables sobre las lesiones y las muertes puede ayudar a acotar las ubicaciones y los momentos del día y la semana que se asocian con los accidentes más graves. El análisis ofrece una hoja de ruta invaluable para los esfuerzos futuros en materia de regulación, infraestructura y cumplimiento.
Se puede obtener más información mediante la integración de los datos existentes y la recopilación de más información, como datos de Uber y Waze sobre las velocidades promedio en tramos de carreteras y sobre obstáculos en la carretera; datos de Google Maps sobre el uso de la tierra, y datos climáticos sobre las condiciones de conducción. Los investigadores también invirtieron en una iniciativa de recopilación masiva de datos que consiste en el relevamiento de la infraestructura y la grabación en video y codificación del comportamiento de los usuarios de las carreteras en 200 puntos negros de accidentes en la ciudad. El análisis de estos nuevos datos generará hipótesis para optimizar la respuesta en materia de políticas al problema de la seguridad vial.
En general, elaborar conjuntos de datos espacialmente integrados que utilicen fuentes administrativas, de redes sociales, privadas y fuentes más tradicionales puede ayudar a cubrir las deficiencias en materia de datos y allanar el camino para generar inversiones y políticas inteligentes y beneficiosas desde el punto de vista social.
- Cálculos del equipo a cargo del Informe sobre el desarrollo mundial 2021 y de la Organización Mundial de la Salud, sobre la base de una comparación de las muertes informadas del Informe sobre la situación mundial de la seguridad vial de la OMS (OMS, 2018).
- OMS (2018).
- Milusheva y otros (2020).
- Los nuevos algoritmos se basan en el trabajo de Finkel, Grenager y Manning (2005); Gelernter y Balaji (2013), y Ritter y otros (2011).
- Finkel, Jenny Rose, Trond Grenager y Christopher Manning (2005), “Incorporating Non-local Information into Information Extraction Systems by Gibbs Sampling” (i), en 43rd Annual Meeting of the Association for Computational Linguistics: Proceedings of the Conference, editado por Kevin Knight, Hwee Tou Ng y Kemal Oflazer, 363-70, Asociación de Lingüística Computacional, New Brunswick, NJ.
- Gelernter, Judith y Shilpa Balaji (2013), “An Algorithm for Local Geoparsing of Microtext” (i), GeoInformatica 17 (4): 635-67.
- Milusheva, Sveta, Robert Marty, Guadalupe Bedoya, Elizabeth Resor, Sarah Williams y Arianna Legovini (2020), “Can Crowdsourcing Create the Missing Crash Data?” (i), en COMPASS ’20: Proceedings of the 3rd ACM SIGCAS Conference on Computing and Sustainable Societies, 305-06, Association for Computing Machinery, Nueva York.
- OMS (Organización Mundial de la Salud) (2018), Global Status Report on Road Safety 2018 (i), OMS, Ginebra.
- Ritter, Alan, Sam Clark, Mausam y Oren Willi Etzioni (2011), “Named Entity Recognition in Tweets: An Experimental Study”, en Conference on Empirical Methods in Natural Language Processing: Proceedings of the Conference, 1524-34, Asociación de Lingüística Computacional, Stroudsburg, PA.