Brooklyn, viernes a las 3 de la tarde, delincuentes en acción. Big data dixit
Una ciudad: Nueva York; un problema: la criminalidad. ¿Cómo atajarla? ¿Dónde y cuándo se da más? ¿Están bien situados los policías para disuadir a los ladrones? Gracias al big data, el ayuntamiento ya sabe que Brooklyn es el distrito con mayor índice de crímenes, que estos se dan normalmente entre las 3:00 pm y las 7:00 pm, con una tasa más baja en enero (quizás debido a las vacaciones de Navidad); que en su mayoría son robos a pequeña escala, con mayor frecuencia los viernes, cuando también hay una mayor concentración cerca de los bancos, donde suceden cuatro veces más de delitos.
Para conseguir toda esta información, el Ayuntamiento de Nueva York (que representa la décima ciudad más peligrosa del mundo en 2010 según el Instituto de Seguridad Mundial) y la firma española Synergic Partners, consultora parte de la unidad de LUCA del grupo Telefónica, han integrado datos de la propia policía (denuncias), del padrón (capacidad adquisitiva, niveles de desempleo, etc.), noticias de incidentes obtenidos del New York Times, cotización bursátil, eventos programados para la ciudad e incluso datos meteorológicos.
En total, se han estudiado 78 variables y 4,2 Tb de información. «Hemos alcanzado un promedio de precisión del 72%, con respecto al tiempo que ocurrirá un crimen, así como la identificación de falsas amenazas», explica Santiago González, director de Innovación de Synergic
SIGUIENTE OBJETIVO: LOS ASESINATOS EN SERIE
Estas cifras muestran un potencial importante, sobre todo, con información real. Además, la idea para los próximos meses es profundizar en los datos, enfocando las áreas a cubrir en barrios e incluso bloques residenciales, con el análisis de más de 200 variables incluyendo los instantes de asesinatos reales para poder detectar mejor los asesinatos en serie.
He aquí un ejemplo más de cómo el big data puede mejorar el mundo al ayudar a predecir sucesos y facilitar así la toma de decisiones ante, por ejemplo, catástrofes naturales, expansión de epidemias, contaminación, productividad agrícola, diagnósticos médicos…