¿Qué es un Data Science?
La Ciencia de los Datos (o en inglés Data Science) es un campo interdisciplinario que se encarga de la captura, procesamiento, análisis y representación de grandes cantidades de datos para extraer conocimiento y tener un mejor entendimiento de los grandes volúmenes de datos.
Anne Milgram y el sistema de justicia criminal de Estados Unidos
Esta la historia de Anne Milgram: Cuándo fue nombrada Fiscal General de Nueva Jersey en 2007 no habían datos que pudieran decir si las decisiones que se tomaban ayudaban o no a tener a la población más segura.
Ella, que no es informática, ni matemática, ni científica de datos, descubre una necesidad. Necesitaba saber a quienes se arrestaba, a quienes se acusaba y a quienes se encerraba. Puede parecer simple decir “a los malos”, pero los proyectos (todos) tienen un número limitado de recursos, y con ese “presupuesto” ella necesitaba obtener los mejores resultados. En ese momento no había una forma de cómo obtener esa información. Recuerden, la misión es tener a la población más segura con los recursos que se tienen.
Y ella decide introducir un estricto análisis estadístico. Quería ‘moneyball’ [optimizar] la justicia penal.
Moneyball: El libro de Michael Lewis “Moneyball, el arte de ganar un juego disparejo” cuenta el caso del equipo de beisbol de los Atléticos de Oakland. Como no tenían dinero para comprar jugadores de renombre, usaron un método de selección analítica que permitió crear un equipo ganador invirtiendo menos que el resto de los equipos de la liga. En otras palabras esto es optimizar el uso de los recursos, es “no comprar jugadores, sino comprar victorias”. Cada jugador vale “no por su precio en el mercado, sino que vale por su aportación al juego”. En la actualidad muchos equipos hacen eso.
La misma Anne Milgram lo dice: “moneyball, como muchos de Uds. saben, es lo que hicieron los entrenadores de Oakland, cuando utilizaron datos inteligentes y estadísticas para determinar cómo escoger jugadores que les ayudarían a ganar juegos, y pasaron de un sistema que se basaba en los reclutadores de béisbol que solían salir a observar jugadores y, en uso de su instinto y experiencia, de los instintos y experiencia de cada reclutador para escoger jugadores, a un sistema que utilizaba datos inteligentes y riguroso análisis estadístico para averiguar cómo escoger a los jugadores que les ayudarían a ganar juegos”.
Con un equipo de científicos de datos, investigadores y estadísticos se llegó a la conclusión de 9 factores de predicción de riesgo, que fueron puestos en un sistema sencillo que pueden usar los jueces y que permite conocer:
- Si alguien cometería o no de nuevo un crimen si fuera liberado.
- Si alguien cometerá un acto de violencia si fuera liberado.
- Predecir cuándo alguien volverá al juzgado.
Esto no sólo permite tener objetividad sino también es una referencia adicional antes de emitir un fallo en el juzgado: No se elimina el instinto o la experiencia, se les dá a los jueces una herramienta adicional.
Es increíble lo que puede hacer un equipo interdisciplinario con una necesidad bastante clara: Ayudar a que la población esté más segura. Creo que el resultado es claramente un éxito, sobre todo en Camden, que es la ciudad en New Jersey sobre la que estaba puesta toda la atención: Se redujeron los asesinatos en un 41% y todo el crimen en la ciudad en un 26%.
Te recomiendo no dejes de ver el vídeo de Anne Milgram en las charlas de TED.COM: Por qué las estadísticas inteligentes son la clave para combatir el crimen