Nate Silver, matemático y estadístico trabajó en el equipo
de campaña de Obama en las pasadas elecciones de EEUU.
La fama de Nate Silver llegó tras concluir las elecciones y
haber conseguido predecir con asombrosa exactitud los resultados en cada uno de
los cincuenta estados del pais. Y todo
esto sin apenas conocer la política de su pais, aplicando estadística, análisis
de datos y encuestas.
El sistema fue criticado durante toda la campaña por prensa
y analistas políticos. Mientras expertos
vaticinaban una votación muy reñida, Silver hablaba de una probabilidad de
salir reelegido del 91%, en base a sus cálculos.
Para obtener estos resultados Silver aplicó un marco
poblacional igual a toda la población de los Estados Unidos, al que dividió en
subpoblaciones que representaban cada uno de los estados respectivamente.
Además el trabajo se dividió en dos grandes bloques.
Primero promedió una cantidad ingente de datos procedentes
de encuestas a las que se había dado peso en base a 3 factores: Tamaño de la
muestra, fecha de recogida y calidad de dato.
Cuanto más grande, más actual y más verídico, mayor importancia se le
daba.
Después estudió cada uno de los estados a votar, dando
importancia al número de delegados que aportaba cada estado, en vez de al
número de votantes.
Además, se tuvieron en cuenta para los estados factores como
participación histórica, ventaja del partido en el poder, factores
demográficos.
Todos estos datos,
para formar un modelo estadístico predictivo que unido a la capacidad de
proceso del software actual y un correcto análisis de los datos dio con unos
resultados asombrosamente precisos.
He aquí un reciente caso práctico en el que Estadística,
Minería de Datos y Big Data bien combinados son una excelente combinación para
obtener conocimiento donde antes solo había datos.
Os dejo el vídeo del New York Times donde Nate Silver explica su método.