Data Science y Elecciones 2019

Data Science y Elecciones 2019

Con la politóloga Natalia Esquenazi siempre hablamos de la necesidad de tener metodologías y análisis que garanticen resultados. Es así que desde hace un tiempo decidimos llamar el área que co-coordinamos en la empresa Sicchar como Data Science y no simplemente Big Data. Nuestra decisión estuvo guiada por la práctica cotidiana de nuestro quehacer, en el que poco a poco fuimos observando cómo nuestros clientes estaban dominados por el mito de que más datos es mejor sin observar las circunstancias metodológicas o de análisis que acompañan a esos datos. Big Data, en efecto, significa más datos. En cambio Data Science, como ciencia de datos, intenta despegarse de la estadística para remarcar que la cantidad de datos desprendidos de un fenómeno es importante pero va en conjunción con un respaldo metodológico y analítico que la acompañe.

Para dejarlo claro a través de ejemplos: En 1936 la revista Literary Digest se propuso llevar a cabo la mayor encuesta que se hubiera hecho jamás en territorio estadounidense para saber si el candidato demócrata Roosevelt renovaría su mandato o sería derrotado por el republicano Landon. Lo hizo a través de la consulta en su propia revista y logró recabar cerca de 2 millones de encuestas finalizadas. Para que puedan darse una idea de tamaña muestra, las encuestas actuales para una población de 40 millones de personas (la población estadounidense en aquella época) tomarían una muestra de 1000 personas con un error estimado del 3,1 por ciento. La cantidad de datos relevados por la revista, estimaba un error de sólo un 0,06 por ciento. Pequeñísimo en términos de cantidad. Daban, además, como ganador al candidato republicano por más del 57 por ciento de los votos. Sin embargo, como ya sabemos, Roosevelt ganó las elecciones más del 62% de los votos. ¿Qué pasó?

Un ejemplo más actual nos trae la actualidad argentina. El mercado financiero estuvo en alza el día viernes y los bonos argentinos aumentaron en el mercado internacional ante un posible triunfo de Macri o una diferencia muy pequeña entre los dos candidatos. Diferentes encuestas y lecturas respaldaban este entusiasmo, de la que sólo tomaremos el ejemplo de Bullmarket Brokers, que elaboró un informe pronosticando el triunfo del macrismo tomando un indicador y un análisis sencillo. Se basó en cantidad de búsquedas en Google de los dos principales candidatos y Cristina Kirchner, comparándolo con las búsquedas en Google de Bush y Kerry en 2004, Barack Obama y McCain en 2008, Obama y Rommey en 2012, y Trump y Hillary en 2016. En todos estos casos, el candidato con más búsquedas en la plataforma de internet había resultado ganador. Esto lo llevó a pronosticar que este hecho podría repetirse en las elecciones de este domingo. ¿Qué pasó?


En el primer caso la revista actuó bajo la premisa de que más es mejor. Un joven analista, George Gallup, predijo en ese momento con una muestra acorde a las actuales, el error de la revista. La revista no había seguido una metodología de toma de datos que garantizara que la muestra fuese representativa. En este caso lo que falló fue lo metodológico.

En el segundo caso, podemos decir que Bullmarket Brokers siguió un análisis simple, que podría haber dado resultados si hubiera realizado un análisis más integral. Desde nuestro equipo se realizó el mismo análisis, pero se integraron también otras variables para realizarlo.

No hay texto alternativo para esta imagen
No hay texto alternativo para esta imagen

Tal como se observa en el gráfico, Macri es quien más interés despertó en la población en estos últimos doce meses y eso se ha mantenido más o menos estable. Lo que nosotros analizamos también y que nos llevó a otras conclusiones fueron los términos de búsqueda a los que habían estado asociados cada uno de los candidatos. Mientras que Cristina Fernández de Kirchner había estado asociada a búsquedas relacionadas con la presentación de su libro, Mauricio Macri había estado asociado a memes y burlas por su gestión. De más está decir que las dos asociaciones tienen un carácter cultural contrario. Mientras que un libro está asociado a la posibilidad de transmitir la propia visión de quien lo escribe y al convencimiento que eso ocasiona en las audiencias a las que va dirigida, los memes son instrumentos de difusión cultural generalmente hecho para reírse de algo.

La diferencia significativa en este punto era abismal, y nos motivó a movernos con cautela y transmitirlo en estos términos a nuestros clientes.

Más datos no son nada sin una metodología adecuada y sin un análisis que pueda ser verdaderamente integrador. Lo significativo, en estos tiempos que corren, es poder brindar una triangulación que además de inteligente sea certera y para eso más datos son necesarios, pero no suficientes.

Inicia sesión para ver o añadir un comentario.

Otros usuarios han visto

Ver temas