Ciclo de Vida de la Ciencia de Datos
A la hora de llevar a cabo un proceso de Análisis de Datos y Modelado, comúnmente empezamos preguntándonos ¿Qué modelo debo crear?, sin embargo debemos detenernos por un momento y tener en cuenta que hay una serie de etapas primarias y sumamente importantes previas al modelado.
Personalmente, sé que como buen perfil técnico hay gran entusiasmo por lanzarnos a codear, a probar los datos, los modelos y experimentar, sin embargo no podemos perder de vista que estos modelos tienen una finalidad más allá de obtener “un buen accuracy” o “una buena optimización” y es que estos modelos reflejan realidades de negocio y tienen implicaciones sobre personas reales, es por eso que a lo largo de este blog daremos una perspectiva de la importancia de cada una de las etapas que debemos abordar antes de empezar a hacer coding.
Hablemos del Ciclo de Vida de la Ciencia de Datos.
Microsoft propone el siguiente esquema como etapas para llevar a cabo el ciclo de vida de la ciencia de datos:
Etapas del Ciclo de Vida de la Ciencia de Datos:
Recomendado por LinkedIn
Algunos lugares donde se puede realizar el despliegue son:
Como se puede ver, el proceso de Ciencia de Datos implica una serie de etapas necesarias, que en ciertas ocasiones, no es necesario realizarlas todas, esto depende del proyecto, sin embargo son muy relevantes para que hagamos un trabajo adecuado.
Es importante resaltar que la parte esencial del ciclo, es el proceso, extracción y análisis de datos, del buen manejo de los datos, dependerá que nuestro modelo funcione adecuadamente y haga predicciones acertadas.
Existe una frase muy conocida en el sector que es «garbage in, garbage out». Es decir, si los datos son malos, las salidas son malas, por eso hay que tener en cuenta si los datos que estamos ingestando efectivamente funcionan para lo que estamos modelando. Pero esto lo dejaremos para otra edición de este blog, por lo pronto quedémonos con estas reflexiones.
Entendamos y conozcamos el negocio y/o business case para que nos permitirá saber con mayor rapidez, si nuestro modelo es el adecuado para solucionar el problema.
Consultor Senior Independiente - Socio fundador en GAMEZ&ARRIOLA ABOGADOS - Due Diligence -Contratos - Compliance - Licitaciones - Profesor On Line - Inversión Social - Procesos y Procedimientos- Control Documental
2 añosJulio Carrasquel, una de tus especialidades!