Ciclo de Vida de la Ciencia de Datos

Frida Ruh

Especialista en IA | Prospectiva y futuros | Generando oportunidades para mujeres en STEM | Xoogler | Board Member

Fecha de publicación: 13 jun 2022

A la hora de llevar a cabo un proceso de Análisis de Datos y Modelado, comúnmente empezamos preguntándonos ¿Qué modelo debo crear?, sin embargo debemos detenernos por un momento y tener en cuenta que hay una serie de etapas primarias y sumamente importantes previas al modelado.

Personalmente, sé que como buen perfil técnico hay gran entusiasmo por lanzarnos a codear, a probar los datos, los modelos y experimentar, sin embargo no podemos perder de vista que estos modelos tienen una finalidad más allá de obtener “un buen accuracy” o “una buena optimización” y es que estos modelos reflejan realidades de negocio y tienen implicaciones sobre personas reales, es por eso que a lo largo de este blog daremos una perspectiva de la importancia de cada una de las etapas que debemos abordar antes de empezar a hacer coding.

Hablemos del Ciclo de Vida de la Ciencia de Datos.

Microsoft propone el siguiente esquema como etapas para llevar a cabo el ciclo de vida de la ciencia de datos:

No hay texto alternativo para esta imagen

Etapas del Ciclo de Vida de la Ciencia de Datos:

Entendimiento del Negocio: Es necesario conocer cuál es el problema y cómo funciona el negocio, la ciencia de datos no es solo algoritmos, es entender como los datos afectan nuestro negocio, cuáles son las implicaciones y las definiciones principales.
Carga y Análisis de los Datos: Localizar y extraer los datos para su uso es la segunda etapa, dentro de esto algunos procesos como la carga de los datos (estructurados y no estructurados), creación de un pipeline, levantar el entorno de trabajo (si fuese necesario), explorar, limpiar y transformar los datos.
Modelización: La modelización es la tercera etapa, implica probar modelos, medir su performance y una vez hecho esto seleccionar el modelo, entrenarlo y volver a evaluarlo, para asegurarnos que está funcionando correctamente.
Despliegue: Por último tenemos el despliegue del modelo a producción. Uno de los pasos más interesantes debido a que normalmente muchos de nosotros no llegamos hasta el despliegue, lo que hace que muchos de nuestros modelos se queden en un notebook viviendo en nuestra máquina. Este proceso es el que nos permitirá ver el performance de lo que hemos creado, así como la monitorización del modelo.

Recomendado por LinkedIn

Ingeniería de Datos. Mejorando nuestros ETLs y Data…

Alfredo Naime Hace 3 años

¿Cuáles son los tipos de metadatos más comunes en el…

Luis Arroyo Núñez Hace 1 año

Un nuevo paradigma de Inteligencia Artificial

Rafael García Leiva Hace 1 año

Algunos lugares donde se puede realizar el despliegue son:

Model Store.
Web Services como AWS, Azure, Google Cloud, IBM, entre otros.
Intelligent Applications.

Como se puede ver, el proceso de Ciencia de Datos implica una serie de etapas necesarias, que en ciertas ocasiones, no es necesario realizarlas todas, esto depende del proyecto, sin embargo son muy relevantes para que hagamos un trabajo adecuado.

Es importante resaltar que la parte esencial del ciclo, es el proceso, extracción y análisis de datos, del buen manejo de los datos, dependerá que nuestro modelo funcione adecuadamente y haga predicciones acertadas.

Existe una frase muy conocida en el sector que es «garbage in, garbage out». Es decir, si los datos son malos, las salidas son malas, por eso hay que tener en cuenta si los datos que estamos ingestando efectivamente funcionan para lo que estamos modelando. Pero esto lo dejaremos para otra edición de este blog, por lo pronto quedémonos con estas reflexiones.

Entendamos y conozcamos el negocio y/o business case para que nos permitirá saber con mayor rapidez, si nuestro modelo es el adecuado para solucionar el problema.

Weekly: AI The New Sexy

4662 seguidores

+ Suscribirse

Katiuska Gámez Arenas

Consultor Senior Independiente - Socio fundador en GAMEZ&ARRIOLA ABOGADOS - Due Diligence -Contratos - Compliance - Licitaciones - Profesor On Line - Inversión Social - Procesos y Procedimientos- Control Documental

2 años

Julio Carrasquel, una de tus especialidades!

Recomendar

Responder

Inicia sesión para ver o añadir un comentario.

Más artículos de Frida Ruh

El único consejo que SIEMPRE daré

16 nov 2024

El único consejo que SIEMPRE daré

Este post te va a hacer sonreír. Estoy seguro de ello porque el protagonista de este post (Capo) ya es mi mejor…

7 comentarios
Orquestación de Agentes de IA

12 nov 2024

Orquestación de Agentes de IA

🌐 ¿Qué es Swarm? Swarm es un framework que permite coordinar varios agentes de IA que trabajan de manera…

3 comentarios
30 cosas que he aprendido de la IA

12 oct 2024

30 cosas que he aprendido de la IA

1. Para saber si una herramienta de IA realmente funciona, ¡no te quedes con los titulares! Mejor pruébala tú mismo y…

2 comentarios
Observando el comportamiento de "humanos" a gran escala

24 sept 2024

Observando el comportamiento de "humanos" a gran escala

En el mundo dinámico de la Inteligencia Artificial, la capacidad de simular el comportamiento, las preferencias y la…

13 comentarios
¿Cómo lograr que la IA generativa aumente a los trabajadores en lugar de reemplazarlos?

20 sept 2024

¿Cómo lograr que la IA generativa aumente a los trabajadores en lugar de reemplazarlos?

Durante las últimas décadas, la difusión de tecnologías digitales ha incrementado significativamente la desigualdad de…
Nuevos Robots humanoides en el mercado

16 ago 2024

Nuevos Robots humanoides en el mercado

Cuando pensamos en la inteligencia artificial, a menudo nos imaginamos a un robot humanoide interactuando con personas…

1 comentario
Reescribiendo la Historia: Cómo enfrentar los sesgos de la IA

13 ago 2024

Reescribiendo la Historia: Cómo enfrentar los sesgos de la IA

Un área particularmente desafiante en el uso de la Inteligencia Artificial Generativa ha sido la generación de imágenes…

5 comentarios
Human-like AI Friends: ¿Nuestros Compañeros del Futuro?

6 ago 2024

Human-like AI Friends: ¿Nuestros Compañeros del Futuro?

Recientemente una tendencia ha comenzado a surgir con fuerza: los human-like AI Friends los cuales consisten en…

6 comentarios
Mejorando el Entrenamiento de IA con Datasets Sintéticos

11 jul 2024

Mejorando el Entrenamiento de IA con Datasets Sintéticos

En el mundo de la inteligencia artificial y el aprendizaje automático, la calidad y cantidad de los datos son…
¿Podemos simular a escala el comportamiento de los seres humanos?

13 mar 2024

¿Podemos simular a escala el comportamiento de los seres humanos?

Generative Agents: Interactive Simulacra of Human Behavior El vídeo explora el concepto de crear agentes generativos…

2 comentarios

See all articles

Ciclo de Vida de la Ciencia de Datos

Frida Ruh

Especialista en IA | Prospectiva y futuros | Generando oportunidades para mujeres en STEM | Xoogler | Board Member

Recomendado por LinkedIn

Weekly: AI The New Sexy

4662 seguidores

Más artículos de Frida Ruh

Otros usuarios han visto

¿Cómo desplegar modelos de ML?

¿Cuáles son algunas formas clave para automatizar y optimizar los procesos de ciencia de datos?

Business intelligence, la nueva era

Banca desplegando analítica en forma y tiempo adecuados. ¿Ingredientes?: ciencia de datos, big data, contenerización, y APIs

Las 4 fases del Big Data en la Gestión del Conocimiento para extraer Valor

La evolución del Data Scientist: De 2017 a 2024

Data Driven, Inteligencia en Datos

Inteligencia Artificial para la Planificación Financiera y Comercial

Notación Big O

Matemáticos o ingenieros: ¿quién resolverá el problema del BIG DATA?

Ver temas

Recomendado por LinkedIn

Weekly: AI The New Sexy

4662 seguidores

Más artículos de Frida Ruh

El único consejo que SIEMPRE daré

Orquestación de Agentes de IA

30 cosas que he aprendido de la IA

Observando el comportamiento de "humanos" a gran escala

¿Cómo lograr que la IA generativa aumente a los trabajadores en lugar de reemplazarlos?

Nuevos Robots humanoides en el mercado

Reescribiendo la Historia: Cómo enfrentar los sesgos de la IA

Human-like AI Friends: ¿Nuestros Compañeros del Futuro?

Mejorando el Entrenamiento de IA con Datasets Sintéticos

¿Podemos simular a escala el comportamiento de los seres humanos?

Otros usuarios han visto

¿Cómo desplegar modelos de ML?

¿Cuáles son algunas formas clave para automatizar y optimizar los procesos de ciencia de datos?

Business intelligence, la nueva era

Banca desplegando analítica en forma y tiempo adecuados. ¿Ingredientes?: ciencia de datos, big data, contenerización, y APIs

Las 4 fases del Big Data en la Gestión del Conocimiento para extraer Valor

La evolución del Data Scientist: De 2017 a 2024

Data Driven, Inteligencia en Datos

Inteligencia Artificial para la Planificación Financiera y Comercial

Notación Big O

Matemáticos o ingenieros: ¿quién resolverá el problema del BIG DATA?

Ver temas