Cómo aplicar KISS, YAGNI y DRY al mundo de DATA/AI
Los principios de desarrollo KISS, YAGNI y DRY no solo son válidos para el desarrollo de software moderno y ágil, sino que también son fundamentales cuando hablamos de soluciones en el ámbito de los datos e inteligencia artificial: ingeniería, machine learning y análisis de datos. Sin embargo, en este contexto, estos principios necesitan una pequeña "traducción" para adaptarse a los desafíos específicos del manejo de datos y la infraestructura que implica. Vamos a desmenuzarlos: 🔍
1. KISS (Keep It Simple, Stupid) 😎
Simplicidad. Ese mantra que todos repetimos, pero que a veces olvidamos cuando nos enfrentamos al diseño de pipelines o modelos. En data, KISS significa no perderse en complejidades innecesarias que puedan terminar en dolores de cabeza para el equipo. 💆♂️💆♀️
¿Cómo lo aplicamos?
Pero cuidado: la simplicidad no puede sacrificar escalabilidad. Un diseño súper simple como almacenar todo en CSV puede funcionar ahora, pero convertirse en un cuello de botella a medida que los datos crezcan. Pensá simple, pero con un ojo en el futuro.
Ejemplo de KISS: En lugar de un pipeline lleno de transformaciones intermedias innecesarias, implementá una estructura jerárquica como la clásica: Bronze-Silver-Gold 🥉🥈🥇 en data lakes. Así, el flujo de datos es simple, pero escalable.
2. YAGNI (You Aren’t Gonna Need It) 🛑
Este principio es oro cuando hablamos de diseño en data. A menudo, por miedo a quedarnos cortos, diseñamos pipelines o arquitecturas que están llenas de funcionalidades que nadie ha pedido... ni pedirá. 🤷♂️🤷♀️
¿Cómo lo aplicamos?
Pero cuidado: en data, YAGNI puede ser un arma de doble filo. ⚔️ Hay que evitar caer en la sobreoptimización temprana, pero también diseñar con una base que permita escalar o modificar sin tener que reconstruir todo desde cero.
Ejemplo de YAGNI: Si estás comenzando con reportes básicos, SQL o una herramienta de BI estándar puede ser suficiente. No necesitás un pipeline masivo con Spark y Kafka... aún. 🚀
3. DRY (Don’t Repeat Yourself) 🔁
Este principio es perfecto para mantener soluciones limpias y sostenibles. En el mundo de data, la duplicación de lógica o configuraciones no solo genera trabajo extra, sino que puede llevar a errores difíciles de rastrear. 🚨
¿Cómo lo aplicamos?
Recomendado por LinkedIn
Pero cuidado: DRY puede volverse un problema si se lleva al extremo. Abstraer demasiado en pipelines o modelos puede hacerlos difíciles de entender o modificar. Priorizá la reutilización cuando aporte claridad, no cuando complique. ✅
Ejemplo de DRY: Una función que centralice transformaciones comunes, como limpiar columnas o formatear fechas. 📅
Otros principios clave en data
Además de KISS, YAGNI y DRY, hay algunos enfoques adicionales que no pueden faltar:
Conclusión 🎯
Los principios de desarrollo clásicos como KISS, YAGNI y DRY son perfectamente aplicables al desarrollo de soluciones en el mundo de data. Sin embargo, requieren un toque especial para adaptarse a las peculiaridades del manejo de datos: desde la necesidad de escalar hasta la importancia de la trazabilidad. La clave está en mantener un equilibrio: simplicidad y eficiencia sin caer en la sobreingeniería. Recordá, en data, menos a menudo es más. 🤌
¿Qué opinás? 💬
¿Implementás estos principios en tu trabajo o proyecto?
Y si necesitas asesoría no dudes en mandarnos un mensaje
Podés encontrar más notas del mundo de la tecnología y los datos en nuestro blog.
Contacto