El Data Warehouse moderno - Parte II
En la primer parte (El Data Warehouse moderno - Parte I) repasamos los problemas habituales que tiene el data warehouse tradicional. Ahora veamos cuales son los requisitos y las ventajas que puede aportar una plataforma de datos moderna.
¿Por qué es tan importante la modernización del data warehouse?
- Muchas empresas están motivadas para estar más orientadas a los datos, por lo que tienen hechos cuantificados y pueden ser guiados por análisis. A su vez, estas capacidades hacen contribuciones importantes para lograr objetivos empresariales innovadores, como la empresa digital y la transformación empresarial. Hacer que todo funcione requiere un data warehouse totalmente modernizado.
- La innovación empresarial requiere datos más grandes y mejores. Esto es especialmente evidente en las prácticas emergentes para análisis avanzados (basados en data mining, clustering, estadísticas, machine learning, etc.) y acceso self-service a los datos (para descubrimiento de datos, preparación, visualización, etc.). Los data warehouses están bajo presión para proporcionar los datos voluminosos y estructuralmente diversos que se requieren de estas prácticas innovadoras. La necesidad comercial de nuevos análisis es el motor más fuerte para la modernización del data warehouse.
- Los diseños de data warehouse históricos necesitan una actualización seria. El data warehouse promedio de hoy fue diseñado por usuarios técnicos para suministrar datos para informes y dashboards. Este tipo de diseño sigue siendo relevante porque la mayoría de las empresas todavía necesitan esos casos de uso. Sin embargo, el data warehouse tradicional orientado a informes no es adecuado para el análisis avanzado, el self-service y las nuevas fuentes de datos que demandan las prácticas comerciales actuales. Por lo tanto, muchos diseños de data warehouse existentes deben modernizarse, aumentarse y optimizarse para satisfacer los requisitos de ayer y de hoy. Además, los usuarios que diseñan un nuevo data warehouse deben tener en cuenta los antiguos y nuevos conjuntos de requisitos.
- Los usuarios técnicos necesitan repensar sus opciones de plataforma. Existe una larga tradición de usuarios que eligen un sistema de administración de bases de datos relacionales (RDBMS) como la principal o única plataforma de datos para un data warehouse. El problema es que el RDBMS local tiene limitaciones en velocidad, escalamiento, agilidad, manejo de datos no estructurados y soporte de carga de trabajo analítico, además del alto costo.
Requisitos para un data warehouse moderno
- Debe permitir nuevas prácticas de negocio basadas en datos, especialmente aquellas para análisis avanzado y self-service
- Debe incorporar nuevas plataformas de datos (por ejemplo, bases de datos basadas en la nube, Hadoop o NoSQL), nuevas plataformas informáticas (nubes y clústeres) y nuevas estructuras de datos de nuevas fuentes (web, redes sociales e Internet of Things (IoT))
- Las herramientas que acompañan al data warehouse (para análisis, informes e integración) deben ser igualmente modernas, ya que las herramientas se han creado o actualizado para soportar profundamente todas las nuevas prácticas de negocio basadas en datos, plataformas de datos y tipos de datos mencionadas anteriormente.
Ventajas del data warehouse en la nube
Estos son algunos de los beneficios de la nube:
- Es rentable: la informática en la nube proporciona un modelo de precios de pago por uso o basado en el consumo.
- Es escalable: con un par de clics se puede aumentar o disminuir los recursos y servicios en función de la demanda o la carga de trabajo. Admite el escalado vertical y horizontal. El escalado puede ser manual o automático según desencadenadores específicos.
- Es elástica: cuando la carga de trabajo cambia debido a un aumento o una disminución de la demanda, un sistema de informática en la nube puede compensarlo mediante la incorporación o la retirada automática de recursos.
- Es actual: el uso de la nube permite eliminar las cargas de mantenimiento de las revisiones de software, el programa de instalación de hardware, las actualizaciones y otras tareas de administración de TI. Todo esto se realiza de forma automática para garantizar que use las herramientas más recientes y adecuadas para dirigir su negocio. Además, el proveedor de nube se encarga del mantenimiento y la actualización del hardware del equipo.
- Es confiable: los proveedores de informática en la nube ofrecen servicios de copia de seguridad, recuperación ante desastres y replicación de datos para garantizar que los datos estén siempre seguros. Además, a menudo se integra redundancia en la arquitectura de los servicios en la nube.
- Es global: puede replicar los servicios en diferentes regiones para ofrecer redundancia y localidad, o seleccionar una región específica para garantizar que cumple las leyes de residencia de datos y de cumplimiento para los clientes.
- Es segura: los proveedores de servicios en la nube ofrecen un amplio conjunto de directivas, tecnologías, controles y habilidades técnicas expertas que pueden proporcionar más seguridad de la que la mayoría de las organizaciones pueden lograr por otros medios.
Además de estas ventajas, propias de la nube, un data warehouse en la nube también tiene estos beneficios:
- Admite cualquier fuente de datos (con o sin estructura).
- Proporciona información de dashboards analíticos en tiempo real.
- Soporta entornos de machine learning.