Bases de datos ideales para Big Data

Bases de datos ideales para Big Data

Los tipos de bases de datos relacionales como Oracle, DB2 de IBM y SQL Server e incluso Microsoft Access, forman la columna vertebral para el almacenamiento de datos y la gestión en la mayoría de organizaciones de hoy en día.

Aunque estas bases de datos relacionales proporcionan una buena estructura y accesibilidad para la mayoría de los datos, también tienen limitaciones que han dado lugar a unos nuevos tipos de bases de datos que abordan necesidades más específicas para tratar con recursos de datos extremadamente grandes y complejos.

Big Data ha surgido como un concepto clave en IT en los últimos años. Se trata de un término que se puede aplicar a algunas características muy específicas relacionadas con escala y análisis de datos, y no es necesariamente algo que sólo puedan utilizar grandes empresas como Facebook y Google.

Organizaciones relativamente pequeñas también podrían obtener beneficios e ideas interesantes mediante análisis de estos conjuntos de datos. Empresas financieras interesadas en analizar el comportamiento del mercado de valores, o un departamento de policía con el objetivo de analizar y predecir las tendencias del crimen, por ejemplo, serían organizaciones que podrían beneficiarse mucho de la utilización de estos tipos de bases de datos.

Desarrollo de la Información

Han surgido cinco tipos principales de bases de datos NoSQL: columnares, documentales, gráficas, key-value y XML.

Vamos a ver cada uno de estos 5 tipos de bases de datos, viendo también el tipo de análisis de datos que encaja mejor con cada una de ellas.

Bases de datos columnares

Estas son las bases de datos NoSQL más parecidas a las convencionales bases de datos relacionales. Almacenan datos estructurados en columnas individuales (en lugar de tablas).

Estas bases de datos utilizan grupos de columnas. Funcionan bien para datos generados por máquinas, fuentes de datos estructuradas demasiado grandes para ser manejadas por un solo ordenador, y para consultas rápidas de datos.

Si estás pensando en análisis rápido y de precisión de datos-máquina, estas pueden ser los tipos de base de datos ideales. Apache Cassandra y Apache HBase son algunas de ellas.

Bases de datos documentales

Estos tipos de bases de datos se basan en el almacenamiento de documentos en lugar de datos estructurados.

Son buenas para datos no estructurados, como texto abierto de una carta o de un correo electrónico, y para datos semi-estructurados como documentos académicos.

Tendrás que fijarte en ellas si estás pensando en análisis de texto de documentos demasiado grandes para las bases de datos convencionales. Algunas de las más conocidas son MongoDB y Apache Couch DB.

Bases de datos gráficas

Estos tipos de bases de datos utilizan una estructura gráfica que es esencialmente un diagrama de las relaciones dentro de los datos, en lugar de tablas.

Son buenos motores de bases de datos para impulsar aplicaciones web que deban proporcionar información muy rápidamente, como las que se utilizan para las compras online y las plataformas de redes sociales.

Necesitarás mirar estos tipos de bases de datos si tu interés principal es una aplicación rápida, y puedes vivir con algunas aproximaciones en análisis.

Algunas de las más conocidas son Neo4J de Neo Technology’s y Microsoft Horton.

Key-Value

Estas están diseñadas para desarrollo simple y fácil de aplicaciones.

Son buenas para situaciones donde necesitas trabajar con aplicaciones que se puedan desarrollar rápidamente y donde todas las demás consideraciones son secundarias.

Algunas de las más conocidas son Basho Technologies’ Riak y Redis.

XML

Estos tipos de bases de datos utilizan el lenguaje XML, el cual es el lenguaje subyacente de la Web y de otros muchos sistemas de intercambio de información, para definir la estructura de datos.

Son buenas para la gestión de datos que no se puede obtener con cualquier otro tipo de bases de datos, y un buen partido cuando se tiene una gran cantidad de datos en formatos no tradicionales, como vídeo y audio.

Tendrás que mirar estos tipos de bases de datos cuando necesites profundizar en el análisis de datos no estructurados como analíticas de voz o de vídeo.

Algunos grandes nombres en estos tipos de bases de datos son Mark Logic y Sedna.

 

Conclusión

No debes adoptar ninguna nueva base datos sin consultar antes con todos los afectados por el cambio y después de investigar también las opciones de los diferentes tipos de bases de datos en profundidad. Porque mientras que una base de datos gráfica, por ejemplo, puede hacer que una aplicación web se ejecute muy rápido, también puede hacer que el análisis de datos serios sea inaceptablemente lento. Debes tener en cuenta todo este tipo de cosas para saber cual es la ideal para ti.

Utilizar tipos de bases de datos NoSQL en tu empresa ¿te puede ayudar en estos momentos? Puede que sí, pero también es posible que no. Saber qué hacen estos tipos de bases de datos y qué tipo de problemas pueden solucionar, te ayudará a saber cuando es el momento en que la respuesta a esa pregunta sea sí.

Inicia sesión para ver o añadir un comentario.

Otros usuarios han visto

Ver temas