Big Data e Inteligencia Artificial
Tecnologías Habilitadoras Digitales

Big Data e Inteligencia Artificial

¿A qué se llama Big Data?

Big Data no es un término nuevo ya que tiene su origen en 1997 pero es ahora cuando se escucha con mayor frecuencia.

El concepto Big Data se refiere a un grupo de datos ingentes y complejos, así como a las técnicas de procedimiento específicas de gran volumen de información. Debemos considerar que no es una tecnología específica, sino que está asociada a otras tecnologías para desarrollarse, por ejemplo el Machine Learning (aprendizaje automático).

¿Por qué utilizar Big Data?

El Big Data es una vía efectiva para que una empresa puede aprovechar los datos que se generan día a día para favorecer a la toma de decisiones e impactar en su enorme crecimiento.

Es más, el Big Data no es solo utilizado por las empresas, también por organizaciones no gubernamentales, gobiernos y un sinfín de instituciones.

¿Dónde se utiliza?

Prevenir posibles fraudes, Identificar nuevas oportunidades, Detectar procesos en los cuales se pueden reducir costes, Tomar decisiones más acertadas, Satisfacer las necesidades de los clientes.

El uso del Big Data está en todos lados: las fotos que se comparten en redes sociales, las publicaciones en LinkedIn, nuestros mensajes por WhatsApp.

Aunque no se crea, el Big Data está en muchas de las tecnologías con las que convivimos a diario.

Big Data es el proceso de recolectar grandes cantidades de datos, poder gestionarlos y analizarlos de forma inteligente para descubrir nuevos planes de mejora y optimización de negocio. 

La proporción de los datos no es lo fundamental, lo realmente importante es lo que las organizaciones hacen con esos datos.

La información de los "Datos Estructurados", se encuentra en la mayoría de las bases de datos relacionales (RDBMS).

No hay texto alternativo para esta imagen
RDBMS (Relational Database Management System) Sistema de Gestión de Bases de Datos Relacionales

Las 4 V's del BIG DATA

  1. Volumen

No es suficiente tener solo los datos que se recopilan por la actividad interna de la propia empresa. Se usan datos que provienen de las redes sociales, de las interacciones con los usuarios y datos de creación automática por parte de procesos informatizados.

2. Variedad

Los datos no poseen un formato único ni provienen de una sola fuente, sino que puede tratarse de imágenes, correos electrónicos y vídeos, entre otros. La diversidad en los datos es muy importante para cubrir un rango amplio de casuísticas. 

3. Velocidad

El proceso debe ser ágil y rápidamente transitable en cuanto a las diferentes fases que van desde la recopilación de datos al retorno del análisis; se debe tener la capacidad de analizar datos en tiempo real.

4. Veracidad

Esta característica se enfoca en poder discernir lo que es ruido de lo que puede avalar la consecución de los objetivos. Se deben evitar el ruido y los sesgos para poder obtener un análisis fiable.

No hay texto alternativo para esta imagen
Se realizan más de 40.000 búsquedas en Google por segundo

Para poder otorgarles sentido a todos los datos se necesita comprender su composición y conocer los diversos procedimientos estadísticos para conceptualizar y promediar métricas que nos sean útiles para la toma de decisiones. 

No existe una tecnología única que englobe la analítica del Big Data.

Estas son las principales técnicas que se utilizan en dicha analítica:

Algoritmos genéticos

"Machine Learning"

Análisis de regresión

Análisis de sentimientos

Análisis en redes sociales

Árboles de categorización

Minería de datos

El big data integra conjuntos de datos tan grandes o tan complejos que los métodos tradicionales de almacenar, acceder y analizar información son, por el momento, demasiado caros. No obstante, hay un enorme valor oculto en estos datos, por lo que las organizaciones están ansiosas por aprovecharlo para impulsar su innovación y ventajas competitivas.

Inicia sesión para ver o añadir un comentario.

Más artículos de Domy Navarro

Otros usuarios han visto

Ver temas