Big Data e Inteligencia Artificial
¿A qué se llama Big Data?
Big Data no es un término nuevo ya que tiene su origen en 1997 pero es ahora cuando se escucha con mayor frecuencia.
El concepto Big Data se refiere a un grupo de datos ingentes y complejos, así como a las técnicas de procedimiento específicas de gran volumen de información. Debemos considerar que no es una tecnología específica, sino que está asociada a otras tecnologías para desarrollarse, por ejemplo el Machine Learning (aprendizaje automático).
¿Por qué utilizar Big Data?
El Big Data es una vía efectiva para que una empresa puede aprovechar los datos que se generan día a día para favorecer a la toma de decisiones e impactar en su enorme crecimiento.
Es más, el Big Data no es solo utilizado por las empresas, también por organizaciones no gubernamentales, gobiernos y un sinfín de instituciones.
¿Dónde se utiliza?
Prevenir posibles fraudes, Identificar nuevas oportunidades, Detectar procesos en los cuales se pueden reducir costes, Tomar decisiones más acertadas, Satisfacer las necesidades de los clientes.
El uso del Big Data está en todos lados: las fotos que se comparten en redes sociales, las publicaciones en LinkedIn, nuestros mensajes por WhatsApp.
Aunque no se crea, el Big Data está en muchas de las tecnologías con las que convivimos a diario.
Big Data es el proceso de recolectar grandes cantidades de datos, poder gestionarlos y analizarlos de forma inteligente para descubrir nuevos planes de mejora y optimización de negocio.
La proporción de los datos no es lo fundamental, lo realmente importante es lo que las organizaciones hacen con esos datos.
La información de los "Datos Estructurados", se encuentra en la mayoría de las bases de datos relacionales (RDBMS).
Las 4 V's del BIG DATA
No es suficiente tener solo los datos que se recopilan por la actividad interna de la propia empresa. Se usan datos que provienen de las redes sociales, de las interacciones con los usuarios y datos de creación automática por parte de procesos informatizados.
2. Variedad
Recomendado por LinkedIn
Los datos no poseen un formato único ni provienen de una sola fuente, sino que puede tratarse de imágenes, correos electrónicos y vídeos, entre otros. La diversidad en los datos es muy importante para cubrir un rango amplio de casuísticas.
3. Velocidad
El proceso debe ser ágil y rápidamente transitable en cuanto a las diferentes fases que van desde la recopilación de datos al retorno del análisis; se debe tener la capacidad de analizar datos en tiempo real.
4. Veracidad
Esta característica se enfoca en poder discernir lo que es ruido de lo que puede avalar la consecución de los objetivos. Se deben evitar el ruido y los sesgos para poder obtener un análisis fiable.
Para poder otorgarles sentido a todos los datos se necesita comprender su composición y conocer los diversos procedimientos estadísticos para conceptualizar y promediar métricas que nos sean útiles para la toma de decisiones.
No existe una tecnología única que englobe la analítica del Big Data.
Estas son las principales técnicas que se utilizan en dicha analítica:
Algoritmos genéticos
"Machine Learning"
Análisis de regresión
Análisis de sentimientos
Análisis en redes sociales
Árboles de categorización
Minería de datos
El big data integra conjuntos de datos tan grandes o tan complejos que los métodos tradicionales de almacenar, acceder y analizar información son, por el momento, demasiado caros. No obstante, hay un enorme valor oculto en estos datos, por lo que las organizaciones están ansiosas por aprovecharlo para impulsar su innovación y ventajas competitivas.