Los casos de uso más relevantes de análisis avanzado y ciencia de datos en 2020
Interesante artículo de la revista Analytics India Magazin, el cual detalla 5 problemas de negocio resueltos gracias a la ciencia de datos
La lista incluye una nota detallada sobre el proyecto en términos de problema de negocio resuelto, cómo se utilizaron el análisis y la ciencia de datos, por qué es relevante ahora y el impacto que creó para la empresa y los equipos de ciencia de datos en su conjunto.
1. Proyecto: Análisis de opiniones de clientes para crear productos centrados en el cliente de Ugam, una empresa de Merkle
Problema de negocio resuelto: Ayudar a un minorista omnicanal líder en Estados Unidos a hacer crecer su negocio de etiquetas privadas y competir mejor en un gran número de categorías.
Por qué relevante ahora: El auge de lo digital está cambiando el comportamiento de los consumidores. Además, la dura competencia y las presiones de los márgenes en un gran número de categorías han agravado la necesidad de comprender mejor las necesidades de los consumidores.
Enfoque y tecnologías aprovechadas: Utilizando una combinación de algoritmos de aprendizaje automático y experiencia humana, Ugam analizó los sentimientos de los clientes en varias fuentes de datos. Estas fuentes de datos incluyen revisiones de productos en el sitio web del minorista, revisiones de productos de sitios web de la competencia, datos de ventas internas, etc. Luego, aprovechando el procesamiento del lenguaje natural (NLP), los científicos de datos de Ugam extrajeron frases de palabras clave de las opiniones de los clientes, las agruparon en temas y las clasificaron como sentimientos positivos o negativos de los clientes. Estos productos fueron entonces validados, base que el minorista recibió con recomendaciones específicas tales como mejorar la eficacia operativa, añadir componentes de mejor calidad, garantizar una fácil instalación, etc. para los productos bajo demanda. Estas recomendaciones ayudaron a mejorar la calidad general del producto y a tomar decisiones informadas en torno a su comercialización.
Impacto: Un marco fácil de usar que identifica una lista de deseos del cliente de atributos de producto para crear productos centrados en el cliente. Además, el minorista se benefició de una disminución significativa de las tasas de retorno de productos.
"Trabajar en este proyecto dio exposición a un extenso caso de uso de PNL y también a comprender cómo se puede hacer el análisis de opiniones de los clientes para lograr la mejor experiencia para ellos. Tenemos que trabajar en un excelente equipo para dar vida a este caso de uso", dijo un científico de datos de Ugam que trabajó en el proyecto.
2. Proyecto: Next Best Action (NBA) para clasificar los tres mejores productos a nivel de cliente desde un ramo de un gran número de productos y servicios financieros de HDFC Bank
Problema de negocio resuelto: Aparte de las propensiones a nivel de producto que HDFC Bank ya tenía, el objetivo era identificar el orden de importancia para los productos a nivel de cliente que orquestan no sólo las propensiones, sino también la intención capturada a través de las respuestas de la campaña, las huellas digitales y el comportamiento web.
Por qué relevante ahora: La pandemia ha forzado restricciones en el lado de la demanda, así como en el lado de la oferta. La necesidad de ser relevante durante estos tiempos no se puede subrayar lo suficiente. A medida que se reduce el tamaño de la oportunidad, hay aún más necesidad de datos para afinar el mercado objetivo. Esto reduce ambas formas, incluidos los clientes para los que la oferta será relevante y excluyendo aquellos en los que será irrelevante y, lo que es más importante, perfeccionar la cesta de ofertas identificando el orden de importancia.
Enfoque y tecnologías aprovechadas: Las puntuaciones de propensión anteriores para varios productos se utilizaron en función de las transacciones de los clientes y los datos demográficos para la venta cruzada. A esto, la huella digital se superpuso, y se llevaron los comentarios de varios canales para identificar la intención a nivel de cliente. Además, emplearon un marco prescriptivo para capacitar a los canales de primera línea con información sobre el comportamiento del cliente y las posibles intervenciones. El modelo NBA se desarrolló aprovechando tecnologías de código abierto como Python (servidor local de 32 núcleos/512 GB ram para el procesamiento de datos) y PostgreSQL (servidor de base de datos de 16 núcleos /50 TB para almacenamiento y aprovisionamiento de datos). También utilizaron plataformas avanzadas de análisis basadas en IA para manejar big data, Natural Language Programming (NLP) para escuchar comentarios literales, algoritmos de ML para recomendaciones más nítidas, entre otros.
Impacto entregado: Esta es la primera solución de su tipo en el espacio bancario indio. Con esto, la comunicación no relevante se redujo al 30%, al tiempo que se hizo un aumento significativo de las tasas de participación.
"Desarrollar una solución de recomendación flexible basada en IA, adaptable al escenario de mercado que cambió rápidamente por COVID, fue bastante difícil. Tomamos conscientemente una llamada para pasar del enfoque algorítmico de la caja negra prevalente a un marco de IA explicable. Personalmente, el proyecto fue bastante enriquecedor para mí", dijo Krit Doshi, Científico de Datos, HDFC Bank.
"Los datos ahorran el día en HDFC Bank. Entendimos nuestra audiencia anteriormente, pero 2020 es diferente. Para adaptarnos al cambio, creamos capas de arbitraje adicionales sobre las propensiones individuales, para orquestar los comentarios capturados a través de los puntos de contacto del cliente y, en consecuencia, recomendamos los productos adecuados en orden de importancia", dijo Sahil Aneja, Científico de Datos de HDFC Bank.
3. Proyecto: Modelo equitativo de atribución multitáctil para la distribución de ingresos por Ugam, una empresa de Merkle
Problema de negocio resuelto: Ayudar a un banco Fortune 500 a medir y comprender la contribución de varios canales a su ROI de marketing entrante.
Por qué relevante ahora: Varias empresas están aprovechando el marketing omnicanal para impulsar experiencias de clientes fluidas y excelentes, más aún durante COVID-19. Al hacerlo, es necesario validar y optimizar la combinación de marketing, midiendo la contribución global de cada canal, creativos, etc. al ROI.
Enfoque y tecnologías aprovechadas: Ugam aprovechó Python para la ingesta, limpieza, preparación y procesamiento de datos. Además, se basó en Apache Hive en Cloudera Distributed Hadoop (CDH) y Microsoft Power BI para el almacenamiento y la visualización de datos, respectivamente. Después de la preparación de datos, la secuencia táctil para cada cliente convertido se procesó utilizando un modelo de MTA basado en el valor Shapley. Esto permitió una comparación del rendimiento del canal de prueba y control en términos de tasa de respuesta, ingresos por respuesta e ingresos incrementales obtenidos. La compañía también construyó un tablero para transmitir los hallazgos de manera efectiva, después de lo cual el proceso se estableció para la entrega automatizada en una cadencia mensual.
Impacto: Creó información precisa y automatizada sobre la verdadera contribución y rendimiento de los diversos canales y tácticas de marketing, lo que permitió un ajuste en vuelo para obtener resultados óptimos.
"La experiencia de trabajar en conjunto con los equipos de análisis y negocios de una institución financiera tan grande fue extremadamente gratificante. Como siempre, esta empresa asegura un entorno de aprendizaje continuo, y esto no era nuevo. La destilación de un escenario complejo en una solución elegante presentaba oportunidades de aprendizaje, especialmente en las áreas de optimización de consultas y creación de algoritmos",dijo un científico de datos en Ugam.
4. Proyecto: Infraestructura como Código (IaC) por Ugam, una empresa Merkle
Problema de negocio resuelto: Permita que una organización líder sin fines de lucro implemente escalas al tiempo que supera la necesidad de configuración manual de infraestructura, automatizando el proceso y controlando las incoherencias en toda la instalación medioambiental.
Por qué relevante ahora: Las empresas necesitan una infraestructura que se pueda implementar de forma rápida y a escala. IaC es una técnica relativamente antigua, pero ha ganado importancia en la era de la nube moderna. Aunque la infraestructura se puede configurar con solo hacer clic en un botón, IaC también facilita el proceso de configuración de la infraestructura según corresponda a la aplicación, pasando instrucciones de configuración a una plataforma en la nube.
Enfoque y tecnologías aprovechadas: Ugam utilizó plantillas de AWS CloudFormation, Troposphere, Bitbucket Pipeline, AWS S3, RDS Postgres, Redshift, IICS (Informatica Intelligent Cloud Services), AWS Lambda, SQS, SNS, Cloudwatch, entre otros. Además, desarrollaron un código de canalización de IaC utilizando BitbucketPipeline. También utilizaron la biblioteca de Python troposphere para crear plantillas de AWS CloudFormation que simplifican el aprovisionamiento y la administración en AWS. El equipo de ciencia de datos de Ugam creó plantillas para recursos y aplicaciones de infraestructura para un aprovisionamiento rápido y fiable, denominado pilas. Estas pilas podrían actualizarse o replicarse fácilmente según sea necesario.
Impacto entregado al cliente: A través de la automatización, agilizó la deriva ambiental en la canalización de lanzamiento junto con una forma rápida y eficiente de aprovisionamiento de infraestructura.
5. Proyecto: Pronóstico COVID-19 – Evaluación de Riesgos de Empleados por Genpact
Problema de negocio resuelto: Generar previsiones precisas para ayudar a sostener las operaciones comerciales a raíz de la pandemia COVID-19.
Por qué relevante ahora: En la segunda mitad de 2020, las empresas deben centrarse en identificar formas de mejorar la eficiencia de sus operaciones de producción y distribución. Una parte importante de este proceso viene en forma de garantizar la seguridad de los trabajadores y empleados. Las empresas podrían tener que identificar estrategias tales como una reducción de los plazos de cambio, caída en el ritmo de las operaciones o dedicar mano de obra a una sola línea de operaciones, para ayudar a manejar la crisis.
Enfoque y tecnologías aprovechadas: Incluía tres pasos principales: la creación del modelo SIDR (Susceptible-Infected-Dead-Recovered) mediante TensorFlow, la cuantificación de las intervenciones y la minimización de errores mediante el aprendizaje automático. Genpact aprovechó un modelo epidemiológico para construir la progresión real de las enfermedades infecciosas para cada lugar de fabricación. Además, el impacto de las medidas de intervención, como el bloqueo y el distanciamiento social, se acomodó dinámicamente en la construcción del modelo. Aprovecharon los datos existentes del cliente junto con los datos de fuentes de datos externas, los datos de tendencias globales y los indicadores de clientes potenciales para proporcionar mejores recomendaciones de inteligencia empresarial basadas en previsiones.
Impacto entregado: La solución permitió al cliente realizar una evaluación rápida de su estado de negocio actual junto con las capacidades de previsión y planificación de escenarios. El cliente fue capaz de generar proyecciones de sitios de fabricación para casos y muertes, junto con el impacto de diversas estrategias, tales como la reducción de las producción de productos / cierre de instalaciones. Sobre la base de las previsiones, el cliente desplegó las estrategias de seguridad adecuadas para cada ubicación de fabricación y fue testigo de una disminución constante en el número de nuevos casos que surgió dentro de la empresa.
"COVID-19 ha destrozado todos los modelos de previsión. Nadie va a ser capaz de crear pronósticos perfectos en este momento. Pero las empresas que incorporan señales externas en su modelado y aprovechan el poder de la inteligencia artificial definitivamente saldrán adelante", dijo Sanjay Sehgal, líder de consultoría de negocios de la línea comercial de negocios de ESTADOS Unidos, KPMG LLP.
Por SRISHTI DEORAS
26/11/2020
Data Science : : Machine Learning | Business Analytics : : Socio de SevillaUp
4 añosEstoy de acuerdo contigo, hay un potencial enorme en el tratamiento de los datos, pero es imprescindible saber lo que quieres o al menos contar con un equipo que te ayude a descubrirlo, y como bien dices, si no lo pruebas ahora, mañana tu competencia te puede adelantar ...
Senior consultant BI & IA
4 añosLa aplicación de IA y ML a Negocio no es marear datos, has de saber lo que quieres porque sabes lo que necesitas obtener. Y en muchas ocasiones no se consiguen resultados, pero en el intento X consigues una ventaja competitiva. Si tú no lo pruebas, tu competencia te adelantará