Asistentes personales. ¿La puerta de entrada de la IA en nuestra vida?
Her (2013)

Asistentes personales. ¿La puerta de entrada de la IA en nuestra vida?

Un asistente personal es alguien que realiza o ayuda a realizar las tareas de la vida diaria a otra persona. Llevamos décadas conviviendo con la idea de un "programa inteligente" que nos libere de las tareas más tediosas y nos dé información con algo de razonamiento. Si tienes años suficientes para saber quién era "Clip" ya sabes a lo que me refiero. Los principales fabricantes: Apple , Google , Microsoft o Amazon hace ya años que pusieron a nuestra disposición sus Siri, Google Assistant, Cortana y Alexa que, si bien es cierto que proporcionan ayuda en temas puntuales, aún están lejos de ser un elemento realmente rompedor. Pero desde la explosión de los modelos de lenguaje en IA, el horizonte empieza a ser mucho más prometedor.

¿Y por qué ahora va a ser diferente?

Hace unos meses instalé en mi Mac Limitless . Es un software que espía todo lo que haces en tu ordenador: graba tus reuniones, lee tus emails y, si quieres, escucha hasta tus insultos cuando algo no funciona. ¿Da miedito? sí, un poco. Aunque prometen que todo lo que almacena reside encriptado en tu ordenador no te quedas del todo tranquilo. La verdad es que no le había hecho mucho caso en este tiempo, me daba algún resumen (no muy bueno) después de una reunión, podía navegar en el tiempo y ver qué hacía en algún momento del pasado, pero no lo había usado... hasta que el otro día se me ocurrió preguntar cuánto tiempo había dedicado a un proyecto concreto en la última semana. 🤯

Esto nos lleva a la pregunta ¿está la tecnología lista para poner a nuestra disposición un minion que se acuerde de las cosas por nosotros, gestione nuestra agenda y mande facturas por los trabajos realizados? Y, lo más importante: ¿estamos nosotros listos para la integración total de asistentes IA en nuestras vidas?

¿Cómo funcionan estos asistentes?

Los asistentes personales basados en IA son conjuntos de diferentes programas y modelos. En su núcleo, utilizan tecnologías de Machine Learning (ML) y Procesamiento de Lenguaje Natural (NLP) para entender y procesar el lenguaje humano. ML para que el asistente aprenda de las interacciones pasadas y mejore sus respuestas con el tiempo, y NLP para convertir el lenguaje humano en datos que la máquina puede entender para ejecutar comandos o responder preguntas. Estos asistentes continuamente recopilan datos, los analizan a través de potentes algoritmos y se vuelven más personalizados a medida que aprenden los patrones de comportamiento y preferencias del usuario. Volveremos a esto, porque es la madre del cordero: aprenden y evolucionan.

Hablemos de generaciones: asistentes personales antes y después de los LLMs

Los asistentes personales han dado un salto gigante desde sus primeras versiones, gracias a poder realizar procesos en la nube y a los avances en inteligencia artificial. Antes, como con la Siri original, estaban bastante limitados. Sólo podían hacer tareas sencillas y se liaban si les pedías algo fuera de lo común. Pero ahora, con los Grandes Modelos de Lenguaje (LLMs, por sus siglas en inglés) como GPT-4, estos asistentes han pasado a otro nivel. Son capaces de tener conversaciones más naturales y entender mucho mejor lo que les decimos, aunque todavía tienen sus limitaciones. Pero ha sido el cambio de interfaz, con el modelo de chat entre humano-máquina y el procesamiento voz-texto y texto-voz el que ha roto la baraja.

Mientras todo esto ocurre, asistentes "históricos" como Google Assistant siguen mejorando, aprovechando sus propios modelos de IA y la ingente información que maneja Google para responder preguntas complejas y relevantes. Siri también está tratando de ponerse al día, con rumores de que Apple está trabajando en una versión completamente nueva. No me fío nada, pero X ex-Twitter presenta esta semana Grok: su nuevo modelo que seguro integrará en la meta-aplicación-que-todo-lo-engloba con la que sueña Musk.

Pero el cambio está viniendo de empresas más pequeñas. Startups sin mucho que perder, mucha menos burocracia y que pueden partir de cero en lo que hacen, como el ejemplo del que hablábamos al inicio del artículo, Limitless , que se basan en el análisis de lo que haces en tus dispositivos para ayudarte a ser más productivo, usando tecnología punta como GPT-4.

La integración con el sistema operativo y las aplicaciones

¿Tienen estos actores menores todas las de ganar? En el corto quizás, pero en este tipo de asistentes serán los que tengan el control de los sistemas operativos los que acaben ganando. La integración de asistentes personales basados en IA con sistemas operativos y aplicaciones es un factor crucial para su eficacia y alcance funcional. Mediante el uso de APIs (Interfaces de Programación de Aplicaciones), los asistentes pueden comunicarse con distintas aplicaciones y servicios, ampliando su capacidad para manejar tareas y procesar información.

Los sistemas operativos modernos, tanto en dispositivos móviles como en ordenadores, ofrecen (y controlan, claro) capas de integración nativa que permiten a los asistentes acceder a funcionalidades a nivel de sistema, como la gestión de energía, la configuración de hardware y el control de seguridad. Esto también plantea consideraciones importantes sobre la privacidad y la seguridad de los datos, tienes que estar muy seguro de los permisos que concedes a estos asistentes para evitar el acceso indebido a información sensible. Con la adecuada gestión de permisos, la integración de asistentes promete una experiencia de usuario más fluida y automatizada, potenciando el poder de la tecnología para actuar como una extensión de nuestras capacidades naturales. Ya puedes ver dónde tienen la ventaja Google, Apple y Microsoft. Pueden hacer un asistente tirando de funcionalidades nativas que den mil vueltas a cualquier aplicación externa. (Atentos a Journal a partir de IOS 17.2). Eso sí, dales tiempo para que salgan con el 110% de seguridad de que no meten la pata.

Ventajas y posibilidades

Vale, sí, pero ¿en qué me van a ayudar estos genios de la lámpara? Repasemos algunos de los campos que vamos a vivir más pronto que tarde:

Productividad: Sin duda es uno de los vectores de entrada más importantes.

  • Automatización de tareas rutinarias: Los asistentes personales pueden gestionar correos electrónicos, filtrando y respondiendo automáticamente tus mensajes no prioritarios y dejándote el tiempo para enfocarte en las tareas más críticas.
  • Gestión eficiente del tiempo: Pueden programar tus reuniones, recordar eventos importantes y configurar alarmas para mantenerte una agenda organizada sin necesidad de interacción manual continua. Incluso encargarse de moverte una reunión cuadrando con otros asistentes los huecos disponibles de todos los invitados. Muy loco.
  • Búsqueda rápida de información: Tendrán capacidad para realizar búsquedas en internet y en nuestros datos e interacciones rápidamente, proporcionando noticias o información específica del contexto en el que estés trabajando sin que tengas que navegar o distraerte con la búsqueda.
  • Soporte en la toma de decisiones: Ofrecerán análisis rápidos de datos y generarán informes, lo que te va a ayudar en la toma de decisiones basada en datos sin dedicar tiempo a compilar y analizar manualmente grandes volúmenes de información.

Personalización y aprendizaje: Te decía que una pieza clave es cómo aprenden de nuestras acciones y preferencias.

Los asistentes personales se perfeccionan mediante el aprendizaje continuo de las interacciones y comportamientos del usuario. Utilizan técnicas de aprendizaje automático para analizar las acciones, las preferencias y, en algunos casos, incluso el contexto emocional o el contenido implícito de las comunicaciones del usuario. Con cada comando de voz, cada respuesta dada y cada elección realizada, el asistente ajusta y refina su modelo interno para adaptarse mejor a tus necesidades. Por ejemplo, si solicitas noticias sobre tecnología con el primer café, el asistente puede empezar a anticipar esta acción, ofreciéndote las últimas noticias tecnológicas como parte de su rutina matutina sin que se lo solicites. Esta capacidad de personalización significa que, con el tiempo, el asistente se vuelve más eficiente y relevante para el usuario, facilitando una experiencia de usuario altamente personalizada y proactiva. No es un software estático sino que tu asistente y el mío se habrán auto-configurado cada uno a nuestro estilo particular de vida.

Interfaz y experiencia de usuario:

La manera en la que hablamos con estos asistentes ha evolucionado significativamente moviéndose hacia una interacción más natural y humana. Las primeras iteraciones con asistentes digitales a menudo requerían comandos de voz específicos y sufrían de una comprensión limitada del lenguaje coloquial (y siguen sufriendo. Alexa, me tienes harto), pero los avances en NLP y la integración de LLMs han revolucionado este aspecto. Ahora, podemos comunicarnos con ellos de manera más intuitiva, utilizando el lenguaje cotidiano y giros naturales. Cuando lleguemos a la integración de capacidades multimodales, que permitirán la interacción no sólo a través de voz sino también a través de texto, toques y, en algunos casos, gestos o miradas, proporcionará una experiencia de usuario aún más rica y adaptable. El resultado será una comunicación fluida y personalizada, donde la interfaz se vuelve casi invisible, permitiéndonos interactuar con la tecnología de una manera que sentiremos más cercana a la interacción humana natural.

Desafíos y preocupaciones

Vamos a dedicar una parte de este artículo a hablar de la parte de estos asistentes que no es tan de color de rosa, desde los datos hasta la tecnología. Lamentablemente, viendo lo que ocurre con las RRSS, no soy muy optimista en cuanto a que las empresas no usen nuestros datos con poca o ninguna ética.

Privacidad

Muy bien pero, ¿cómo podemos asegurarnos de que nuestra información permanece segura? Enfrentarnos a los desafíos de privacidad en estos asistentes personales es un tema primordial, considerando que manejan una cantidad significativa de nuestra información personal. Debemos exigir que los desarrolladores protejan nuestros datos con una encriptación robusta, sistemas de autenticación avanzados y políticas de acceso restringido. Es crucial que estos sistemas se diseñen desde cero con la privacidad como una prioridad, recopilando sólo los datos esenciales y anonimizando esta información, siempre que sea posible, para mitigar las consecuencias de posibles brechas de seguridad.

Por nuestra parte, como usuarios, debemos ser diligentes al configurar los permisos y las opciones de privacidad en nuestros asistentes de IA, buscando siempre mantener un balance adecuado entre las ventajas que ofrecen y la seguridad de nuestra información. No vale el "sí a todo". No es una opción no estar informados sobre qué tipo de interacciones y qué datos estamos compartiendo.

Ten en cuenta que la diferencia entre "recolectar" y "espiar" es muy sutil, la segunda implica la recogida de información sin nuestro conocimiento o consentimiento.

Seguridad

La seguridad es un aspecto crítico en este tema ya que estos sistemas tienen la capacidad de monitorear de manera continua nuestras actividades. Entre los riesgos asociados está el que datos confidenciales sean recopilados y usados por terceros a través de brechas de seguridad o incluso su uso indebido por parte de las compañías que recopilan los datos. Nada que no pase ahora, pero a un nivel mucho mayor.

Para mitigar estos riesgos volvemos a los puntos anteriores. Es imprescindible que los desarrolladores implementen medidas de seguridad rigurosas y que los usuarios seamos conscientes de las políticas de privacidad y seguridad de las aplicaciones que utilizamos. Debe existir una transparencia absoluta en cuanto a qué datos se están recopilando, cómo se almacenan y procesan y quién tiene acceso a ellos. La regulación es, también, muy importante y el que diferentes países usen distintas regulaciones no ayuda a una cuestión de alcance global como esta.

Sesgos: ¿cómo afectan las decisiones y consejos que nos da el asistente?

Los prejuicios en la IA son más que un detalle técnico; afectan a nuestra vida real a través de las recomendaciones y decisiones que nos brindan los asistentes. Estos sesgos no salen de la nada, son un reflejo de los datos con los que se entrenan estos sistemas. Datos sesgados en cuanto a diversidad cultural, socioeconómica o de género que pueden hacer que los asistentes virtuales nos ofrezcan consejos que no sean justos o pertinentes para todos los usuarios.

Piensa en cómo un asistente puede moldear nuestra visión del mundo con la noticia que elige mostrarnos, o cómo puede encasillarnos en una burbuja de consumo con sus recomendaciones de compra. Puedes ver cómo la manipulación en redes sociales, por ejemplo en el caso Cambridge Analytics, o el abuso de la publicidad personalizada están ya afectando a medio planeta.

Aquí poco podemos hacer como usuarios más allá de tener un fuerte espíritu crítico y conocer cómo funcionan nuestras máquinas. Son las empresas que desarrollan estos programas las que tienen que incluir algoritmos con la habilidad de detectar y ajustar cualquier desajuste. Involucrar a personas en el proceso de supervisión y ajuste de la IA también es esencial para atenuar estos sesgos. Ser muy claros en cuanto a cómo se entrenan estos sistemas y comprometerse con una ética sólida son elementos clave para que los asistentes personales funcionen de manera justa y ganen nuestra confianza.

Tecnología. Procesamiento en la nube vs local.

La latencia, el tiempo que tarda en responder el programa a nuestras acciones o peticiones, es clave en la eficiencia de los asistentes. Hay dos maneras de hacer funcionar estos algoritmos: el procesamiento en la nube, en grandes servidores distribuidos por el mundo, y el local, en nuestros dispositivos. La nube ofrece mucha más capacidad de procesamiento y acceso a modelos de IA actualizados, pero aumenta el tiempo de latencia, la dependencia de internet y compromete la privacidad. En cambio, el procesamiento local nos da respuestas rápidas, funciona sin internet y mejora la seguridad de los datos, pero está limitado por el hardware del dispositivo y la dificultad para actualizar los modelos de IA.

¿Dónde está la virtud? Al menos hasta que tengamos mejores procesadores en los móviles, en el punto medio. La combinación de ambos métodos, apoyada por técnicas como el knowledge distillation o el edge computing, prometen un compromiso óptimo entre rapidez y potencia de procesamiento.

Edge computing es una técnica donde las tareas se dividen entre el procesamiento local para comandos y consultas simples y la nube para solicitudes más complejas. Knowledge distillation se refiere a un proceso donde se transfiere el conocimiento de un modelo de IA grande y complejo a un modelo más pequeño y eficiente. Usando estas técnicas podremos ofrecer un equilibrio entre velocidad de respuesta y poder de procesamiento

Mi paralelismo favorito: 'Samantha' en Her

Puedes no creerlo, pero no queda demasiado para llegar a la utopía de Samantha, el asistente de la película Her (si no las visto aún, ya tardas). Samantha no es el típico asistente que sólo obedece órdenes. Es como esa amiga lista que te conoce tan bien que sabe lo que necesitas antes de que se lo digas. Cada día que pasas con ella aprende un poquito más sobre tus gustos y lo que haces, así que, básicamente, cada día es mejor en la tarea de hacerte la vida más fácil. Casi como si pudiera leer tu mente. ¿En qué se basa y por qué creo que no estamos muy lejos?

Aprendizaje y evolución: Samantha utiliza aprendizaje automático y redes neuronales para entender patrones de datos, hábitos y matices del lenguaje del usuario, facilitando una interacción cercana a la humana.

Los LLM ya se basan en redes neuronales profundas y aprendizaje automático para analizar y generar texto, lo que les permite reconocer patrones en los datos del usuario y en el lenguaje en general. Pueden entender y responder a una amplia gama de entradas de texto, lo que les da una apariencia de comprensión contextual.

Funcionalidad personalizada: Samantha se personaliza para cada usuario, adaptándose a sus estilos de vida y preferencias, lo que resulta en asistentes que actúan de forma única para cada persona.

Aquí falta un poco aún. La verdadera personalización, que implica aprender y adaptarse a los patrones individuales de interacción a lo largo del tiempo, todavía está en desarrollo.

Interacción natural: Gracias a avanzadas técnicas de procesamiento de lenguaje natural, Samantha permite conversaciones fluidas y respuestas personalizadas y adecuadas al contexto.

Los LLM son muy buenos en procesamiento del lenguaje y pueden sostener conversaciones sorprendentemente naturales, fluidas y coherentes pero, de momento, no tienen la capacidad para mantener un contexto en conversaciones largas o muy complejas.

Como veis, aún existen desafíos significativos en cuanto a la personalización, la empatía, el aprendizaje continuo y la seguridad de los datos que deben abordarse antes de que podamos interactuar con asistentes completamente evolucionados y personalizados. Pero no te duermas, lo que hace tres años parecía imposible hoy lo tenemos en el móvil.

¿'Samantha' o 'Hall 9000'? ¿De qué lado estás?

generada con DALL-e

El debate entre una IA comprensiva y personalizada al estilo de Samantha y una fría y controlada como HAL 9000 no es blanco o negro. Cada avance que nos acerca a estos asistentes inteligentes viene cargado de potencial y precauciones. Estamos a las puertas de una era donde nuestra interacción con la tecnología no sólo reflejará nuestras necesidades, sino también nuestros valores y límites. Es una conversación en la que todos debemos participar. Los desarrolladores deben seguir con la premisa de la seguridad y la ética en la base misma de la IA, mientras que nosotros, los usuarios, debemos decidir cómo y cuándo incorporar estas herramientas en nuestro día a día. No se trata de escoger un bando, sino de definir el equilibrio.

De nada vale renegar o esconder la cabeza. La tecnología avanza y modela nuestras vidas. El asistente del futuro será como las empresas y los usuarios decidamos construirlo y adoptarlo.


Actualización de 10/1/24: Nuevo cacharrito: Rabbit OS. Comentario aquí



SARAH JANE SEATHERTON

Power Practitioner | Getting female leaders who speak ESL seen and heard on their own terms in male dominated environments | 1-1 & Group Training | Woman Centered Communication Coaching | Founder | Speaker | Autodidact

1 año

Muy buen artículo. Encima esta comentario me llamado la atención…

  • No hay descripción de texto alternativo para esta imagen
Alfonso Lopez Hernandez

Director General en CITYlogin Iberia

1 año

Excelente artículo Juan Antonio Casado. Gracias por ayudarnos a entender un poco más la q nos viene encima.

Juan Antonio Casado

Consultor en Tecnología y Transformación Digital | Estrategia AI | Optimización de Procesos | Innovación

1 año
Idoia Fernández

Comunicación Corporativa en Argieskema, Diseño eléctrico industrial

1 año

Recuerdo que cuando ví la película Her meimpactó una escena en el metro donde los pasajeros estaban en silencio toal porque cada uno estaba con su móvil. Y eso ya está pasando hace tiempo. Ya es así. Ya no hay ruido en el metro. No hay casi conversaciones. Con los asistentes pasará lo mismo. Se irán introduciendo en nuestras vidas a pesar de los "peligros" para nuestra privacidad. Sin ir más lejos, mi hijo pequeño todo el rato le pregunta cosas a Alexa. Haciendo los deberes le pregunta cuanto es A x B, le pide que le diga el signifiado de una palabra, o que se la traduzca al inglés. Incluso cenando, si sale un debate chorra sobre en qué año fue no sé qué... en seguida se lo pregunta. Y mira que funciona mal...

Helena Valdeande

Periodista/Producción Audiovisual/Directora de Comunicación/Locutora/Inglés/Eventos

1 año

Hace tiempo que ando asustada. Quizás ahora estoy expectante para ver qué nos depara la IA si es usada para ayudarnos en nuestro día a día o para controlar nuestras vidas. Muy buen artículo.

Inicia sesión para ver o añadir un comentario.

Más artículos de Juan Antonio Casado

Otros usuarios han visto

Ver temas