Inteligencia artificial en sencillo: ¿cómo funciona la IA generativa?
La inteligencia artificial es uno de los temas más populares a escala mundial hoy en día. A esta altura se ha situado justamente como una tecnología disruptiva que generará grandes cambios que ni siquiera podemos dimensionar completamente. De hecho, hoy ya tiene aplicaciones concretas a nivel masivo en ámbitos como el servicio al cliente, el diseño gráfico, marketing, la industria automotriz, entre un largo etcétera.
No obstante lo anterior, lo que llama la atención (y me tiene escribiendo sobre el tema) es que en los últimos meses ha habido un gran revuelo en torno a las aplicaciones de chat basadas en inteligencia artificial, tales como ChatGPT, de OpenAI y Bard, de Google. Estas aplicaciones han demostrado la capacidad de las máquinas para emular el lenguaje humano y crear contenido, lo que ha despertado gran entusiasmo, pero a la vez debate sobre el futuro de la IA y su impacto en la sociedad.
No obstante ser un tema mainstream, aún hay muchas personas que no entienden qué es exactamente y cómo funciona la Inteligencia Artificial. Por ello, en este artículo me he propuesto explicar de manera sencilla qué es la #IA, cómo funciona y cómo se llegó a la IA generativa, que es lo que elevó la popularidad de esta tecnología.
A lo básico: ¿Qué es la inteligencia artificial?
La inteligencia artificial ha existido por muchos años, pero como decía antes, recientemente ha ganado popularidad y se ha visibilizado rápidamente, especialmente por el éxito de OpenAI y su famoso ChatGPT. Sin embargo, la IA ha sido aplicada desde hace tiempo en plataformas de entretenimiento como Netflix para sugerir contenido o en el sistema financiero para detectar conductas anómalas y detectar fraudes.
En lo formal, esta rama de la informática apunta a desarrollar sistemas que pueden realizar tareas que normalmente requieren inteligencia humana, como reconocimiento de voz, identificar imágenes, cálculos matemáticos, toma de decisiones y traducción de idiomas, por mencionar algunas aplicaciones. Para ello, esta tecnología se basa en algoritmos que se enseñan a sí mismos, mediante el uso de grandes cantidades de datos, de modo de imitar la conducta humana.
¿Cómo funciona la inteligencia artificial?
La inteligencia artificial se basa en el aprendizaje automático, o machine learning, que es una técnica que permite a los sistemas computacionales aprender de forma autónoma a partir de datos que se le proporcionan.
Un ejemplo de este proceso de aprendizaje automático y de utilización de este aprendizaje es el reconocimiento facial. Estos sistemas, comunmente utilizados para detectar personas que son de interés de la policía, utilizan algoritmos de aprendizaje automático para analizar características faciales únicas, como la distancia entre los ojos o la forma de la mandíbula, y luego compararlas con una base de datos de rostros "buscados". Así, el sistema puede aprender a reconocer patrones en las características faciales y, con el tiempo, mejorar su capacidad para identificar a las personas con mayor precisión. Todo, realizado en segundos, pudiendo procesar miles de imágenes en minutos, cotejando rostros de videos o cámaras en vivo con imágenes de un banco de datos.
Otro ejemplo de entrenamiento y aplicación del aprendizaje automático son los asistentes virtuales como Siri y Alexa. Estos sitemas utilizan el aprendizaje automático para reconocer la voz del usuario y proporcionar respuestas a las solicitudes que se le realicen. El sistema aprende a reconocer la voz del usuario a través de la exposición a grandes cantidades de datos de voz, tanto en su programación original como luego, al momento de realizar el entrenamiento con el usuario.
Recomendado por LinkedIn
El aprendizaje automático se divide en dos categorías principales: el aprendizaje supervisado y el aprendizaje no supervisado.
El aprendizaje supervisado implica proporcionar al sistema de inteligencia artificial un conjunto de datos etiquetados, es decir, datos que han sido previamente clasificados. Por ejemplo, para entrenarlo en la identificación de automóviles, se le introducen miles de fotografías de dsitinto tipo, pero solo algunas de ellas son de automóviles y están debidamente etiquetadas, de modo que el sistema se entrena a partir de los patrones que detecta en los datos "correctos". Así, el sistema utiliza estos datos para aprender a clasificar nuevos datos, más allá del conjunto de datos original.
Por otro lado, el aprendizaje no supervisado implica proporcionar al sistema un conjunto de datos no etiquetados. En este caso el sistema debe aprender a clasificar los datos por sí mismo o, en otras palabras, busca patrones en los datos para agruparlos en base a sus similitudes. Por ejemplo, podría utilizarse este tipo de algoritmo en el marketing (de hecho se hace) de modo de identificar similitudes y perfilar mejor a los clientes. Así, podríamos ingresar datos de la clientela y el sistema los segmentaría en base a grupos con características similares, tales como edad, género o patrones de compra. Como vemos, es muy útil para descubrir patrones ocultos en grandes conjuntos de datos.
¿Cómo se llegó a la IA generativa?
La IA generativa es una rama de la inteligencia artificial que utiliza redes neuronales para generar nuevos datos, es decir, para crear nueva información con base en el aprendizaje obtenido de un conjunto de datos. Esta técnica se basa en el aprendizaje profundo, que es una técnica que utiliza redes neuronales artificiales para aprender a reconocer patrones en los datos.
En este punto vale la pena profundizar para abordar un elemento clave a la hora de entender la IA Generativa, las redes neuronales artificiales. Se trata de una técnica utilizada en la inteligencia artificial que busca imitar como funciona el cerebro humano. De este modo, están compuestas por neuronas que se comunican entre sí para procesar información y tomar decisiones.
Un ejemplo para entender las redes neuronales artificiales es pensar en una red que clasifica fotos de perros y gatos. Primero, se le aportan muchas imágenes etiquetadas de perros y gatos. La red utiliza estas imágenes para aprender a identificar las características únicas de cada animal, como la forma de las orejas y ojos, o la textura del pelaje. Luego, al aplicar el entrenamiento y recibir una imagen nueva, la red analiza la analiza y decide si es más probable que sea un perro o un gato en función de lo que ha aprendido previamente. Adicionalmente, si la red clasifica incorrectamente la imagen, se le retroalimente y así aprende de sus errores, mejorando su capacidad de clasificación.
Entonces, al utilizar redes neuronales y el aprendizaje profundo, se ha posibilitado el generar nueva información y he ahí la llamada IA Generativa. Ello ha permitido desarrollar nuevas aplicaciones en diferentes campos, incluyendo las artes, la literatura, las ciencias duras, etc.
Para simplificarlo más aún. Un software de inteligencia artificial que permite identificar cuando un auto se sale del carril, o uno que detecta rostros, o una que clasifica fruta a partir de los colores de ésta, utilizan machine learning, han sido entrenadas con conjuntos de datos, pero no generan nuevos datos. Por el contrario, Aplicaciones populares como ChatGPT, Dall-E, Microsoft Designer, Bard, entre otros, permiten generar texto, imágenes, letras músicales o código de programación, que no existe en el dataset original que les entrenó. Eso es lo sorprendente.
Recuerdo que a fines de 2019, cuando trajimos Saturdays AI a Chile, una de las principales barreras que se reconocía entre los expertos, era la limitante de datos disponibles para entrenar los modelos. Por supuesto, había repositorios para cosas básicas como reconocimiento de colores o animales, pero no había datasets como hoy. Ahora, esa valla parece superada puesto que la IA ha avanzado a niveles tales que basta un conjunto de datos etiquetados acotado para entrenar el modelo y el resto puede ser recabado por el mismo sistema, a través de aprendizaje no supervisado. Esto es un avance increíble.