Una pausa en el aprendizaje

Una pausa en el aprendizaje

Siguiendo en la seria de artículos de IA, comento ahora de la tan comentada carta abierta para ponerle una #Pause al desarrollo de la IA avanzada, y con eso aprovechamos de repasar uno de los principios del funcionamiento de este tipo de IA.

Esta semana (12-abr-2023) el Think Tank #FutureOfLife publicó una lista de recomendaciones de medidas gubernamentales acerca de la regulación y monitoreo del del desarrollo de IA avanzada. Esta publicación se puede entender como una bajada con más enfoque de la carta abierta que publicaron en Marzo-2023.

Siendo un hombre muy práctico, me es difícil tomar demasiado en serio la iniciativa de la Pausa. Es como pretender terminar con la migración cerrando los pasos fronterizos habilitados. Hay cosas que no se pueden detener. Además, siempre soy escéptico con el efecto del paso del tiempo. La idea de esperar 6 meses para estar preparados tiene implícita la idea que dentro de 6 meses estaremos más preparados que ahora. En la práctica, en 6 meses más tal vez estemos más preparados... o tal vez estemos menos preparados.

Una de las recomendaciones de medidas de control es legislar sobre advertir claramente al usuario cuando está interactuando con una IA. También es difícil tomarlo muy en serio. En el mail de phishing que estoy leyendo ahora no hay ninguna advertencia del tipo: este es un mensaje generado con IA con el objeto de robarle.

Siendo justo, #FutureOfLife ha hecho un esfuerzo por aterrizar sus recomendaciones y hacerlas más específicas. Claramente no puede detener la IA que usan los hackers. La petición de moratoria apunta sólo al IA de alto nivel, y dentro de él, sólo al proceso de aprendizaje.

¿Qué es el aprendizaje?

Una red neuronal tiene que tener un proceso de aprendizaje antes de funcionar bien. En un sistema grande, este es un proceso costoso en tiempo y capacidad de procesamiento. Es este aprendizaje el que se pretende poner en pausa.

En muchas publicaciones se usa el término entrenamiento, pero esto es una traducción literal del verbo to train en inglés, que se acerca más al término español adiestrar que a entrenar.

Hace varios años, al introducir el e-mail en las empresas, resultaba penosamente evidente que muchos trabajadores no sabían escribir. Y varios eran concientes de ello y sentían cierta vergüenza. Tomé la costumbre de tener un libro de cuentos en mi oficina. El libro se lo prestaba a distintas personas intentando que mejoraran su nivel de escritura (yo soy así de desatinado a veces).

Claro, la intuición es que la lectura mejora la escritura. ¿Cómo funciona?

Primero leo. Luego escribo y trato de detectar (a veces en forma inconciente) si acaso lo que escribo resulta tan bien escrito como lo que leí.

Precisamente la etapa inicial del aprendizaje de sistemas del tipo GPT funciona más o menos parecido. Alimento el sistema con mucho texto y luego le pido que genere texto, que puede ser el siguiente párrafo. La misma IA puede comparar en forma automática el texto generado, ya sea con otra pieza de texto o con el párrafo siguiente original. Si no hay suficiente parecido, el sistema ajusta sus ponderaciones y vuelve a intentar hasta lograr un resultado mejor. Este es el funcionamiento básico del esquema predictor de palabras y frases, que fue el precedente de los GPT.

Este sistema autónomo por sí solo no es suficiente. Se requirieron nuevos avances para dar el siguiente paso.

En otro artículo lo podremos ver.

P.D.: el libro era la colección Cuentos Completos, de Mario Benedetti.

Inicia sesión para ver o añadir un comentario.

Otros usuarios han visto

Ver temas