¿Machine Learning y Deep Learning? Explicación Extendida
Machine y Deep Learning

¿Machine Learning y Deep Learning? Explicación Extendida

Para entender con mayor facilidad estos conceptos, es importante analizarlos de forma amplia y diferenciar lo que pasa por la mente de las personas cuando escuchan por primera vez esta expresión.

Machine learning significa en inglés aprendizaje de máquina, a las personas comunes les viene a la mente la imagen de un robot recibiendo clases. Esto refleja un error usual en el tratamiento del concepto, ya que estas tecnologías van mucho más allá de una clase entre estudiante y maestro. Y aunque el machine learning constituye una rama de la inteligencia artificial, su alcance es sin dudas más amplio de lo que generalmente se considera.

Para empezar, hay que tener en cuenta que el deep learning es un subconjunto del machine learning, y a su vez éste se incluye dentro de la llamada inteligencia artificial. Sin embargo, esta clasificación no se debe considerar de manera tan absoluta como las leyes de la naturaleza.

Al profundizar un poco más, es evidente que la inteligencia artificial es una palabra muy común en la actualidad que engloba una gran variedad de tecnologías.

Por el contrario, el machine y deep learning se refieren a subcategorías más específicas, que con el tiempo se han perfeccionado para resolver con soltura algunos problemas que habían desafiado a los especialistas. Su rendimiento potencial ciertamente es excepcional en muchos campos.

No hay texto alternativo para esta imagen
Nos encontramos ante una “tormenta perfecta”, originada gracias a la convergencia de las tecnologías Cloud, Móvil, IoT, Big Data y Computación Cognitiva

El machine learning se trata del estudio y aplicación de tecnologías, para permitir que las computadoras tengan la capacidad de aprender a resolver problemas por sí mismas, sin ser previamente programadas. Para ello, se vale de algoritmos para analizar datos, aprender a partir de ellos y posteriormente hacer una determinación o predicción sobre algún aspecto del mundo. El nombre en sí refleja que la técnica analiza los datos y encuentra el modelo por sí mismo en lugar de necesitar un ser humano. Se le asigna el nombre de "aprendizaje" porque el proceso se asemeja a ser entrenado a través de datos para resolver un problema determinado, que en este caso se trata de encontrar eficientemente un modelo. Por tanto, la información utilizada para lograr los objetivos se denomina “datos de entrenamiento".

Tipos de machine learning:

Aprendizaje supervisado.

No hay texto alternativo para esta imagen
Es la tarea de aprendizaje automático que consiste en inferir una función a partir de datos de entrenamiento etiquetados.

El aprendizaje supervisado es muy similar al proceso en el que los humanos aprenden cosas, ya que estos obtienen nuevos conocimientos a medida que resuelven problemas específicos:

1.- El hombre identifica un problema en su entorno. Luego aplica sus conocimientos actuales para a fin de resolver satisfactoriamente la situación. Y finalmente, compara la respuesta obtenida con las soluciones almacenadas en su cerebro.

2.- Si la respuesta es incorrecta, procede a modificar el conocimiento actual.

3.- Repite los pasos 1 y 2 para todos los problemas hasta hallar las soluciones que le ayuden a continuar con su rutina.

Al aplicar esta analogía sobre el proceso de machine learning, los problemas y soluciones del ejercicio corresponden a los datos de entrenamiento, y el conocimiento corresponde al modelo. Lo importante es el hecho de que necesitamos tener almacenadas diversas soluciones posibles.

  • La clasificación es sin dudas, uno de los tipos más comunes de aplicación en el aprendizaje supervisado. Su principal reto, se centra en encontrar literalmente las clases a las que pertenecen los datos.

Servicio de filtrado de correo no deseado

Servicio de reconocimiento de dígitos

Servicio de reconocimiento facial

Clasifica los correos por regulares o spam

Clasifica la imagen de dígitos de 0-9

Clasifica la imagen facial en uno de los usuarios registrados.

De aquí se deduce que el aprendizaje supervisado requiere pares de entrada y salida correctos para los datos de entrenamiento. Por ello, lo primero que se desea establecer es a qué clase pertenece cada entrada.

  • La regresión no determina la clase ya que su propósito es estimar un valor desconocido, e importante para el proceso

Tanto la clasificación como la regresión son parte del aprendizaje supervisado. Y por ello, sus datos de entrenamiento están representados en forma de entrada y salida correcta. En tal sentido, la única diferencia es que la clasificación emplea clases, mientras que la regresión requiere valores.

Aprendizaje no supervisado

No hay texto alternativo para esta imagen
El clustering como método de aprendizaje no supervisado tiene como objetivo clasificar en grupos atendiendo a las variables de los datos

Carece de información de etiquetado. El objetivo es descubrir o modelar estructuras ocultas en los datos en lugar de predecir salidas continuas o discretas.

Una subcategoría importante del aprendizaje no supervisado es el aprendizaje por representación y la reducción de la dimensionalidad. Una técnica clásica para esto es el análisis de componentes principales. Éste identifica las direcciones de varianza máxima en un conjunto de datos.

Dichas direcciones forman los ejes de componentes principales de un nuevo sistema de coordenadas. Y en la práctica, este modelo se usa para reducir la dimensionalidad de un conjunto de datos mientras se retiene la mayor parte de su información. Por ello, es una técnica de transformación lineal, y por lo tanto, está incapacitado para capturar patrones complejos no lineales en los datos. Otros aspectos a tomar en cuenta en este tipo de aprendizaje son:

1.- Arquitecturas que se pueden utilizar para reducir la dimensionalidad no lineal. Un codificador automático consta de dos subredes, un codificador y un descodificador. Para iniciar el proceso, los datos pasan a través de una entrada (por ejemplo, una imagen) directamente al codificador, que procede a comprimir a una representación de dimensiones inferiores.

2.- Procesado para reconstruir la imagen original a partir de esta representación. Las dos subredes (codificador y decodificador), están conectadas de un extremo a otro y frecuentemente se representan como un reloj de arena donde el ancho constituye el tamaño del mapa producido por la red neuronal multicapas.

3.- En una arquitectura de codificador automático, la salida corresponde al mapa más pequeño de la red, que luego alimenta al decodificador. Esta conexión también se conoce como el cuello de botella.

4.- Para que el decodificador produzca una reconstrucción fiel de la imagen de entrada, el codificador debe aprender a crear una representación que conserve la mayor parte de la información. Y dado que la representación es de menor dimensión que la entrada, el sistema no puede simplemente memorizar y pasar la entrada original a través de la arquitectura.

5.- Otra subcategoría importante del aprendizaje no supervisado es la agrupación, que asigna información de pertenencia a puntos de datos. Se puede considerar como una tarea similar a la clasificación, pero sin etiquetar la información proporcionada en el conjunto de datos de entrenamiento. Por lo tanto, en ausencia de información de etiqueta de clase, el enfoque consiste en definir grupos distintos basados en umbrales de similitud.

Aprendizaje autosupervisado o semisupervisado

No hay texto alternativo para esta imagen
La idea detrás del aprendizaje auto supervisado es desarrollar un sistema de aprendizaje profundo que pueda aprender a llenar los vacíos

Es una combinación del aprendizaje supervisado y no supervisado. Este se refiere a situaciones en las que algunos datos de entrenamiento están etiquetados y otros no. La idea principal es usar el etiquetado de los conjuntos de datos para intentar etiquetar la parte identificada. Luego, del proceso se obtiene información valiosa para continuar el trabajo desde la metodología propia del aprendizaje supervisado.

La recopilación de etiquetas para conjuntos de datos masivos puede resultar muy complicado. Por ello, optar por alternativas de aprendizaje autónomo, tiene como objetivo aprovechar grandes cantidades de información sin etiquetar para retroalimentar automáticamente el sistema.

Debido a su capacidad para utilizar la información disponible de forma natural, el aprendizaje auto supervisado a veces también se describe como la evolución del machine learning. Esto se debe a que está estrechamente relacionado con el anterior, y ambos aprenden asignaciones de entradas a salidas (imágenes y etiquetas de clase, por ejemplo). Sin embargo, en el aprendizaje auto supervisado, las etiquetas se generan automáticamente o se integran naturalmente en los datos.

En la práctica, el aprendizaje autosupervisado se usa cuando el conjunto de datos es relativamente pequeño, o el modelo podría beneficiarse de datos adicionales. En este escenario, aprovecha la información sin etiquetas que se encuentran en gran número y crear nuevas clases para la tarea de pretexto. Después de entrenar previamente el modelo, se puede trabajar en el conjunto de datos de la tarea objetivo, resultando en un mejor rendimiento.

El aprendizaje reforzado es una subcategoría del aprendizaje autosupervisado A diferencia del aprendizaje supervisado, que se centra en predecir un resultado específico, este tipo de machine se basa en hacer aprender al algoritmo desde un esquema conductista de premios y castigos. Para ello, se ubicará en un escenario donde es necesario tomar acciones que afecten múltiples variables modificables a través del tiempo.

Deep Learning

No hay texto alternativo para esta imagen
Subconjunto del Machine Learning

Es un subconjunto del machine learning, y a su vez éste se incluye dentro de la llamada inteligencia artificial.

Es la comprensión de los datos, la adquisición del conocimiento y la extracción del valor.

A pequeña escala esto es algo que tradicionalmente hacemos los humanos, accedemos a los datos, los interpretamos usando nuestro cerebro y tomamos decisiones supuestamente inteligentes. Sin embargo, cuando hablamos de gigabytes, terabytes o incluso petabytes de información, junto con la necesidad de tomar decisiones en escalas temporales del orden de los milisegundos, los humanos estamos… fuera de combate.

No tenemos más remedio que recurrir a máquinas y además necesitamos que estas máquinas sean capaces de interpretar los datos, comprenderlos y sacar conclusiones de forma inteligente. En otras palabras, necesitamos sistemas cognitivos artificiales, cerebros hechos de hardware y software, capaces de tomar decisiones por nosotros, capaces de realizar millones de tareas diferentes que en el pasado sólo podían hacer los humanos.

Inicia sesión para ver o añadir un comentario.

Más artículos de Domy Navarro

Otros usuarios han visto

Ver temas