¿Qué es Deep Learning y qué es una red neuronal?

Deep learning o aprendizaje profundo es una forma de aprendizaje automático, donde una máquina intenta imitar al cerebro humano utilizando redes neuronales artificiales con más de tres capas que le permiten hacer predicciones con una gran precisión.

¿Qué es una red neuronal?

Las redes neuronales, y mas concretamente las redes neuronales artificiales (ANN – Artificial Neural Network), imitan al cerebro humano utilizando un conjunto de algoritmos. A un nivel muy básico, una neurona, de una red neuronal, consta de cuatro componentes principales: entradas, pesos, un sesgo y una salida.

Modelo simplificado de una neurona artificial

¿En qué se diferencia Deep Learning de una red neuronal?

Se le llama Deep Learning o aprendizaje profundo simplemente cuando una red neuronal tiene más de tres capas.

Red neuronal profunda

¿Qué tipos de redes neuronales existen?

Los tipos más simples de redes neuronales son los que hemos mencionado arriba y son redes neuronales artificiales (ANN) o redes neuronales multicapa.

Hay dos otro tipos de redes neuronales que suelen ser muy utilizadas que son las redes neuronales convolucionales (CNN – Convolutional neural network) y las redes neuronales recurrentes (RNN – Recurrent Neural Networks).

Redes Neuronales Convolucionales (CNN)

Las redes neuronales convolucionales son un tipo de red neuronal muy utilizada para la visión por ordenador y son utilizadas para trabajar con imágenes, vídeo y audio.

Las redes neuronales convolucionales están basadas en la biología de la corteza visual. Intentan imitar cómo tu cerebro procesa las imágenes que vienen de tu retina.

Cómo funcionan las redes neuronales convolucionales (CNN)

La forma en que funcionan tus ojos son con grupos de neuronas que hacen un submuestreo de la imagen que ves para procesar partes específicas de lo que ves. Todas estas partes se superponen entre sí para cubrir todo el campo visual en lo que llamamos convoluciones. Esto se repite en muchas capas, de ahí el término profundo, y se utiliza para detectar patrones como haría tu cerebro con los datos que procesa de tu retina.

Arquitecturas CNN especializadas

Las CNN tienen muchos hiper parámetros que se pueden configurar y por eso existen arquitecturas especializadas para diferentes problemas. Aquí tienes algunos de ellos:

  • LeNet-5 – Buena para el reconocimiento de la escritura a mano
  • AlexNet – Clasificación de imágenes, más profunda que LeNet
  • GoogLeNet – Aún más profundo, pero con mejor rendimiento y introduce inception modules (grupos de capas de convolución)
  • ResNet (red residual) – Aún más profunda, mantiene el rendimiento a través de las conexiones de salto.

Redes Neuronales Recurrentes (RNN)

Las redes neuronales recurrentes trabajan con datos secuenciales o de series temporales. Se utilizan mucho para la traducción de idiomas, el procesamiento del lenguaje natural y el reconocimiento de voz. Es la base de muchas aplicaciones populares como Google Translate o Siri.

La gran diferencia de las otras redes neuronales es que tienen “memoria”. Las salidas de las neuronas son utilizadas de nuevo la próxima vez que se corre el modelo. Normalmente las redes neuronales profundas tradicionales asumen que las entradas y las salidas son independientes entre sí.

Retropropagación

A parte de la retropropagación normal también tenemos la retropropagación en el tiempo para este tipo de red neuronal. Todos esos pasos de tiempo se suman rápidamente que crean capas adicionales creando una red neuronal muy profunda en muy poco tiempo.

Arquitecturas RNN especializadas

Cuando estamos construyendo RNNs, el estado de las etapas anteriores se diluye con el tiempo. Esto puede ser un problema, por ejemplo cuándo es aprendizaje de estructuras de frases y por ejemplo las primeras palabras de la frase son muy importantes. Esto se puede contrarrestar con células de memoria. Existe dos tipos de célula que puedes usar:

  • Célula LSTM: Long short-term memory. Mantiene estados separados a corto y largo plazo
  • Célula GRU – Gated Recurrent Unit. Célula LSTM simplificada que funciona casi igual de bien

¿Quieres aprender más sobre ciencia de datos?

En Datademia trabajamos para crear el mejor contenido de datos en español, incluyendo ciencia de datos, inteligencia de negocios y programación.

En Datademia ofrecemos un Bootcamp, en el que te puedes convertir en un científico de datos.

científico de datos
Data Scientist Bootcamp de Datademia

¿Te has gustado el artículo?

Puedes verlo en formato video en nuestro canal de Youtube:

Comparte en tus redes

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *