Cognition">
Lectura 4
Lectura 4
Lectura 4
Inteligencia artificial
4.1Deep learning
4.1.1 Conceptos fundamentales
¿Qué es deep learning (aprendizaje profundo)?
Fuente: [Imagen sin título sobre machine learning vs. deep learning], s.f.,
https://cdn.ttgtmedia.com/rms/onlineImages/what_is-traditional_vs_deep_learning_desktop.jpg
Perceptron
Para continuar con la arquitectura es necesario entender un poco más en detalle
sobre las neuronas. Cabe destacar que existen diversos tipos, una de ellas es
el perceptron que fue desarrollado en la década de 1950, pero hoy es más
común el uso de otro tipo de neurona artificial.
Este tipo de neurona puede recibir varias entradas binarias, es decir, valores 0
o 1 de cada entrada, y tiene como salida un solo resultado. Como muestra la
figura 4 tiene las entradas 𝑋1, 𝑋2y 𝑋3, que pueden aceptar valores binarios
como 0 y 1, y tiene una sola salida que es el resultado del algoritmo utilizado.
El perceptron recibe los valores de cada una de las entradas y, de acuerdo al
peso que tenga cada una, se realiza una sumatoria, el resultado es comparado
con un valor límite que si lo supera es 1 y en caso de no superarlo es 0.
Figura 3: Perceptron
Sigmoide
Al igual que la neurona digital perceptron, la neurona sigmoide es otro tipo pero
con algunas mejoras con respecto a la anterior. En este caso, la neurona
sigmoide puede recibir entradas con valores que varían entre 0 y 1, es decir,
que ya no estaría bajo la presencia de ingresos binarios al algoritmo. Por lo
tanto, las variables de entrada 𝑋1, 𝑋2y 𝑋3 obtendrían valores entre 0 y 1, como
el 0.547. El concepto del uso de los pesos y el cálculo es similar a la perceptron
pero el valor límite en este caso es el 0.5, es decir, que si el resultado de la
sumatoria con respecto al peso de importancia es mayor a 0.5 entonces el
resultado de la neurona es 1, en caso contrario es 0.
Funcionamiento
Para comenzar, es necesario saber que para detectar qué número se muestra
en la imagen de 28 por 28 pixeles, se debe contar con 784 neuronas en la
capa de entrada, debido a que 28 × 28 = 784, y a cada neurona se le
asigna un pixel para su análisis. Luego, con una capa oculta de 𝑛 que se puede
asignar con diferentes valores, en este ejemplo será 𝑛 = 15 neuronas. Por
último, tendrá una capa de salida con 10 neuronas, una salida para cada
número posible entre 0 y 9, que se activará con un valor 1 el número que
corresponda en la predicción.
Cada una de las neuronas de entrada recibe un valor que varía entre 0 para
el color blanco, y 1 para el color negro, en donde los valores intermedios, entre
0 y 1 están determinado por escala de grises. Luego, las neuronas de la capa
oculta reciben el resultado de la capa de entrada para determinar en qué
lugares de la imagen esta un color cercano al negro o número cercano a 1 y
en cuáles no. Este resultado es luego la entrada a la capa de salida que
determina con un valor entre 0 y 1 a que dígito del 0 al 9 pertenece. Es decir,
que una de las neuronas de la capa de salida va a ser la seleccionada como
el dígito leído por el algoritmo en la imagen, en el ejemplo sería el número 3.
Figura 5: Red neuronal para detectar números
Fuente: [Imagen sin título sobre red neuronal para detectar números], s.f.,
http://neuralnetworksanddeeplearning.com/images/tikz12.png
Hoy en día cada uno de estos tipos de redes neuronales son utilizados para
amplios campos que dan solución a problemas de deep learning, y la mayoría
de ellos ya forman parte de nuestra vida cotidiana. Entre estas se pueden
encontrar las siguientes:
Reconocimiento de rostros: consiste en reconocer por medio de una imagen
el rostro de una persona, en algunos casos como Google Photos este tipo de
algoritmo tiene la capacidad de reconocer los rostros y detectar la
identidad de la persona, como así también determinar objetos y detectar
los lugares de donde fueron capturadas esas fotos.
En el mismo se puede observar que se puede ingresar un texto o una URL que
contenga algún texto o artículo, como podría ser una nota en un diario digital,
un artículo de un blog o un e-mail. Una vez que se cuenta con un texto se permite
analizar el mismo y se generan una serie de respuestas brindadas por el
producto de Watson para análisis de lenguaje natural, entre los resultados se
puede observar:
[Imagen sin título sobre número en base a una imagen]. (s.f.). Recuperada
de https://1001freedownloads.s3.amazonaws.com/vector/thumb/64381/0-
9-Handwritten-5.png
[Imagen sin título sobre red neuronal para detectar números]. (s.f.).
Recuperada de
http://neuralnetworksanddeeplearning.com/images/tikz12.png