{"id":128,"date":"2024-02-28T21:41:45","date_gmt":"2024-02-28T21:41:45","guid":{"rendered":"https:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/chapter\/deep-neural-networks\/"},"modified":"2025-06-25T17:50:37","modified_gmt":"2025-06-25T17:50:37","slug":"deep-neural-networks","status":"publish","type":"chapter","link":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/chapter\/deep-neural-networks\/","title":{"raw":"Habla de IA: redes neuronales profundas","rendered":"Habla de IA: redes neuronales profundas"},"content":{"raw":"<h3 style=\"text-align: left\">El aprendizaje autom\u00e1tico se profundiza<\/h3>\r\n<p class=\"no-indent\">El conocimiento humano es amplio y variable y es inherentemente dif\u00edcil de capturar. La mente humana puede absorber y trabajar con el conocimiento porque es, como lo puso Chomsky, \"un sistema sorprendentemente eficiente e incluso elegante que opera con peque\u00f1as cantidades de informaci\u00f3n; no busca inferir brutales correlaciones entre puntos de datos sino crear explicaciones<sup>1<\/sup>.\"<\/p>\r\n<p class=\"indent\">Se supone que el AA lo hace encontrando patrones en grandes cantidades de datos. Pero, antes de eso, expertos y programadores ten\u00edan que sentarse y codificar qu\u00e9 caracter\u00edsticas de los datos eran relevantes para el problema en cuesti\u00f3n, y alimentar estas a la m\u00e1quina como \"par\u00e1metros\"<sup>2,3<\/sup>. Como vimos antes, el rendimiento del sistema depende en gran medida de la calidad de los datos y los par\u00e1metros, que no siempre son f\u00e1ciles de precisar.<\/p>\r\n<p class=\"indent\">Las redes neuronales profundas o el aprendizaje profundo es una rama del AA que est\u00e1 dise\u00f1ado para superar esto mediante:<\/p>\r\n\r\n<ul>\r\n \t<li>Extracci\u00f3n de sus propios par\u00e1metros de los datos durante la fase de entrenamiento;<\/li>\r\n \t<li>Usando m\u00faltiples capas que construyen relaciones entre los par\u00e1metros, avanzando progresivamente desde representaciones simples en la capa m\u00e1s externa hasta m\u00e1s complejas y abstractas. Esto le permite hacer ciertas cosas mejor que los algoritmos convencionales de ML<sup>2<\/sup>.<\/li>\r\n<\/ul>\r\n<p class=\"no-indent\">Cada vez m\u00e1s, la mayor\u00eda de las aplicaciones poderosas de ML usan aprendizaje profundo. Estas incluyen motores de b\u00fasqueda, sistemas de recomendaci\u00f3n, transcripci\u00f3n y traducci\u00f3n de voz que hemos cubierto en este libro. No ser\u00eda exagerado decir que el aprendizaje profundo ha impulsado el \u00e9xito de la IA en m\u00faltiples tareas.<\/p>\r\n\r\n\r\n[caption id=\"attachment_905\" align=\"aligncenter\" width=\"488\"]<img class=\"wp-image-905\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.1-1024x858.jpg\" alt=\"\" width=\"488\" height=\"409\" \/> Traducci\u00f3n al espa\u00f1ol de Rodr\u00edguez Enr\u00edquez de una imagen tomada de AI for Teachers (https:\/\/pressbooks.pub\/aiforteachers\/chapter\/ai-speak-data-based-systems-part-2\/). LicenciaCC BY-NC 4.0 <a href=\"https:\/\/creativecommons.org\/licenses\/by-nc\/4.0\/\">https:\/\/creativecommons.org\/licenses\/by-nc\/4.0\/<\/a>[\/caption]\r\n<p class=\"no-indent\">\"Profundo\" se refiere a c\u00f3mo las capas se apilan una encima de otra para crear la red. \"Neuronal\" refleja el hecho de que algunos aspectos del dise\u00f1o se inspiraron en el cerebro biol\u00f3gico. A pesar de eso, y aunque proporcionan algunas ideas sobre nuestros propios procesos de pensamiento, estos son modelos estrictamente matem\u00e1ticos y no se parecen a ninguna parte o proceso biol\u00f3gico<sup>2<\/sup>.<\/p>\r\n\r\n<h3 style=\"text-align: left\">Los fundamentos del aprendizaje profundo<\/h3>\r\n<p class=\"no-indent\">Cuando los humanos miramos una imagen, identificamos autom\u00e1ticamente objetos y rostros. Pero una foto es solo una colecci\u00f3n de p\u00edxeles para un algoritmo. Pasar de un revoltijo de colores y niveles de brillo, a reconocer un rostro, es un salto demasiado complicado para ejecutar.<\/p>\r\n<p class=\"indent\">El aprendizaje profundo logra esto descomponiendo el proceso en representaciones simples en la primera capa, por ejemplo, comparando el brillo de p\u00edxeles vecinos para notar la presencia o ausencia de bordes en varias regiones de la imagen. La segunda capa toma colecciones de bordes para buscar entidades m\u00e1s complejas, como esquinas y contornos, ignorando peque\u00f1as variaciones en las posiciones de los bordes<sup>2,3<\/sup>. La siguiente capa busca partes de los objetos usando los contornos y esquinas. Lentamente, la complejidad se construye hasta el punto donde la \u00faltima capa puede combinar diferentes partes lo suficientemente bien como para reconocer un rostro o identificar un objeto.<\/p>\r\n<p class=\"no-indent\">.<\/p>\r\n\r\n\r\n[caption id=\"attachment_907\" align=\"aligncenter\" width=\"371\"]<img class=\"wp-image-907\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-29.2-1024x858.jpg\" alt=\"\" width=\"371\" height=\"311\" \/> Traducci\u00f3n al espa\u00f1ol de Rodr\u00edguez Enr\u00edquez de una imagen tomada de AI for Teachers (https:\/\/pressbooks.pub\/aiforteachers\/chapter\/ai-speak-data-based-systems-part-2\/). LicenciaCC BY-NC 4.0 <a href=\"https:\/\/creativecommons.org\/licenses\/by-nc\/4.0\/\">https:\/\/creativecommons.org\/licenses\/by-nc\/4.0\/<\/a>[\/caption]\r\n<p class=\"no-indent\">Lo que se debe tener en cuenta en cada capa no lo especifican los programadores, sino que se aprende de los datos en el proceso de entrenamiento<sup>3<\/sup>. Al probar estas predicciones con los resultados reales en el conjunto de datos de entrenamiento, el funcionamiento de cada capa se ajusta de manera ligeramente diferente para obtener un mejor resultado cada vez. Cuando se hace correctamente, y siempre que haya datos de buena calidad en cantidad suficiente, la red deber\u00eda evolucionar para ignorar partes irrelevantes de la foto, como la ubicaci\u00f3n exacta de las entidades, el \u00e1ngulo y la iluminaci\u00f3n, y centrarse en aquellas partes que hacen posible el reconocimiento.<\/p>\r\n<p class=\"indent\">Cabe destacar aqu\u00ed el hecho de que, a pesar de nuestro uso de bordes y contornos para entender el proceso, lo que realmente se representa en las capas es un conjunto de n\u00fameros, que podr\u00edan o no corresponder a cosas que entendemos. Lo que no cambia es la creciente abstracci\u00f3n y complejidad.<\/p>\r\n\r\n<h3 style=\"text-align: left\">Dise\u00f1ando la red<\/h3>\r\n<p class=\"no-indent\">Una vez que el programador decide usar el aprendizaje profundo para una tarea y <a href=\"https:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/chapter\/ai-speak-data-based-systems-part-2\/\" target=\"_blank\" rel=\"noopener\">prepara los datos<\/a>, tiene que dise\u00f1ar lo que se llama la arquitectura de su red neuronal. Tienen que elegir el n\u00famero de capas (profundidad de la red) y el n\u00famero de par\u00e1metros por capa (ancho de la red). A continuaci\u00f3n, tienen que decidir c\u00f3mo hacer conexiones entre las capas, si cada unidad de una capa estuviera conectada o no a cada unidad de la capa anterior.<\/p>\r\n<p class=\"indent\">La arquitectura ideal para una tarea dada se encuentra a menudo por experimentaci\u00f3n. Cuanto mayor es el n\u00famero de capas, menos par\u00e1metros se necesitan por capa y la red funciona mejor con datos generales, a costa de ser dif\u00edcil de optimizar. Menos conexiones significar\u00edan menos par\u00e1metros, y menor cantidad de c\u00e1lculo, pero reduce la flexibilidad de la red<sup>2<\/sup>.<\/p>\r\n\r\n<h3 style=\"text-align: left\">Entrenando la red<\/h3>\r\n<p class=\"no-indent\">Tomemos el ejemplo de una red neuronal de avance directo haciendo aprendizaje supervisado. Aqu\u00ed, la informaci\u00f3n fluye hacia adelante de capa a capa m\u00e1s profunda, sin bucles de retroalimentaci\u00f3n. Como en todas las t\u00e9cnicas de AA, el objetivo aqu\u00ed es descubrir c\u00f3mo la entrada est\u00e1 conectada a la salida, qu\u00e9 par\u00e1metros se unen, y c\u00f3mo se unen para dar el resultado observado. Asumimos una relaci\u00f3n f que conecta la entrada x con la salida y. Luego usamos la red para encontrar el conjunto de par\u00e1metros \u03b8 que dan la mejor coincidencia para las salidas predichas y reales.<\/p>\r\n\r\n<div class=\"textbox\">\r\n<p style=\"text-align: center\">Pregunta clave: La y predicha es f (x, \u03b8), \u00bfpara qu\u00e9 \u03b8?<\/p>\r\n\r\n<\/div>\r\n<p class=\"no-indent\">Aqu\u00ed la predicci\u00f3n para y es el producto final y el conjunto de datos x es la entrada. En el reconocimiento facial, x suele ser el conjunto de p\u00edxeles en una imagen. y puede ser el nombre de la persona. En la red, las capas son como trabajadores en una l\u00ednea de ensamblaje, donde cada trabajador trabaja en lo que se les da y lo pasa hacia adelante al siguiente trabajador. El primero toma la entrada y la transforma un poco y se la da al segundo en l\u00ednea. El segundo hace lo mismo antes de pas\u00e1rselo al tercero, y as\u00ed sucesivamente hasta que la entrada se transforma en el producto final.<\/p>\r\n<p class=\"indent\">Matem\u00e1ticamente, la funci\u00f3n f se divide en muchas funciones f1, f2, f3... donde f= ....f3(f2(f1(x))). La capa junto a la entrada transforma los par\u00e1metros de entrada usando f1, la siguiente capa usando f2, y as\u00ed sucesivamente. El programador podr\u00eda intervenir para ayudar a elegir la familia correcta de funciones basada en su conocimiento del problema.<\/p>\r\n\r\n\r\n[caption id=\"attachment_909\" align=\"aligncenter\" width=\"376\"]<img class=\"wp-image-909\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.3-1024x858.jpg\" alt=\"\" width=\"376\" height=\"315\" \/> Traducci\u00f3n al espa\u00f1ol de Rodr\u00edguez Enr\u00edquez de una imagen tomada de AI for Teachers (https:\/\/pressbooks.pub\/aiforteachers\/chapter\/ai-speak-data-based-systems-part-2\/). LicenciaCC BY-NC 4.0 <a href=\"https:\/\/creativecommons.org\/licenses\/by-nc\/4.0\/\">https:\/\/creativecommons.org\/licenses\/by-nc\/4.0\/<\/a>[\/caption]\r\n<p class=\"no-indent\">Es el trabajo de cada capa asignar el nivel de importancia, el peso dado a cada par\u00e1metro que recibe. Estos pesos son como perillas que en \u00faltima instancia definen la relaci\u00f3n entre la salida predicha y la entrada en esa capa<sup>3<\/sup>. En un sistema t\u00edpico de aprendizaje profundo, estamos viendo cientos de millones de estas perillas y cientos de millones de ejemplos de entrenamiento. Dado que ni definimos ni podemos ver la salida y los pesos en las capas entre la entrada y la salida, estas se llaman capas ocultas.<\/p>\r\n<p class=\"indent\">En el caso del ejemplo de reconocimiento de objetos discutido anteriormente, es el trabajo del primer trabajador detectar bordes y pasar los bordes al segundo que detecta contornos y as\u00ed sucesivamente.<\/p>\r\n<p class=\"indent\">Durante el entrenamiento, la salida predicha se toma y se compara con la salida real. Si hay una gran diferencia entre las dos, los pesos asignados en cada capa tendr\u00e1n que cambiarse mucho. Si no, tienen que cambiarse un poco. Este trabajo se hace en dos partes. Primero se calcula la diferencia entre la predicci\u00f3n y la salida. Luego otro algoritmo calcula c\u00f3mo cambiar los pesos en cada capa, comenzando desde la capa de salida (en este caso, la informaci\u00f3n fluye hacia atr\u00e1s desde las capas m\u00e1s profundas). As\u00ed al final del proceso de entrenamiento, la red est\u00e1 lista con sus pesos y funciones para atacar los datos de prueba. El resto del proceso es el mismo que el del AA convencional.<\/p>\r\n\r\n\r\n[caption id=\"attachment_440\" align=\"aligncenter\" width=\"298\"]<img class=\"wp-image-440\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-9.4-1024x858.jpg\" alt=\"\" width=\"298\" height=\"249\" \/> Imagen entre, prueba y usa, adaptada de AI\u202fOpen\u202fText\u202fLab (2022). Traducci\u00f3n Rodriguez Enr\u00edquez del texto incluido en la imagen. Fuente: AI\u202fOpen\u202fText\u202fLab. Licencia: CC\u202fBY\u2011SA\u202f4.0. <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/<\/a>[\/caption]\r\n\r\n<hr \/>\r\n<p class=\"hanging-indent\"><sup>1 <strong data-start=\"0\" data-end=\"44\" data-is-only-node=\"\">Chomsky, N., Roberts, I., &amp; Watumull, J.<\/strong> (2023). <em data-start=\"53\" data-end=\"97\">Noam Chomsky: The false promise of ChatGPT<\/em>. <em data-start=\"99\" data-end=\"119\">The New York Times<\/em>. <a href=\"https:\/\/www.nytimes.com\/2023\/03\/08\/opinion\/noam-chomsky-chatgpt-ai.html\" target=\"_new\" rel=\"noopener noreferrer\" data-start=\"121\" data-end=\"192\" data-is-last-node=\"\">https:\/\/www.nytimes.com\/2023\/03\/08\/opinion\/noam-chomsky-chatgpt-ai.html<\/a><\/sup><\/p>\r\n<p class=\"hanging-indent\"><sup>2 <strong data-start=\"0\" data-end=\"50\" data-is-only-node=\"\">Goodfellow, I. J., Bengio, Y., &amp; Courville, A.<\/strong> (2016). <em data-start=\"59\" data-end=\"74\">Deep learning<\/em>. MIT Press. <a href=\"http:\/\/www.deeplearningbook.org\/\" target=\"_new\" rel=\"noopener noreferrer\" data-start=\"87\" data-end=\"119\" data-is-last-node=\"\">http:\/\/www.deeplearningbook.org\/<\/a><\/sup><\/p>\r\n<p class=\"hanging-indent\"><sup>3 <span class=\"relative -mx-px my-[-0.2rem] rounded px-px py-[0.2rem] transition-colors duration-100 ease-in-out\"><strong data-start=\"0\" data-end=\"39\" data-is-only-node=\"\">LeCun, Y., Bengio, Y., &amp; Hinton, G.<\/strong> (2015). Deep learning. <em data-start=\"63\" data-end=\"76\">Nature, 521<\/em>(7553), 436\u2013444. <a href=\"https:\/\/doi.org\/10.1038\/nature14539\" target=\"_new\" rel=\"noopener noreferrer\" data-start=\"93\" data-end=\"128\" data-is-last-node=\"\">https:\/\/doi.org\/10.1038\/nature14539<\/a><\/span><\/sup><\/p>","rendered":"<h3 style=\"text-align: left\">El aprendizaje autom\u00e1tico se profundiza<\/h3>\n<p class=\"no-indent\">El conocimiento humano es amplio y variable y es inherentemente dif\u00edcil de capturar. La mente humana puede absorber y trabajar con el conocimiento porque es, como lo puso Chomsky, \u00abun sistema sorprendentemente eficiente e incluso elegante que opera con peque\u00f1as cantidades de informaci\u00f3n; no busca inferir brutales correlaciones entre puntos de datos sino crear explicaciones<sup>1<\/sup>.\u00bb<\/p>\n<p class=\"indent\">Se supone que el AA lo hace encontrando patrones en grandes cantidades de datos. Pero, antes de eso, expertos y programadores ten\u00edan que sentarse y codificar qu\u00e9 caracter\u00edsticas de los datos eran relevantes para el problema en cuesti\u00f3n, y alimentar estas a la m\u00e1quina como \u00abpar\u00e1metros\u00bb<sup>2,3<\/sup>. Como vimos antes, el rendimiento del sistema depende en gran medida de la calidad de los datos y los par\u00e1metros, que no siempre son f\u00e1ciles de precisar.<\/p>\n<p class=\"indent\">Las redes neuronales profundas o el aprendizaje profundo es una rama del AA que est\u00e1 dise\u00f1ado para superar esto mediante:<\/p>\n<ul>\n<li>Extracci\u00f3n de sus propios par\u00e1metros de los datos durante la fase de entrenamiento;<\/li>\n<li>Usando m\u00faltiples capas que construyen relaciones entre los par\u00e1metros, avanzando progresivamente desde representaciones simples en la capa m\u00e1s externa hasta m\u00e1s complejas y abstractas. Esto le permite hacer ciertas cosas mejor que los algoritmos convencionales de ML<sup>2<\/sup>.<\/li>\n<\/ul>\n<p class=\"no-indent\">Cada vez m\u00e1s, la mayor\u00eda de las aplicaciones poderosas de ML usan aprendizaje profundo. Estas incluyen motores de b\u00fasqueda, sistemas de recomendaci\u00f3n, transcripci\u00f3n y traducci\u00f3n de voz que hemos cubierto en este libro. No ser\u00eda exagerado decir que el aprendizaje profundo ha impulsado el \u00e9xito de la IA en m\u00faltiples tareas.<\/p>\n<figure id=\"attachment_905\" aria-describedby=\"caption-attachment-905\" style=\"width: 488px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-905\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.1-1024x858.jpg\" alt=\"\" width=\"488\" height=\"409\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.1-1024x858.jpg 1024w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.1-300x251.jpg 300w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.1-768x644.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.1-1536x1288.jpg 1536w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.1-65x54.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.1-225x189.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.1-350x293.jpg 350w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.1.jpg 1645w\" sizes=\"(max-width: 488px) 100vw, 488px\" \/><figcaption id=\"caption-attachment-905\" class=\"wp-caption-text\">Traducci\u00f3n al espa\u00f1ol de Rodr\u00edguez Enr\u00edquez de una imagen tomada de AI for Teachers (https:\/\/pressbooks.pub\/aiforteachers\/chapter\/ai-speak-data-based-systems-part-2\/). LicenciaCC BY-NC 4.0 <a href=\"https:\/\/creativecommons.org\/licenses\/by-nc\/4.0\/\">https:\/\/creativecommons.org\/licenses\/by-nc\/4.0\/<\/a><\/figcaption><\/figure>\n<p class=\"no-indent\">\u00abProfundo\u00bb se refiere a c\u00f3mo las capas se apilan una encima de otra para crear la red. \u00abNeuronal\u00bb refleja el hecho de que algunos aspectos del dise\u00f1o se inspiraron en el cerebro biol\u00f3gico. A pesar de eso, y aunque proporcionan algunas ideas sobre nuestros propios procesos de pensamiento, estos son modelos estrictamente matem\u00e1ticos y no se parecen a ninguna parte o proceso biol\u00f3gico<sup>2<\/sup>.<\/p>\n<h3 style=\"text-align: left\">Los fundamentos del aprendizaje profundo<\/h3>\n<p class=\"no-indent\">Cuando los humanos miramos una imagen, identificamos autom\u00e1ticamente objetos y rostros. Pero una foto es solo una colecci\u00f3n de p\u00edxeles para un algoritmo. Pasar de un revoltijo de colores y niveles de brillo, a reconocer un rostro, es un salto demasiado complicado para ejecutar.<\/p>\n<p class=\"indent\">El aprendizaje profundo logra esto descomponiendo el proceso en representaciones simples en la primera capa, por ejemplo, comparando el brillo de p\u00edxeles vecinos para notar la presencia o ausencia de bordes en varias regiones de la imagen. La segunda capa toma colecciones de bordes para buscar entidades m\u00e1s complejas, como esquinas y contornos, ignorando peque\u00f1as variaciones en las posiciones de los bordes<sup>2,3<\/sup>. La siguiente capa busca partes de los objetos usando los contornos y esquinas. Lentamente, la complejidad se construye hasta el punto donde la \u00faltima capa puede combinar diferentes partes lo suficientemente bien como para reconocer un rostro o identificar un objeto.<\/p>\n<p class=\"no-indent\">.<\/p>\n<figure id=\"attachment_907\" aria-describedby=\"caption-attachment-907\" style=\"width: 371px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-907\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-29.2-1024x858.jpg\" alt=\"\" width=\"371\" height=\"311\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-29.2-1024x858.jpg 1024w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-29.2-300x251.jpg 300w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-29.2-768x644.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-29.2-1536x1288.jpg 1536w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-29.2-65x54.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-29.2-225x189.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-29.2-350x293.jpg 350w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-29.2.jpg 1645w\" sizes=\"(max-width: 371px) 100vw, 371px\" \/><figcaption id=\"caption-attachment-907\" class=\"wp-caption-text\">Traducci\u00f3n al espa\u00f1ol de Rodr\u00edguez Enr\u00edquez de una imagen tomada de AI for Teachers (https:\/\/pressbooks.pub\/aiforteachers\/chapter\/ai-speak-data-based-systems-part-2\/). LicenciaCC BY-NC 4.0 <a href=\"https:\/\/creativecommons.org\/licenses\/by-nc\/4.0\/\">https:\/\/creativecommons.org\/licenses\/by-nc\/4.0\/<\/a><\/figcaption><\/figure>\n<p class=\"no-indent\">Lo que se debe tener en cuenta en cada capa no lo especifican los programadores, sino que se aprende de los datos en el proceso de entrenamiento<sup>3<\/sup>. Al probar estas predicciones con los resultados reales en el conjunto de datos de entrenamiento, el funcionamiento de cada capa se ajusta de manera ligeramente diferente para obtener un mejor resultado cada vez. Cuando se hace correctamente, y siempre que haya datos de buena calidad en cantidad suficiente, la red deber\u00eda evolucionar para ignorar partes irrelevantes de la foto, como la ubicaci\u00f3n exacta de las entidades, el \u00e1ngulo y la iluminaci\u00f3n, y centrarse en aquellas partes que hacen posible el reconocimiento.<\/p>\n<p class=\"indent\">Cabe destacar aqu\u00ed el hecho de que, a pesar de nuestro uso de bordes y contornos para entender el proceso, lo que realmente se representa en las capas es un conjunto de n\u00fameros, que podr\u00edan o no corresponder a cosas que entendemos. Lo que no cambia es la creciente abstracci\u00f3n y complejidad.<\/p>\n<h3 style=\"text-align: left\">Dise\u00f1ando la red<\/h3>\n<p class=\"no-indent\">Una vez que el programador decide usar el aprendizaje profundo para una tarea y <a href=\"https:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/chapter\/ai-speak-data-based-systems-part-2\/\" target=\"_blank\" rel=\"noopener\">prepara los datos<\/a>, tiene que dise\u00f1ar lo que se llama la arquitectura de su red neuronal. Tienen que elegir el n\u00famero de capas (profundidad de la red) y el n\u00famero de par\u00e1metros por capa (ancho de la red). A continuaci\u00f3n, tienen que decidir c\u00f3mo hacer conexiones entre las capas, si cada unidad de una capa estuviera conectada o no a cada unidad de la capa anterior.<\/p>\n<p class=\"indent\">La arquitectura ideal para una tarea dada se encuentra a menudo por experimentaci\u00f3n. Cuanto mayor es el n\u00famero de capas, menos par\u00e1metros se necesitan por capa y la red funciona mejor con datos generales, a costa de ser dif\u00edcil de optimizar. Menos conexiones significar\u00edan menos par\u00e1metros, y menor cantidad de c\u00e1lculo, pero reduce la flexibilidad de la red<sup>2<\/sup>.<\/p>\n<h3 style=\"text-align: left\">Entrenando la red<\/h3>\n<p class=\"no-indent\">Tomemos el ejemplo de una red neuronal de avance directo haciendo aprendizaje supervisado. Aqu\u00ed, la informaci\u00f3n fluye hacia adelante de capa a capa m\u00e1s profunda, sin bucles de retroalimentaci\u00f3n. Como en todas las t\u00e9cnicas de AA, el objetivo aqu\u00ed es descubrir c\u00f3mo la entrada est\u00e1 conectada a la salida, qu\u00e9 par\u00e1metros se unen, y c\u00f3mo se unen para dar el resultado observado. Asumimos una relaci\u00f3n f que conecta la entrada x con la salida y. Luego usamos la red para encontrar el conjunto de par\u00e1metros \u03b8 que dan la mejor coincidencia para las salidas predichas y reales.<\/p>\n<div class=\"textbox\">\n<p style=\"text-align: center\">Pregunta clave: La y predicha es f (x, \u03b8), \u00bfpara qu\u00e9 \u03b8?<\/p>\n<\/div>\n<p class=\"no-indent\">Aqu\u00ed la predicci\u00f3n para y es el producto final y el conjunto de datos x es la entrada. En el reconocimiento facial, x suele ser el conjunto de p\u00edxeles en una imagen. y puede ser el nombre de la persona. En la red, las capas son como trabajadores en una l\u00ednea de ensamblaje, donde cada trabajador trabaja en lo que se les da y lo pasa hacia adelante al siguiente trabajador. El primero toma la entrada y la transforma un poco y se la da al segundo en l\u00ednea. El segundo hace lo mismo antes de pas\u00e1rselo al tercero, y as\u00ed sucesivamente hasta que la entrada se transforma en el producto final.<\/p>\n<p class=\"indent\">Matem\u00e1ticamente, la funci\u00f3n f se divide en muchas funciones f1, f2, f3&#8230; donde f= &#8230;.f3(f2(f1(x))). La capa junto a la entrada transforma los par\u00e1metros de entrada usando f1, la siguiente capa usando f2, y as\u00ed sucesivamente. El programador podr\u00eda intervenir para ayudar a elegir la familia correcta de funciones basada en su conocimiento del problema.<\/p>\n<figure id=\"attachment_909\" aria-describedby=\"caption-attachment-909\" style=\"width: 376px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-909\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.3-1024x858.jpg\" alt=\"\" width=\"376\" height=\"315\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.3-1024x858.jpg 1024w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.3-300x251.jpg 300w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.3-768x644.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.3-1536x1288.jpg 1536w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.3-65x54.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.3-225x189.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.3-350x293.jpg 350w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-29.3.jpg 1645w\" sizes=\"(max-width: 376px) 100vw, 376px\" \/><figcaption id=\"caption-attachment-909\" class=\"wp-caption-text\">Traducci\u00f3n al espa\u00f1ol de Rodr\u00edguez Enr\u00edquez de una imagen tomada de AI for Teachers (https:\/\/pressbooks.pub\/aiforteachers\/chapter\/ai-speak-data-based-systems-part-2\/). LicenciaCC BY-NC 4.0 <a href=\"https:\/\/creativecommons.org\/licenses\/by-nc\/4.0\/\">https:\/\/creativecommons.org\/licenses\/by-nc\/4.0\/<\/a><\/figcaption><\/figure>\n<p class=\"no-indent\">Es el trabajo de cada capa asignar el nivel de importancia, el peso dado a cada par\u00e1metro que recibe. Estos pesos son como perillas que en \u00faltima instancia definen la relaci\u00f3n entre la salida predicha y la entrada en esa capa<sup>3<\/sup>. En un sistema t\u00edpico de aprendizaje profundo, estamos viendo cientos de millones de estas perillas y cientos de millones de ejemplos de entrenamiento. Dado que ni definimos ni podemos ver la salida y los pesos en las capas entre la entrada y la salida, estas se llaman capas ocultas.<\/p>\n<p class=\"indent\">En el caso del ejemplo de reconocimiento de objetos discutido anteriormente, es el trabajo del primer trabajador detectar bordes y pasar los bordes al segundo que detecta contornos y as\u00ed sucesivamente.<\/p>\n<p class=\"indent\">Durante el entrenamiento, la salida predicha se toma y se compara con la salida real. Si hay una gran diferencia entre las dos, los pesos asignados en cada capa tendr\u00e1n que cambiarse mucho. Si no, tienen que cambiarse un poco. Este trabajo se hace en dos partes. Primero se calcula la diferencia entre la predicci\u00f3n y la salida. Luego otro algoritmo calcula c\u00f3mo cambiar los pesos en cada capa, comenzando desde la capa de salida (en este caso, la informaci\u00f3n fluye hacia atr\u00e1s desde las capas m\u00e1s profundas). As\u00ed al final del proceso de entrenamiento, la red est\u00e1 lista con sus pesos y funciones para atacar los datos de prueba. El resto del proceso es el mismo que el del AA convencional.<\/p>\n<figure id=\"attachment_440\" aria-describedby=\"caption-attachment-440\" style=\"width: 298px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-440\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-9.4-1024x858.jpg\" alt=\"\" width=\"298\" height=\"249\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-9.4-1024x858.jpg 1024w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-9.4-300x251.jpg 300w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-9.4-768x644.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-9.4-1536x1288.jpg 1536w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-9.4-65x54.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-9.4-225x189.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-9.4-350x293.jpg 350w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-9.4.jpg 1645w\" sizes=\"(max-width: 298px) 100vw, 298px\" \/><figcaption id=\"caption-attachment-440\" class=\"wp-caption-text\">Imagen entre, prueba y usa, adaptada de AI\u202fOpen\u202fText\u202fLab (2022). Traducci\u00f3n Rodriguez Enr\u00edquez del texto incluido en la imagen. Fuente: AI\u202fOpen\u202fText\u202fLab. Licencia: CC\u202fBY\u2011SA\u202f4.0. <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/<\/a><\/figcaption><\/figure>\n<hr \/>\n<p class=\"hanging-indent\"><sup>1 <strong data-start=\"0\" data-end=\"44\" data-is-only-node=\"\">Chomsky, N., Roberts, I., &amp; Watumull, J.<\/strong> (2023). <em data-start=\"53\" data-end=\"97\">Noam Chomsky: The false promise of ChatGPT<\/em>. <em data-start=\"99\" data-end=\"119\">The New York Times<\/em>. <a href=\"https:\/\/www.nytimes.com\/2023\/03\/08\/opinion\/noam-chomsky-chatgpt-ai.html\" target=\"_new\" rel=\"noopener noreferrer\" data-start=\"121\" data-end=\"192\" data-is-last-node=\"\">https:\/\/www.nytimes.com\/2023\/03\/08\/opinion\/noam-chomsky-chatgpt-ai.html<\/a><\/sup><\/p>\n<p class=\"hanging-indent\"><sup>2 <strong data-start=\"0\" data-end=\"50\" data-is-only-node=\"\">Goodfellow, I. J., Bengio, Y., &amp; Courville, A.<\/strong> (2016). <em data-start=\"59\" data-end=\"74\">Deep learning<\/em>. MIT Press. <a href=\"http:\/\/www.deeplearningbook.org\/\" target=\"_new\" rel=\"noopener noreferrer\" data-start=\"87\" data-end=\"119\" data-is-last-node=\"\">http:\/\/www.deeplearningbook.org\/<\/a><\/sup><\/p>\n<p class=\"hanging-indent\"><sup>3 <span class=\"relative -mx-px my-[-0.2rem] rounded px-px py-[0.2rem] transition-colors duration-100 ease-in-out\"><strong data-start=\"0\" data-end=\"39\" data-is-only-node=\"\">LeCun, Y., Bengio, Y., &amp; Hinton, G.<\/strong> (2015). Deep learning. <em data-start=\"63\" data-end=\"76\">Nature, 521<\/em>(7553), 436\u2013444. <a href=\"https:\/\/doi.org\/10.1038\/nature14539\" target=\"_new\" rel=\"noopener noreferrer\" data-start=\"93\" data-end=\"128\" data-is-last-node=\"\">https:\/\/doi.org\/10.1038\/nature14539<\/a><\/span><\/sup><\/p>\n","protected":false},"author":3,"menu_order":3,"template":"","meta":{"pb_show_title":"on","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[],"contributor":[],"license":[],"part":121,"_links":{"self":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters\/128"}],"collection":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/users\/3"}],"version-history":[{"count":12,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters\/128\/revisions"}],"predecessor-version":[{"id":912,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters\/128\/revisions\/912"}],"part":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/parts\/121"}],"metadata":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters\/128\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/media?parent=128"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapter-type?post=128"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/contributor?post=128"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/license?post=128"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}