{"id":65,"date":"2024-02-28T21:40:53","date_gmt":"2024-02-28T21:40:53","guid":{"rendered":"https:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/chapter\/ai-speak-search-engine-indexing\/"},"modified":"2025-06-20T16:44:40","modified_gmt":"2025-06-20T16:44:40","slug":"ai-speak-search-engine-indexing","status":"publish","type":"chapter","link":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/chapter\/ai-speak-search-engine-indexing\/","title":{"raw":"Habla de IA: indexaci\u00f3n de motores de b\u00fasqueda","rendered":"Habla de IA: indexaci\u00f3n de motores de b\u00fasqueda"},"content":{"raw":"<p class=\"no-indent\">Un motor de b\u00fasqueda toma palabras clave (la consulta de b\u00fasqueda) introducidas en el cuadro de b\u00fasqueda y trata de encontrar los documentos web que responden a la informaci\u00f3n. Luego muestra la informaci\u00f3n de forma accesible, con la p\u00e1gina m\u00e1s relevante en la parte superior. Para hacer esto, el motor de b\u00fasqueda tiene que comenzar por encontrar documentos en la web y etiquetarlos para que sean f\u00e1ciles de recuperar. Veamos en l\u00edneas generales lo que implica este proceso.<\/p>\r\n\r\n<h3 style=\"text-align: left\">Paso 1: Los rastreadores web encuentran y descargan documentos<\/h3>\r\n<img class=\"alignleft wp-image-443 \" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.1-1024x726.jpg\" alt=\"\" width=\"296\" height=\"210\" \/>\r\n<p class=\"no-indent\">Despu\u00e9s de que un usuario introduce una consulta de b\u00fasqueda, es demasiado tarde para mirar todo el contenido disponible en internet<sup>1<\/sup>. Los documentos web se miran de antemano, y su contenido se desglosa y almacena en diferentes espacios.<\/p>\r\n&nbsp;\r\n\r\n&nbsp;\r\n\r\nDiagrama sobre c\u00f3mo los motores de b\u00fasqueda rastrean e indexan p\u00e1ginas web [Ilustraci\u00f3n]. En <em data-start=\"584\" data-end=\"618\">AI Speak: Search Engine Indexing<\/em>, de <em data-start=\"623\" data-end=\"658\">AI for Teachers: an Open Textbook<\/em>, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0). <a class=\"cursor-pointer\" href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\" target=\"_new\" rel=\"noopener\" data-start=\"791\" data-end=\"838\">https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/<\/a>\r\n<p class=\"no-indent\">Una vez que la consulta est\u00e1 disponible, todo lo que necesita hacerse es coincidir lo que se consulta con lo que est\u00e1 en los espacios.<\/p>\r\n<p class=\"indent\">Los rastreadores web son piezas de c\u00f3digo que encuentran y descargan documentos de la web. Comienzan con un conjunto de direcciones de sitios web (URL) y buscan en ellas enlaces a nuevas p\u00e1ginas web. Luego, descargan y examinan las nuevas p\u00e1ginas en busca de m\u00e1s enlaces. Siempre que la lista inicial sea lo suficientemente diversa, los rastreadores terminan visitando cada sitio que les permite el acceso, a menudo varias veces, buscando actualizaciones.<\/p>\r\n\r\n<h3 style=\"text-align: left\">Paso 2: el documento se transforma en m\u00faltiples piezas<\/h3>\r\n[caption id=\"attachment_445\" align=\"alignright\" width=\"415\"]<img class=\"wp-image-445 \" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.2-1024x726.jpg\" alt=\"\" width=\"415\" height=\"294\" \/> Diagrama sobre almacenamiento de la informaci\u00f3n [Ilustraci\u00f3n]. En AI Speak: Search Engine Indexing, de AI for Teachers: an Open Textbook, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0). <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/ <\/a>[\/caption]El documento descargado por el rastreador puede ser una p\u00e1gina web claramente estructurada con su propia descripci\u00f3n de contenido, autor, fecha, etc. Tambi\u00e9n puede ser una imagen mal escaneada de un libro antiguo de una biblioteca. Los motores de b\u00fasqueda suelen leer cien tipos diferentes de documentos<sup>1<\/sup>. Los convierten en c\u00f3digo html o xml y los almacenan en tablas (llamadas BigTable en el caso de Google).\r\n\r\n&nbsp;\r\n<p class=\"indent\">Una tabla est\u00e1 compuesta por secciones m\u00e1s peque\u00f1as llamadas tabletas en las que cada fila de la tableta est\u00e1 dedicada a una p\u00e1gina web. Estas filas se organizan en alg\u00fan orden que se registra junto con un registro de actualizaciones. Cada columna tiene informaci\u00f3n espec\u00edfica relacionada con la p\u00e1gina web que puede ayudar a coincidir el contenido del documento con los contenidos de una futura consulta. Las columnas contienen:<\/p>\r\n\r\n<ul>\r\n \t<li style=\"list-style-type: none\">\r\n<ul>\r\n \t<li>La direcci\u00f3n del sitio web que puede, por s\u00ed misma, dar una buena descripci\u00f3n de los contenidos en la p\u00e1gina, si es una p\u00e1gina principal con contenido representativo o una p\u00e1gina secundaria con contenido asociado;<\/li>\r\n \t<li>T\u00edtulos, encabezados y palabras en negrita que describen contenido importante;<\/li>\r\n \t<li>Metadatos de la p\u00e1gina. Esta es informaci\u00f3n sobre la p\u00e1gina que no forma parte del contenido principal, como el tipo de documento (por ejemplo, correo electr\u00f3nico o p\u00e1gina web), estructura del documento y caracter\u00edsticas como la longitud del documento, palabras clave, nombres de autores y fecha de publicaci\u00f3n;<\/li>\r\n \t<li>Descripci\u00f3n de enlaces de otras p\u00e1ginas a esta p\u00e1gina que proporcionan texto sucinto sobre diferentes aspectos del contenido de la p\u00e1gina. M\u00e1s enlaces, m\u00e1s descripciones y m\u00e1s columnas utilizadas. La presencia de enlaces tambi\u00e9n se utiliza para la clasificaci\u00f3n, para determinar cu\u00e1n popular es una p\u00e1gina web. (Echa un vistazo a <a href=\"https:\/\/es.wikipedia.org\/wiki\/PageRank\">PageRank de Google<\/a>, un sistema de clasificaci\u00f3n que utiliza enlaces hacia y desde una p\u00e1gina para medir la calidad y popularidad).<\/li>\r\n<\/ul>\r\n<\/li>\r\n<\/ul>\r\n<ul>\r\n \t<li>Nombres de personas, empresas u organizaciones, ubicaciones, direcciones, expresiones de tiempo y fecha, cantidades y valores monetarios, etc. Los algoritmos de aprendizaje autom\u00e1tico pueden ser entrenados para encontrar estas entidades en cualquier contenido utilizando datos anotados por un ser humano<sup>1<\/sup>.<\/li>\r\n<\/ul>\r\n[caption id=\"attachment_60\" align=\"alignleft\" width=\"231\"]<img class=\"wp-image-60 \" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-4-webpage.jpg\" alt=\"\" width=\"231\" height=\"234\" \/> El contenido principal de una p\u00e1gina a menudo est\u00e1 oculto entre otra informaci\u00f3n. <strong data-start=\"136\" data-end=\"160\">Il Fatto Quotidiano.<\/strong> (s.\u202ff.). <em data-start=\"170\" data-end=\"183\">theguardian<\/em> [Imagen]. Recuperado de <a class=\"\" href=\"https:\/\/creativecommons.org\/licenses\/by-nc-sa\/2.0\/?ref=openverse\" target=\"_new\" rel=\"noopener\" data-start=\"208\" data-end=\"272\">https:\/\/creativecommons.org\/licenses\/by-nc-sa\/2.0\/?ref=openverse<\/a><br data-start=\"272\" data-end=\"275\" \/>Licencia: Creative Commons Atribuci\u00f3n-NoComercial-CompartirIgual 2.0 (CC BY-NC-SA 2.0). <a class=\"\" href=\"https:\/\/creativecommons.org\/licenses\/by-nc-sa\/2.0\/\" target=\"_new\" rel=\"noopener\" data-start=\"363\" data-end=\"413\" data-is-only-node=\"\">https:\/\/creativecommons.org\/licenses\/by-nc-sa\/2.0\/<\/a>[\/caption]\r\n<p class=\"no-indent\">Una columna de la tabla, quiz\u00e1s la m\u00e1s importante, contiene el contenido principal del documento. Esto tiene que ser identificado en medio de todos los enlaces externos y anuncios. Una t\u00e9cnica utiliza un modelo de aprendizaje autom\u00e1tico para \"aprender\" cu\u00e1l es el contenido principal en cualquier p\u00e1gina web.<\/p>\r\n<p class=\"indent\">Por supuesto, podemos coincidir palabras exactas de la consulta con las palabras en un documento web, como el bot\u00f3n <em>Buscar<\/em> en cualquier procesador de textos. Pero esto no es muy efectivo, ya que las personas usan diferentes palabras para hablar sobre el mismo objeto. Simplemente registrar las palabras por separado no ayudar\u00e1 a capturar c\u00f3mo estas palabras se combinan entre s\u00ed para crear significado. En \u00faltima instancia, es el pensamiento detr\u00e1s de las palabras lo que nos ayuda a comunicarnos, y no las palabras mismas. Por lo tanto, todos los motores de b\u00fasqueda transforman el texto de una manera que facilita su coincidencia con el significado del texto de la consulta. M\u00e1s tarde, la consulta se procesa de manera similar.<\/p>\r\n\r\n[caption id=\"attachment_799\" align=\"aligncenter\" width=\"427\"]<img class=\"wp-image-799\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.3-576x1024.jpg\" alt=\"\" width=\"427\" height=\"759\" \/> Imagen metaf\u00f3rica de peces en el mar de informaci\u00f3n digital [Ilustraci\u00f3n]. En AI Speak: Search Engine Indexing, de AI for Teachers: an Open Textbook, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0).<a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\"> https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/<\/a>[\/caption]\r\n<p class=\"no-indent\">Como partes de una palabra, el n\u00famero total de identificadores (conocidos en inform\u00e1tica como token) diferentes que necesitan ser almacenados se reduce. Los modelos actuales almacenan alrededor de 30,000 a 50,000 tokens<sup>2<\/sup>. Las palabras mal escritas pueden ser identificadas porque partes de ellas aun coinciden con los tokens almacenados. Palabras desconocidas pueden arrojar resultados de b\u00fasqueda, ya que sus partes podr\u00edan coincidir con los tokens almacenados.<\/p>\r\n<p class=\"indent\">Aqu\u00ed, el conjunto de entrenamiento para el aprendizaje autom\u00e1tico est\u00e1 hecho de textos de ejemplo. Comenzando desde caracteres individuales, espacio y puntuaci\u00f3n, el modelo fusiona caracteres que se dan con frecuencia, para formar nuevos tokens. Si el n\u00famero de tokens no es lo suficientemente alto, contin\u00faa el proceso de fusi\u00f3n para cubrir partes de palabras m\u00e1s grandes o menos frecuentes. De esta manera, la mayor\u00eda de las palabras, finales de palabras y todos los prefijos pueden ser cubiertos. As\u00ed, dado un nuevo texto, la m\u00e1quina puede dividirlo f\u00e1cilmente en tokens y enviarlo al almacenamiento.<\/p>\r\n\r\n[caption id=\"attachment_801\" align=\"aligncenter\" width=\"354\"]<img class=\"wp-image-801\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.4-1024x683.jpg\" alt=\"\" width=\"354\" height=\"236\" \/> Imagen de ejemplo de aprendizaje autom\u00e1tico. [Ilustraci\u00f3n]. En AI Speak: Search Engine Indexing, de AI for Teachers: an Open Textbook, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0). <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/<\/a>[\/caption]\r\n<h3 style=\"text-align: left\">Paso 3: se construye un \u00edndice para f\u00e1cil referencia<\/h3>\r\n[caption id=\"attachment_177\" align=\"alignright\" width=\"352\"]<img class=\"wp-image-177\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-4-index-scaled-1.jpg\" alt=\"\" width=\"352\" height=\"264\" \/> <strong data-start=\"153\" data-end=\"167\">Weiner, B.<\/strong> (s.\u202ff.). <em data-start=\"177\" data-end=\"185\">\u00cdndice<\/em> [Imagen]. Recuperado de <a class=\"\" href=\"https:\/\/creativecommons.org\/licenses\/by-nd\/2.0\/?ref=openverse\" target=\"_new\" rel=\"noopener\" data-start=\"210\" data-end=\"271\">https:\/\/creativecommons.org\/licenses\/by-nd\/2.0\/?ref=openverse<\/a><br data-start=\"271\" data-end=\"274\" \/>Licencia: Creative Commons Atribuci\u00f3n-SinObraDerivada 2.0 (CC BY-ND 2.0). <a class=\"\" href=\"https:\/\/creativecommons.org\/licenses\/by-nd\/2.0\/\" target=\"_new\" rel=\"noopener\" data-start=\"348\" data-end=\"395\" data-is-only-node=\"\">https:\/\/creativecommons.org\/licenses\/by-nd\/2.0\/<\/a>[\/caption]\r\n<p class=\"no-indent\">Una vez que los datos est\u00e1n guardados en BigTables, se crea un \u00edndice. Similar en idea a los \u00edndices de libros de texto, el \u00edndice de b\u00fasqueda lista tokens y su ubicaci\u00f3n en un documento web. Las estad\u00edsticas muestran cu\u00e1ntas veces ocurre un token en un documento y cu\u00e1n importante es para el documento, etc., y la informaci\u00f3n se posiciona as\u00ed: \u00bfest\u00e1 el token en el t\u00edtulo o un encabezado, est\u00e1 concentrado en una parte del documento y sigue un token siempre a otro?<\/p>\r\n<p class=\"indent\">Hoy en d\u00eda, muchos motores de b\u00fasqueda usan un modelo basado en lenguaje generado por redes neuronales profundas. Este \u00faltimo codifica detalles sem\u00e1nticos del texto y es responsable de una mejor comprensi\u00f3n de las consultas<sup>3<\/sup>. Las redes neuronales ayudan a los motores de b\u00fasqueda a ir m\u00e1s all\u00e1 de la consulta, para capturar la necesidad de informaci\u00f3n que indujo la consulta en primer lugar.<\/p>\r\n<p class=\"no-indent\" style=\"text-align: left\">Estos tres pasos dan una cuenta simplificada de lo que se llama \"indexaci\u00f3n\", encontrar, preparar y almacenar documentos y crear el \u00edndice. Los pasos involucrados en \"clasificaci\u00f3n\" vienen a continuaci\u00f3n: hacer coincidir la consulta con el contenido y mostrar los resultados seg\u00fan la relevancia.<\/p>\r\n\r\n\r\n[caption id=\"attachment_803\" align=\"aligncenter\" width=\"463\"]<img class=\"wp-image-803\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.5-1024x726.jpg\" alt=\"\" width=\"463\" height=\"328\" \/> Imagen Telara\u00f1a como met\u00e1fora visual de la red de informaci\u00f3n web. En AI Speak: Search Engine Indexing, de AI for Teachers: an Open Textbook, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0). <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/<\/a>[\/caption]\r\n\r\n&nbsp;\r\n\r\n<hr \/>\r\n<p class=\"hanging-indent\"><sup>1<\/sup> Croft, B., Metzler D., Strohman, T.,<em> Search Engines, Information Retrieval in Practice<\/em>, 2015<\/p>\r\n<p class=\"hanging-indent\"><sup>2 <\/sup>Sennrich,R., Haddow, B., and Birch, A., <em>Neural Machine Translation of Rare Words with Subword Units,<\/em> In Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 1715\u20131725, Berlin, Germany. Association for Computational Linguistics, 2016.<\/p>\r\n<p class=\"hanging-indent\"><sup>3<\/sup> <strong data-start=\"44\" data-end=\"93\">Metzler, D., Tay, Y., Bahri, D., &amp; Najork, M.<\/strong> (2021, June). <em data-start=\"108\" data-end=\"169\">Rethinking search: Making domain experts out of dilettantes<\/em>[Opinion paper]. <em data-start=\"187\" data-end=\"204\">SIGIR Forum, 55<\/em>(1), Article\u00a013. <a href=\"https:\/\/doi.org\/10.1145\/3476415.3476428\">https:\/\/doi.org\/10.1145\/3476415.3476428<\/a><\/p>","rendered":"<p class=\"no-indent\">Un motor de b\u00fasqueda toma palabras clave (la consulta de b\u00fasqueda) introducidas en el cuadro de b\u00fasqueda y trata de encontrar los documentos web que responden a la informaci\u00f3n. Luego muestra la informaci\u00f3n de forma accesible, con la p\u00e1gina m\u00e1s relevante en la parte superior. Para hacer esto, el motor de b\u00fasqueda tiene que comenzar por encontrar documentos en la web y etiquetarlos para que sean f\u00e1ciles de recuperar. Veamos en l\u00edneas generales lo que implica este proceso.<\/p>\n<h3 style=\"text-align: left\">Paso 1: Los rastreadores web encuentran y descargan documentos<\/h3>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignleft wp-image-443\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.1-1024x726.jpg\" alt=\"\" width=\"296\" height=\"210\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.1-1024x726.jpg 1024w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.1-300x213.jpg 300w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.1-768x545.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.1-1536x1090.jpg 1536w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.1-2048x1453.jpg 2048w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.1-65x46.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.1-225x160.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.1-350x248.jpg 350w\" sizes=\"(max-width: 296px) 100vw, 296px\" \/><\/p>\n<p class=\"no-indent\">Despu\u00e9s de que un usuario introduce una consulta de b\u00fasqueda, es demasiado tarde para mirar todo el contenido disponible en internet<sup>1<\/sup>. Los documentos web se miran de antemano, y su contenido se desglosa y almacena en diferentes espacios.<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>Diagrama sobre c\u00f3mo los motores de b\u00fasqueda rastrean e indexan p\u00e1ginas web [Ilustraci\u00f3n]. En <em data-start=\"584\" data-end=\"618\">AI Speak: Search Engine Indexing<\/em>, de <em data-start=\"623\" data-end=\"658\">AI for Teachers: an Open Textbook<\/em>, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0). <a class=\"cursor-pointer\" href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\" target=\"_new\" rel=\"noopener\" data-start=\"791\" data-end=\"838\">https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/<\/a><\/p>\n<p class=\"no-indent\">Una vez que la consulta est\u00e1 disponible, todo lo que necesita hacerse es coincidir lo que se consulta con lo que est\u00e1 en los espacios.<\/p>\n<p class=\"indent\">Los rastreadores web son piezas de c\u00f3digo que encuentran y descargan documentos de la web. Comienzan con un conjunto de direcciones de sitios web (URL) y buscan en ellas enlaces a nuevas p\u00e1ginas web. Luego, descargan y examinan las nuevas p\u00e1ginas en busca de m\u00e1s enlaces. Siempre que la lista inicial sea lo suficientemente diversa, los rastreadores terminan visitando cada sitio que les permite el acceso, a menudo varias veces, buscando actualizaciones.<\/p>\n<h3 style=\"text-align: left\">Paso 2: el documento se transforma en m\u00faltiples piezas<\/h3>\n<figure id=\"attachment_445\" aria-describedby=\"caption-attachment-445\" style=\"width: 415px\" class=\"wp-caption alignright\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-445\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.2-1024x726.jpg\" alt=\"\" width=\"415\" height=\"294\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.2-1024x726.jpg 1024w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.2-300x213.jpg 300w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.2-768x545.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.2-1536x1090.jpg 1536w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.2-2048x1453.jpg 2048w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.2-65x46.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.2-225x160.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.2-350x248.jpg 350w\" sizes=\"(max-width: 415px) 100vw, 415px\" \/><figcaption id=\"caption-attachment-445\" class=\"wp-caption-text\">Diagrama sobre almacenamiento de la informaci\u00f3n [Ilustraci\u00f3n]. En AI Speak: Search Engine Indexing, de AI for Teachers: an Open Textbook, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0). <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/ <\/a><\/figcaption><\/figure>\n<p>El documento descargado por el rastreador puede ser una p\u00e1gina web claramente estructurada con su propia descripci\u00f3n de contenido, autor, fecha, etc. Tambi\u00e9n puede ser una imagen mal escaneada de un libro antiguo de una biblioteca. Los motores de b\u00fasqueda suelen leer cien tipos diferentes de documentos<sup>1<\/sup>. Los convierten en c\u00f3digo html o xml y los almacenan en tablas (llamadas BigTable en el caso de Google).<\/p>\n<p>&nbsp;<\/p>\n<p class=\"indent\">Una tabla est\u00e1 compuesta por secciones m\u00e1s peque\u00f1as llamadas tabletas en las que cada fila de la tableta est\u00e1 dedicada a una p\u00e1gina web. Estas filas se organizan en alg\u00fan orden que se registra junto con un registro de actualizaciones. Cada columna tiene informaci\u00f3n espec\u00edfica relacionada con la p\u00e1gina web que puede ayudar a coincidir el contenido del documento con los contenidos de una futura consulta. Las columnas contienen:<\/p>\n<ul>\n<li style=\"list-style-type: none\">\n<ul>\n<li>La direcci\u00f3n del sitio web que puede, por s\u00ed misma, dar una buena descripci\u00f3n de los contenidos en la p\u00e1gina, si es una p\u00e1gina principal con contenido representativo o una p\u00e1gina secundaria con contenido asociado;<\/li>\n<li>T\u00edtulos, encabezados y palabras en negrita que describen contenido importante;<\/li>\n<li>Metadatos de la p\u00e1gina. Esta es informaci\u00f3n sobre la p\u00e1gina que no forma parte del contenido principal, como el tipo de documento (por ejemplo, correo electr\u00f3nico o p\u00e1gina web), estructura del documento y caracter\u00edsticas como la longitud del documento, palabras clave, nombres de autores y fecha de publicaci\u00f3n;<\/li>\n<li>Descripci\u00f3n de enlaces de otras p\u00e1ginas a esta p\u00e1gina que proporcionan texto sucinto sobre diferentes aspectos del contenido de la p\u00e1gina. M\u00e1s enlaces, m\u00e1s descripciones y m\u00e1s columnas utilizadas. La presencia de enlaces tambi\u00e9n se utiliza para la clasificaci\u00f3n, para determinar cu\u00e1n popular es una p\u00e1gina web. (Echa un vistazo a <a href=\"https:\/\/es.wikipedia.org\/wiki\/PageRank\">PageRank de Google<\/a>, un sistema de clasificaci\u00f3n que utiliza enlaces hacia y desde una p\u00e1gina para medir la calidad y popularidad).<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li>Nombres de personas, empresas u organizaciones, ubicaciones, direcciones, expresiones de tiempo y fecha, cantidades y valores monetarios, etc. Los algoritmos de aprendizaje autom\u00e1tico pueden ser entrenados para encontrar estas entidades en cualquier contenido utilizando datos anotados por un ser humano<sup>1<\/sup>.<\/li>\n<\/ul>\n<figure id=\"attachment_60\" aria-describedby=\"caption-attachment-60\" style=\"width: 231px\" class=\"wp-caption alignleft\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-60\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-4-webpage.jpg\" alt=\"\" width=\"231\" height=\"234\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-4-webpage.jpg 553w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-4-webpage-297x300.jpg 297w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-4-webpage-65x66.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-4-webpage-225x227.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-4-webpage-350x354.jpg 350w\" sizes=\"(max-width: 231px) 100vw, 231px\" \/><figcaption id=\"caption-attachment-60\" class=\"wp-caption-text\">El contenido principal de una p\u00e1gina a menudo est\u00e1 oculto entre otra informaci\u00f3n. <strong data-start=\"136\" data-end=\"160\">Il Fatto Quotidiano.<\/strong> (s.\u202ff.). <em data-start=\"170\" data-end=\"183\">theguardian<\/em> [Imagen]. Recuperado de <a class=\"\" href=\"https:\/\/creativecommons.org\/licenses\/by-nc-sa\/2.0\/?ref=openverse\" target=\"_new\" rel=\"noopener\" data-start=\"208\" data-end=\"272\">https:\/\/creativecommons.org\/licenses\/by-nc-sa\/2.0\/?ref=openverse<\/a><br data-start=\"272\" data-end=\"275\" \/>Licencia: Creative Commons Atribuci\u00f3n-NoComercial-CompartirIgual 2.0 (CC BY-NC-SA 2.0). <a class=\"\" href=\"https:\/\/creativecommons.org\/licenses\/by-nc-sa\/2.0\/\" target=\"_new\" rel=\"noopener\" data-start=\"363\" data-end=\"413\" data-is-only-node=\"\">https:\/\/creativecommons.org\/licenses\/by-nc-sa\/2.0\/<\/a><\/figcaption><\/figure>\n<p class=\"no-indent\">Una columna de la tabla, quiz\u00e1s la m\u00e1s importante, contiene el contenido principal del documento. Esto tiene que ser identificado en medio de todos los enlaces externos y anuncios. Una t\u00e9cnica utiliza un modelo de aprendizaje autom\u00e1tico para \u00abaprender\u00bb cu\u00e1l es el contenido principal en cualquier p\u00e1gina web.<\/p>\n<p class=\"indent\">Por supuesto, podemos coincidir palabras exactas de la consulta con las palabras en un documento web, como el bot\u00f3n <em>Buscar<\/em> en cualquier procesador de textos. Pero esto no es muy efectivo, ya que las personas usan diferentes palabras para hablar sobre el mismo objeto. Simplemente registrar las palabras por separado no ayudar\u00e1 a capturar c\u00f3mo estas palabras se combinan entre s\u00ed para crear significado. En \u00faltima instancia, es el pensamiento detr\u00e1s de las palabras lo que nos ayuda a comunicarnos, y no las palabras mismas. Por lo tanto, todos los motores de b\u00fasqueda transforman el texto de una manera que facilita su coincidencia con el significado del texto de la consulta. M\u00e1s tarde, la consulta se procesa de manera similar.<\/p>\n<figure id=\"attachment_799\" aria-describedby=\"caption-attachment-799\" style=\"width: 427px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-799\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.3-576x1024.jpg\" alt=\"\" width=\"427\" height=\"759\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.3-576x1024.jpg 576w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.3-169x300.jpg 169w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.3-768x1365.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.3-864x1536.jpg 864w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.3-1152x2048.jpg 1152w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.3-65x116.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.3-225x400.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.3-350x622.jpg 350w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.3-scaled.jpg 1440w\" sizes=\"(max-width: 427px) 100vw, 427px\" \/><figcaption id=\"caption-attachment-799\" class=\"wp-caption-text\">Imagen metaf\u00f3rica de peces en el mar de informaci\u00f3n digital [Ilustraci\u00f3n]. En AI Speak: Search Engine Indexing, de AI for Teachers: an Open Textbook, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0).<a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\"> https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/<\/a><\/figcaption><\/figure>\n<p class=\"no-indent\">Como partes de una palabra, el n\u00famero total de identificadores (conocidos en inform\u00e1tica como token) diferentes que necesitan ser almacenados se reduce. Los modelos actuales almacenan alrededor de 30,000 a 50,000 tokens<sup>2<\/sup>. Las palabras mal escritas pueden ser identificadas porque partes de ellas aun coinciden con los tokens almacenados. Palabras desconocidas pueden arrojar resultados de b\u00fasqueda, ya que sus partes podr\u00edan coincidir con los tokens almacenados.<\/p>\n<p class=\"indent\">Aqu\u00ed, el conjunto de entrenamiento para el aprendizaje autom\u00e1tico est\u00e1 hecho de textos de ejemplo. Comenzando desde caracteres individuales, espacio y puntuaci\u00f3n, el modelo fusiona caracteres que se dan con frecuencia, para formar nuevos tokens. Si el n\u00famero de tokens no es lo suficientemente alto, contin\u00faa el proceso de fusi\u00f3n para cubrir partes de palabras m\u00e1s grandes o menos frecuentes. De esta manera, la mayor\u00eda de las palabras, finales de palabras y todos los prefijos pueden ser cubiertos. As\u00ed, dado un nuevo texto, la m\u00e1quina puede dividirlo f\u00e1cilmente en tokens y enviarlo al almacenamiento.<\/p>\n<figure id=\"attachment_801\" aria-describedby=\"caption-attachment-801\" style=\"width: 354px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-801\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.4-1024x683.jpg\" alt=\"\" width=\"354\" height=\"236\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.4-1024x683.jpg 1024w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.4-300x200.jpg 300w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.4-768x512.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.4-1536x1024.jpg 1536w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.4-2048x1365.jpg 2048w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.4-65x43.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.4-225x150.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-10.4-350x233.jpg 350w\" sizes=\"(max-width: 354px) 100vw, 354px\" \/><figcaption id=\"caption-attachment-801\" class=\"wp-caption-text\">Imagen de ejemplo de aprendizaje autom\u00e1tico. [Ilustraci\u00f3n]. En AI Speak: Search Engine Indexing, de AI for Teachers: an Open Textbook, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0). <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/<\/a><\/figcaption><\/figure>\n<h3 style=\"text-align: left\">Paso 3: se construye un \u00edndice para f\u00e1cil referencia<\/h3>\n<figure id=\"attachment_177\" aria-describedby=\"caption-attachment-177\" style=\"width: 352px\" class=\"wp-caption alignright\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-177\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-4-index-scaled-1.jpg\" alt=\"\" width=\"352\" height=\"264\" \/><figcaption id=\"caption-attachment-177\" class=\"wp-caption-text\"><strong data-start=\"153\" data-end=\"167\">Weiner, B.<\/strong> (s.\u202ff.). <em data-start=\"177\" data-end=\"185\">\u00cdndice<\/em> [Imagen]. Recuperado de <a class=\"\" href=\"https:\/\/creativecommons.org\/licenses\/by-nd\/2.0\/?ref=openverse\" target=\"_new\" rel=\"noopener\" data-start=\"210\" data-end=\"271\">https:\/\/creativecommons.org\/licenses\/by-nd\/2.0\/?ref=openverse<\/a><br data-start=\"271\" data-end=\"274\" \/>Licencia: Creative Commons Atribuci\u00f3n-SinObraDerivada 2.0 (CC BY-ND 2.0). <a class=\"\" href=\"https:\/\/creativecommons.org\/licenses\/by-nd\/2.0\/\" target=\"_new\" rel=\"noopener\" data-start=\"348\" data-end=\"395\" data-is-only-node=\"\">https:\/\/creativecommons.org\/licenses\/by-nd\/2.0\/<\/a><\/figcaption><\/figure>\n<p class=\"no-indent\">Una vez que los datos est\u00e1n guardados en BigTables, se crea un \u00edndice. Similar en idea a los \u00edndices de libros de texto, el \u00edndice de b\u00fasqueda lista tokens y su ubicaci\u00f3n en un documento web. Las estad\u00edsticas muestran cu\u00e1ntas veces ocurre un token en un documento y cu\u00e1n importante es para el documento, etc., y la informaci\u00f3n se posiciona as\u00ed: \u00bfest\u00e1 el token en el t\u00edtulo o un encabezado, est\u00e1 concentrado en una parte del documento y sigue un token siempre a otro?<\/p>\n<p class=\"indent\">Hoy en d\u00eda, muchos motores de b\u00fasqueda usan un modelo basado en lenguaje generado por redes neuronales profundas. Este \u00faltimo codifica detalles sem\u00e1nticos del texto y es responsable de una mejor comprensi\u00f3n de las consultas<sup>3<\/sup>. Las redes neuronales ayudan a los motores de b\u00fasqueda a ir m\u00e1s all\u00e1 de la consulta, para capturar la necesidad de informaci\u00f3n que indujo la consulta en primer lugar.<\/p>\n<p class=\"no-indent\" style=\"text-align: left\">Estos tres pasos dan una cuenta simplificada de lo que se llama \u00abindexaci\u00f3n\u00bb, encontrar, preparar y almacenar documentos y crear el \u00edndice. Los pasos involucrados en \u00abclasificaci\u00f3n\u00bb vienen a continuaci\u00f3n: hacer coincidir la consulta con el contenido y mostrar los resultados seg\u00fan la relevancia.<\/p>\n<figure id=\"attachment_803\" aria-describedby=\"caption-attachment-803\" style=\"width: 463px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-803\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.5-1024x726.jpg\" alt=\"\" width=\"463\" height=\"328\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.5-1024x726.jpg 1024w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.5-300x213.jpg 300w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.5-768x545.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.5-1536x1090.jpg 1536w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.5-2048x1453.jpg 2048w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.5-65x46.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.5-225x160.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-10.5-350x248.jpg 350w\" sizes=\"(max-width: 463px) 100vw, 463px\" \/><figcaption id=\"caption-attachment-803\" class=\"wp-caption-text\">Imagen Telara\u00f1a como met\u00e1fora visual de la red de informaci\u00f3n web. En AI Speak: Search Engine Indexing, de AI for Teachers: an Open Textbook, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0). <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/<\/a><\/figcaption><\/figure>\n<p>&nbsp;<\/p>\n<hr \/>\n<p class=\"hanging-indent\"><sup>1<\/sup> Croft, B., Metzler D., Strohman, T.,<em> Search Engines, Information Retrieval in Practice<\/em>, 2015<\/p>\n<p class=\"hanging-indent\"><sup>2 <\/sup>Sennrich,R., Haddow, B., and Birch, A., <em>Neural Machine Translation of Rare Words with Subword Units,<\/em> In Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 1715\u20131725, Berlin, Germany. Association for Computational Linguistics, 2016.<\/p>\n<p class=\"hanging-indent\"><sup>3<\/sup> <strong data-start=\"44\" data-end=\"93\">Metzler, D., Tay, Y., Bahri, D., &amp; Najork, M.<\/strong> (2021, June). <em data-start=\"108\" data-end=\"169\">Rethinking search: Making domain experts out of dilettantes<\/em>[Opinion paper]. <em data-start=\"187\" data-end=\"204\">SIGIR Forum, 55<\/em>(1), Article\u00a013. <a href=\"https:\/\/doi.org\/10.1145\/3476415.3476428\">https:\/\/doi.org\/10.1145\/3476415.3476428<\/a><\/p>\n","protected":false},"author":3,"menu_order":4,"template":"","meta":{"pb_show_title":"on","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[],"contributor":[],"license":[],"part":45,"_links":{"self":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters\/65"}],"collection":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/users\/3"}],"version-history":[{"count":19,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters\/65\/revisions"}],"predecessor-version":[{"id":812,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters\/65\/revisions\/812"}],"part":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/parts\/45"}],"metadata":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters\/65\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/media?parent=65"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapter-type?post=65"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/contributor?post=65"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/license?post=65"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}