{"id":71,"date":"2024-02-28T21:41:00","date_gmt":"2024-02-28T21:41:00","guid":{"rendered":"https:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/chapter\/ai-speak-search-engine-ranking\/"},"modified":"2025-06-25T09:09:24","modified_gmt":"2025-06-25T09:09:24","slug":"ai-speak-search-engine-ranking","status":"publish","type":"chapter","link":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/chapter\/ai-speak-search-engine-ranking\/","title":{"raw":"Habla de IA: clasificaci\u00f3n de motores de b\u00fasqueda","rendered":"Habla de IA: clasificaci\u00f3n de motores de b\u00fasqueda"},"content":{"raw":"<p class=\"no-indent\">En comparaci\u00f3n con los motores de b\u00fasqueda de principios de los 2000, los motores de b\u00fasqueda actuales realizan an\u00e1lisis m\u00e1s ricos y profundos. Por ejemplo, adem\u00e1s de contar palabras, pueden analizar y comparar el significado detr\u00e1s de las palabras<sup>1<\/sup>. Gran parte de esta riqueza ocurre en el proceso de clasificaci\u00f3n:<\/p>\r\n\r\n\r\n[caption id=\"attachment_828\" align=\"aligncenter\" width=\"455\"]<img class=\"wp-image-828\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.1-1024x726.jpg\" alt=\"\" width=\"455\" height=\"322\" \/> Imagen Telara\u00f1a como met\u00e1fora visual del rastreador en de informaci\u00f3n web. En AI Speak: Search Engine Indexing, de AI for Teachers: an Open Textbook, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0). https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/[\/caption]\r\n\r\n&nbsp;\r\n<h3 style=\"text-align: left\">Paso 4: Los t\u00e9rminos de consulta se emparejan con t\u00e9rminos del \u00edndice<\/h3>\r\n[caption id=\"attachment_67\" align=\"alignleft\" width=\"359\"]<img class=\"wp-image-67 \" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-5-supercali-1024x683.png\" alt=\"\" width=\"359\" height=\"239\" \/> Fuente: <a href=\"https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html\">https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html<\/a>, Un Sistema de Tokenizaci\u00f3n WordPiece R\u00e1pido, Por Xinying Song y Denny Zhou y \"Plato Vintage de Mary Poppins de Disney por Sun Valley Melmac\" por GranniesKitchen. Licencia CC BY 2.0. Para ver una copia de esta licencia, visite <a href=\"https:\/\/creativecommons.org\/licenses\/by\/2.0\/\">https:\/\/creativecommons.org\/licenses\/by\/2.0\/<\/a>?[\/caption]\r\n<p class=\"no-indent\">Una vez que el usuario escribe la consulta y hace clic en buscar, la consulta se procesa. Se crean tokens usando el mismo proceso que el texto del documento. Luego, la consulta puede expandirse agregando otras palabras clave. Esto es para evitar la situaci\u00f3n en la que no se encuentran documentos relevantes porque la consulta usa palabras que son ligeramente diferentes a las de los autores del contenido web. Esto tambi\u00e9n se hace para capturar diferencias en la costumbre y el uso. Por ejemplo, el uso de palabras como presidente, primer ministro y canciller puede intercambiarse, dependiendo del pa\u00eds<sup>1<\/sup>.<\/p>\r\n<p class=\"indent\">La mayor\u00eda de los motores de b\u00fasqueda mantienen un registro de las b\u00fasquedas de los usuarios (Mire la <a href=\"https:\/\/es.wikipedia.org\/wiki\/Motor_de_b\u00fasqueda\">descripci\u00f3n de motores de b\u00fasqueda<\/a> populares para aprender m\u00e1s). Las consultas se registran con los datos del usuario para personalizar el contenido y servir anuncios. O, los registros de todos los usuarios se juntan para ver c\u00f3mo y d\u00f3nde mejorar el rendimiento del motor de b\u00fasqueda.<\/p>\r\n<p class=\"indent\">Los registros de usuario contienen elementos como consultas pasadas, la p\u00e1gina de resultados e informaci\u00f3n sobre lo que funcion\u00f3. Por ejemplo, \u00bfen qu\u00e9 hizo clic el usuario y qu\u00e9 se tom\u00f3 su tiempo para leer? Con los registros de usuario, cada consulta se puede emparejar con documentos relevantes (el usuario hace clic, lee y cierra sesi\u00f3n) y documentos no relevantes (el usuario no hizo clic o no ley\u00f3 o intent\u00f3 reformular la consulta)<sup>2<\/sup>.<\/p>\r\n<p class=\"indent\">Con estos registros, cada nueva consulta se puede emparejar con una consulta pasada similar. Una forma de averiguar si una consulta es similar a otra, es verificar si la clasificaci\u00f3n arroja los mismos documentos. Las consultas similares no siempre contienen las mismas palabras, pero los resultados probablemente sean id\u00e9nticos<sup>2<\/sup>.<\/p>\r\n<p class=\"indent\">Se a\u00f1ade ortograf\u00eda para expandir la consulta. Esto se hace mirando otras palabras que ocurren frecuentemente en documentos relevantes del pasado. En general, sin embargo, las palabras que ocurren m\u00e1s frecuentemente en los documentos relevantes que en los documentos no relevantes se a\u00f1aden a la consulta o se les da un peso adicional<sup>2<\/sup>.<\/p>\r\n\r\n<h3 style=\"text-align: left\">Paso 5: los documentos relevantes se clasifican<\/h3>\r\n<p class=\"no-indent\">Cada documento se punt\u00faa por relevancia y se clasifica seg\u00fan esta puntuaci\u00f3n. La relevancia aqu\u00ed es tanto la relevancia del tema \u2013cu\u00e1n bien los t\u00e9rminos del \u00edndice de un documento coinciden con los de la consulta, como la relevancia para el usuario\u2013 cu\u00e1n bien coincide con las preferencias del usuario. Parte de la puntuaci\u00f3n del documento se puede hacer durante la indexaci\u00f3n. La velocidad del motor de b\u00fasqueda depende de la calidad de los \u00edndices. Su efectividad se basa en c\u00f3mo se empareja la consulta con el documento as\u00ed como en el sistema de clasificaci\u00f3n<sup>2<\/sup>.<\/p>\r\n&nbsp;\r\n\r\n[caption id=\"attachment_831\" align=\"alignleft\" width=\"274\"]<img class=\"wp-image-831\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-11.3-576x1024.jpg\" alt=\"\" width=\"274\" height=\"487\" \/> Imagen Algunas caracter\u00edstica consideradas para la clasificaci\u00f3n En AI Speak: Search Engine Indexing, de AI for Teachers: an Open Textbook, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0). https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/[\/caption]\r\n<p class=\"indent\">La relevancia para el usuario se mide creando modelos de usuario (o tipos de personalidad), basados en sus t\u00e9rminos de b\u00fasqueda anteriores, sitios visitados, mensajes de correo electr\u00f3nico, el dispositivo que est\u00e1n usando, idioma y ubicaci\u00f3n geogr\u00e1fica.\u00a0 <a href=\"https:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/chapter\/cookies-y-huella-digital\/\">Cookies<\/a> se utilizan para almacenar las preferencias del usuario. Algunos motores de b\u00fasqueda tambi\u00e9n compran informaci\u00f3n del usuario de terceros (podr\u00eda referirse a <a href=\"https:\/\/es.wikipedia.org\/wiki\/Motor_de_b\u00fasqueda\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">descripciones de algunos motores de b\u00fasqueda<\/a>). Si una persona est\u00e1 interesada en el f\u00fatbol, sus resultados para \"Manchester\" ser\u00e1n diferentes de la persona que acaba de reservar un vuelo a Londres. Las palabras que ocurren frecuentemente en los documentos asociados con una persona se les dar\u00e1 la mayor importancia.<\/p>\r\n<p class=\"indent\">Los motores de b\u00fasqueda comerciales incorporan cientos de caracter\u00edsticas en sus algoritmos de clasificaci\u00f3n; muchas derivadas de la enorme colecci\u00f3n de datos de interacci\u00f3n del usuario en los registros de consultas. Una funci\u00f3n de clasificaci\u00f3n combina el documento, la consulta y las caracter\u00edsticas de relevancia del usuario. Cualquiera que sea la funci\u00f3n de clasificaci\u00f3n utilizada, tendr\u00eda una base matem\u00e1tica s\u00f3lida. El resultado es la probabilidad de que un documento satisfaga la necesidad de informaci\u00f3n del usuario. Por encima de cierta probabilidad de relevancia, el documento se clasifica como relevante<sup>2<\/sup>.<\/p>\r\n<p class=\"indent\">El aprendizaje autom\u00e1tico se utiliza para aprender sobre la clasificaci\u00f3n basada en la retroalimentaci\u00f3n impl\u00edcita del usuario en los registros (es decir, lo que funcion\u00f3 en consultas anteriores). El aprendizaje autom\u00e1tico tambi\u00e9n se ha utilizado para desarrollar modelos sofisticados de c\u00f3mo los humanos usan el lenguaje; esto se utiliza para descifrar consultas<sup>1,2<\/sup>.<\/p>\r\n\r\n\r\n[caption id=\"attachment_833\" align=\"aligncenter\" width=\"401\"]<img class=\"wp-image-833\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.4-1024x858.jpg\" alt=\"\" width=\"401\" height=\"336\" \/> Imagen Clasificaci\u00f3n aprendizaje autom\u00e1tico. En AI Speak: Search Engine Indexing, de AI for Teachers: an Open Textbook, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0). https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/[\/caption]\r\n<p class=\"no-indent\" style=\"text-align: left\">Los avances en la b\u00fasqueda web han sido extraordinarios en la \u00faltima d\u00e9cada. Sin embargo, cuando se refiere a entender el contexto para una consulta espec\u00edfica, no hay sustituto para que el usuario proporcione una mejor consulta. T\u00edpicamente, las mejores consultas provienen de usuarios que examinan resultados y reformulan la consulta<sup>2<\/sup>.<\/p>\r\n\r\n<h3 style=\"text-align: left\">Paso 6: se muestran los resultados<\/h3>\r\n[caption id=\"attachment_70\" align=\"alignleft\" width=\"337\"]<img class=\"wp-image-70 \" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/che-page-5-search-results-1024x819.png\" alt=\"\" width=\"337\" height=\"269\" \/> <em data-start=\"182\" data-end=\"216\">DuckDuckGo Gumshoe, por <\/em>Jrbrusseau. (s.f.). Licencia CC BY-SA 2.0. <a class=\"\" href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse\" target=\"_new\" rel=\"noopener\" data-start=\"261\" data-end=\"322\">https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse<\/a>[\/caption]\r\n\r\nLos resultados est\u00e1n listos. Se muestra el t\u00edtulo de la p\u00e1gina y la url, con los t\u00e9rminos de consulta en negrita. Se genera y muestra un breve resumen despu\u00e9s de cada enlace. El resumen destaca pasajes importantes en el documento.\r\n<p class=\"indent\">En este sentido, se toman oraciones de encabezados, descripci\u00f3n de metadatos o de texto que mejor corresponde con la consulta. Si todos los t\u00e9rminos de consulta aparecen en el t\u00edtulo, no se repetir\u00e1n en el fragmento<sup>2<\/sup>. Las oraciones tambi\u00e9n se seleccionan en funci\u00f3n de cu\u00e1n legibles son.<\/p>\r\n<p class=\"indent\">Se a\u00f1ade publicidad apropiada a los resultados. Los motores de b\u00fasqueda generan ingresos a trav\u00e9s de anuncios. En algunos motores de b\u00fasqueda, est\u00e1n claramente marcados como contenido patrocinado, mientras que en otros no lo est\u00e1n. Dado que muchos usuarios solo miran los primeros resultados, los anuncios pueden cambiar el proceso sustancialmente.<\/p>\r\n<p class=\"indent\">Los anuncios se eligen seg\u00fan el contexto de la consulta y el modelo de usuario. Las compa\u00f1\u00edas de motores de b\u00fasqueda mantienen una base de datos de anuncios. Esta base de datos se busca para encontrar los anuncios m\u00e1s relevantes para una consulta dada. Los anunciantes compiten por palabras clave que describen temas asociados con su producto. Tanto el monto de la competencia como la popularidad de un anuncio son factores significativos en el proceso de selecci\u00f3n<sup>2<\/sup>.<\/p>\r\n<p class=\"indent\">Para preguntas sobre hechos, algunos motores usan su propia colecci\u00f3n de hechos. La B\u00f3veda de Conocimiento de Google contiene m\u00e1s de mil millones de hechos indexados de diferentes fuentes<sup>3<\/sup>. Los resultados se agrupan por algoritmos de aprendizaje autom\u00e1tico en grupos apropiados. Finalmente, al usuario tambi\u00e9n se le presentan alternativas a la consulta para ver si son mejores.<\/p>\r\n\r\n<h3 style=\"text-align: left\">Algunas referencias<\/h3>\r\n<p class=\"no-indent\">El origen de Google se puede encontrar en <a href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\">el art\u00edculo original de Brin y Page. <\/a>Algunas de las matem\u00e1ticas detr\u00e1s de PageRank est\u00e1n en <a href=\"https:\/\/es.wikipedia.org\/wiki\/PageRank\">PageRank de Wiki<\/a>. Para los matem\u00e1ticamente inclinados, aqu\u00ed hay <a href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af \" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af \">una buena explicaci\u00f3n de PageRank<\/a>.<\/p>\r\n&nbsp;\r\n\r\n<hr \/>\r\n<p class=\"hanging-indent\"><sup>1<\/sup> <strong data-start=\"0\" data-end=\"18\" data-is-only-node=\"\">Russell, D. M.<\/strong> (2015). <em data-start=\"27\" data-end=\"120\">What do you need to know to use a search engine? Why we still need to teach research skills<\/em>. <em data-start=\"122\" data-end=\"139\">AI Magazine, 36<\/em>(4), 61\u201370. <a href=\"https:\/\/doi.org\/10.1609\/aimag.v36i4.2617\" target=\"_new\" rel=\"noopener noreferrer\" data-start=\"151\" data-end=\"191\" data-is-last-node=\"\">https:\/\/doi.org\/10.1609\/aimag.v36i4.2617<\/a><\/p>\r\n<p class=\"hanging-indent\"><sup>2 <span class=\"relative -mx-px my-[-0.2rem] rounded px-px py-[0.2rem] transition-colors duration-100 ease-in-out\"><strong data-start=\"0\" data-end=\"45\" data-is-only-node=\"\">Croft, W. B., Metzler, D., &amp; Strohman, T.<\/strong> (2015). <em data-start=\"54\" data-end=\"105\">Search engines: Information retrieval in practice<\/em>. Pearson. [Versi\u00f3n gratuita disponible en PDF] <a href=\"https:\/\/ciir.cs.umass.edu\/irbook\/\" target=\"_new\" rel=\"noopener noreferrer\" data-start=\"153\" data-end=\"186\" data-is-last-node=\"\">https:\/\/ciir.cs.umass.edu\/irbook\/<\/a><\/span><\/sup><\/p>\r\n<p class=\"hanging-indent\"><sup>3<\/sup> <span class=\"relative -mx-px my-[-0.2rem] rounded px-px py-[0.2rem] transition-colors duration-100 ease-in-out\"><strong data-start=\"0\" data-end=\"15\" data-is-only-node=\"\">Spencer, S.<\/strong> (2021). <em data-start=\"24\" data-end=\"105\">Google Power Search: The essential guide to finding anything online with Google<\/em> [Kindle edition]. Koshkonong. <a href=\"https:\/\/www.amazon.com\/dp\/B09BHTN8QB\" target=\"_new\" rel=\"noopener noreferrer\" data-start=\"136\" data-end=\"172\" data-is-last-node=\"\">https:\/\/www.amazon.com\/dp\/B09BHTN8QB<\/a><\/span><\/p>","rendered":"<p class=\"no-indent\">En comparaci\u00f3n con los motores de b\u00fasqueda de principios de los 2000, los motores de b\u00fasqueda actuales realizan an\u00e1lisis m\u00e1s ricos y profundos. Por ejemplo, adem\u00e1s de contar palabras, pueden analizar y comparar el significado detr\u00e1s de las palabras<sup>1<\/sup>. Gran parte de esta riqueza ocurre en el proceso de clasificaci\u00f3n:<\/p>\n<figure id=\"attachment_828\" aria-describedby=\"caption-attachment-828\" style=\"width: 455px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-828\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.1-1024x726.jpg\" alt=\"\" width=\"455\" height=\"322\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.1-1024x726.jpg 1024w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.1-300x213.jpg 300w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.1-768x545.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.1-1536x1090.jpg 1536w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.1-2048x1453.jpg 2048w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.1-65x46.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.1-225x160.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.1-350x248.jpg 350w\" sizes=\"(max-width: 455px) 100vw, 455px\" \/><figcaption id=\"caption-attachment-828\" class=\"wp-caption-text\">Imagen Telara\u00f1a como met\u00e1fora visual del rastreador en de informaci\u00f3n web. En AI Speak: Search Engine Indexing, de AI for Teachers: an Open Textbook, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0). https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/<\/figcaption><\/figure>\n<p>&nbsp;<\/p>\n<h3 style=\"text-align: left\">Paso 4: Los t\u00e9rminos de consulta se emparejan con t\u00e9rminos del \u00edndice<\/h3>\n<figure id=\"attachment_67\" aria-describedby=\"caption-attachment-67\" style=\"width: 359px\" class=\"wp-caption alignleft\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-67\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-5-supercali-1024x683.png\" alt=\"\" width=\"359\" height=\"239\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-5-supercali-1024x683.png 1024w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-5-supercali-300x200.png 300w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-5-supercali-768x512.png 768w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-5-supercali-1536x1024.png 1536w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-5-supercali-65x43.png 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-5-supercali-225x150.png 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-5-supercali-350x233.png 350w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ch2-page-5-supercali.png 1800w\" sizes=\"(max-width: 359px) 100vw, 359px\" \/><figcaption id=\"caption-attachment-67\" class=\"wp-caption-text\">Fuente: <a href=\"https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html\">https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html<\/a>, Un Sistema de Tokenizaci\u00f3n WordPiece R\u00e1pido, Por Xinying Song y Denny Zhou y \u00abPlato Vintage de Mary Poppins de Disney por Sun Valley Melmac\u00bb por GranniesKitchen. Licencia CC BY 2.0. Para ver una copia de esta licencia, visite <a href=\"https:\/\/creativecommons.org\/licenses\/by\/2.0\/\">https:\/\/creativecommons.org\/licenses\/by\/2.0\/<\/a>?<\/figcaption><\/figure>\n<p class=\"no-indent\">Una vez que el usuario escribe la consulta y hace clic en buscar, la consulta se procesa. Se crean tokens usando el mismo proceso que el texto del documento. Luego, la consulta puede expandirse agregando otras palabras clave. Esto es para evitar la situaci\u00f3n en la que no se encuentran documentos relevantes porque la consulta usa palabras que son ligeramente diferentes a las de los autores del contenido web. Esto tambi\u00e9n se hace para capturar diferencias en la costumbre y el uso. Por ejemplo, el uso de palabras como presidente, primer ministro y canciller puede intercambiarse, dependiendo del pa\u00eds<sup>1<\/sup>.<\/p>\n<p class=\"indent\">La mayor\u00eda de los motores de b\u00fasqueda mantienen un registro de las b\u00fasquedas de los usuarios (Mire la <a href=\"https:\/\/es.wikipedia.org\/wiki\/Motor_de_b\u00fasqueda\">descripci\u00f3n de motores de b\u00fasqueda<\/a> populares para aprender m\u00e1s). Las consultas se registran con los datos del usuario para personalizar el contenido y servir anuncios. O, los registros de todos los usuarios se juntan para ver c\u00f3mo y d\u00f3nde mejorar el rendimiento del motor de b\u00fasqueda.<\/p>\n<p class=\"indent\">Los registros de usuario contienen elementos como consultas pasadas, la p\u00e1gina de resultados e informaci\u00f3n sobre lo que funcion\u00f3. Por ejemplo, \u00bfen qu\u00e9 hizo clic el usuario y qu\u00e9 se tom\u00f3 su tiempo para leer? Con los registros de usuario, cada consulta se puede emparejar con documentos relevantes (el usuario hace clic, lee y cierra sesi\u00f3n) y documentos no relevantes (el usuario no hizo clic o no ley\u00f3 o intent\u00f3 reformular la consulta)<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Con estos registros, cada nueva consulta se puede emparejar con una consulta pasada similar. Una forma de averiguar si una consulta es similar a otra, es verificar si la clasificaci\u00f3n arroja los mismos documentos. Las consultas similares no siempre contienen las mismas palabras, pero los resultados probablemente sean id\u00e9nticos<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Se a\u00f1ade ortograf\u00eda para expandir la consulta. Esto se hace mirando otras palabras que ocurren frecuentemente en documentos relevantes del pasado. En general, sin embargo, las palabras que ocurren m\u00e1s frecuentemente en los documentos relevantes que en los documentos no relevantes se a\u00f1aden a la consulta o se les da un peso adicional<sup>2<\/sup>.<\/p>\n<h3 style=\"text-align: left\">Paso 5: los documentos relevantes se clasifican<\/h3>\n<p class=\"no-indent\">Cada documento se punt\u00faa por relevancia y se clasifica seg\u00fan esta puntuaci\u00f3n. La relevancia aqu\u00ed es tanto la relevancia del tema \u2013cu\u00e1n bien los t\u00e9rminos del \u00edndice de un documento coinciden con los de la consulta, como la relevancia para el usuario\u2013 cu\u00e1n bien coincide con las preferencias del usuario. Parte de la puntuaci\u00f3n del documento se puede hacer durante la indexaci\u00f3n. La velocidad del motor de b\u00fasqueda depende de la calidad de los \u00edndices. Su efectividad se basa en c\u00f3mo se empareja la consulta con el documento as\u00ed como en el sistema de clasificaci\u00f3n<sup>2<\/sup>.<\/p>\n<p>&nbsp;<\/p>\n<figure id=\"attachment_831\" aria-describedby=\"caption-attachment-831\" style=\"width: 274px\" class=\"wp-caption alignleft\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-831\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-11.3-576x1024.jpg\" alt=\"\" width=\"274\" height=\"487\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-11.3-576x1024.jpg 576w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-11.3-169x300.jpg 169w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-11.3-768x1365.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-11.3-864x1536.jpg 864w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-11.3-1152x2048.jpg 1152w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-11.3-65x116.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-11.3-225x400.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-11.3-350x622.jpg 350w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/Espanol-EN-11.3-scaled.jpg 1440w\" sizes=\"(max-width: 274px) 100vw, 274px\" \/><figcaption id=\"caption-attachment-831\" class=\"wp-caption-text\">Imagen Algunas caracter\u00edstica consideradas para la clasificaci\u00f3n En AI Speak: Search Engine Indexing, de AI for Teachers: an Open Textbook, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0). https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/<\/figcaption><\/figure>\n<p class=\"indent\">La relevancia para el usuario se mide creando modelos de usuario (o tipos de personalidad), basados en sus t\u00e9rminos de b\u00fasqueda anteriores, sitios visitados, mensajes de correo electr\u00f3nico, el dispositivo que est\u00e1n usando, idioma y ubicaci\u00f3n geogr\u00e1fica.\u00a0 <a href=\"https:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/chapter\/cookies-y-huella-digital\/\">Cookies<\/a> se utilizan para almacenar las preferencias del usuario. Algunos motores de b\u00fasqueda tambi\u00e9n compran informaci\u00f3n del usuario de terceros (podr\u00eda referirse a <a href=\"https:\/\/es.wikipedia.org\/wiki\/Motor_de_b\u00fasqueda\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">descripciones de algunos motores de b\u00fasqueda<\/a>). Si una persona est\u00e1 interesada en el f\u00fatbol, sus resultados para \u00abManchester\u00bb ser\u00e1n diferentes de la persona que acaba de reservar un vuelo a Londres. Las palabras que ocurren frecuentemente en los documentos asociados con una persona se les dar\u00e1 la mayor importancia.<\/p>\n<p class=\"indent\">Los motores de b\u00fasqueda comerciales incorporan cientos de caracter\u00edsticas en sus algoritmos de clasificaci\u00f3n; muchas derivadas de la enorme colecci\u00f3n de datos de interacci\u00f3n del usuario en los registros de consultas. Una funci\u00f3n de clasificaci\u00f3n combina el documento, la consulta y las caracter\u00edsticas de relevancia del usuario. Cualquiera que sea la funci\u00f3n de clasificaci\u00f3n utilizada, tendr\u00eda una base matem\u00e1tica s\u00f3lida. El resultado es la probabilidad de que un documento satisfaga la necesidad de informaci\u00f3n del usuario. Por encima de cierta probabilidad de relevancia, el documento se clasifica como relevante<sup>2<\/sup>.<\/p>\n<p class=\"indent\">El aprendizaje autom\u00e1tico se utiliza para aprender sobre la clasificaci\u00f3n basada en la retroalimentaci\u00f3n impl\u00edcita del usuario en los registros (es decir, lo que funcion\u00f3 en consultas anteriores). El aprendizaje autom\u00e1tico tambi\u00e9n se ha utilizado para desarrollar modelos sofisticados de c\u00f3mo los humanos usan el lenguaje; esto se utiliza para descifrar consultas<sup>1,2<\/sup>.<\/p>\n<figure id=\"attachment_833\" aria-describedby=\"caption-attachment-833\" style=\"width: 401px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-833\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.4-1024x858.jpg\" alt=\"\" width=\"401\" height=\"336\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.4-1024x858.jpg 1024w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.4-300x251.jpg 300w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.4-768x644.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.4-1536x1288.jpg 1536w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.4-65x54.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.4-225x189.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.4-350x293.jpg 350w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/ES-11.4.jpg 1645w\" sizes=\"(max-width: 401px) 100vw, 401px\" \/><figcaption id=\"caption-attachment-833\" class=\"wp-caption-text\">Imagen Clasificaci\u00f3n aprendizaje autom\u00e1tico. En AI Speak: Search Engine Indexing, de AI for Teachers: an Open Textbook, traducido al espa\u00f1ol por Rodriguez Enr\u00edquez. Licencia Creative Commons Atribuci\u00f3n\u2013CompartirIgual 4.0 Internacional (CC BY-SA 4.0). https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/<\/figcaption><\/figure>\n<p class=\"no-indent\" style=\"text-align: left\">Los avances en la b\u00fasqueda web han sido extraordinarios en la \u00faltima d\u00e9cada. Sin embargo, cuando se refiere a entender el contexto para una consulta espec\u00edfica, no hay sustituto para que el usuario proporcione una mejor consulta. T\u00edpicamente, las mejores consultas provienen de usuarios que examinan resultados y reformulan la consulta<sup>2<\/sup>.<\/p>\n<h3 style=\"text-align: left\">Paso 6: se muestran los resultados<\/h3>\n<figure id=\"attachment_70\" aria-describedby=\"caption-attachment-70\" style=\"width: 337px\" class=\"wp-caption alignleft\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-70\" src=\"http:\/\/aiopentext.itd.cnr.it\/spanishwithchatgpt\/wp-content\/uploads\/sites\/20\/2024\/02\/che-page-5-search-results-1024x819.png\" alt=\"\" width=\"337\" height=\"269\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/che-page-5-search-results-1024x819.png 1024w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/che-page-5-search-results-300x240.png 300w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/che-page-5-search-results-768x614.png 768w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/che-page-5-search-results-65x52.png 65w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/che-page-5-search-results-225x180.png 225w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/che-page-5-search-results-350x280.png 350w, https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-content\/uploads\/sites\/20\/2024\/02\/che-page-5-search-results.png 1280w\" sizes=\"(max-width: 337px) 100vw, 337px\" \/><figcaption id=\"caption-attachment-70\" class=\"wp-caption-text\"><em data-start=\"182\" data-end=\"216\">DuckDuckGo Gumshoe, por <\/em>Jrbrusseau. (s.f.). Licencia CC BY-SA 2.0. <a class=\"\" href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse\" target=\"_new\" rel=\"noopener\" data-start=\"261\" data-end=\"322\">https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse<\/a><\/figcaption><\/figure>\n<p>Los resultados est\u00e1n listos. Se muestra el t\u00edtulo de la p\u00e1gina y la url, con los t\u00e9rminos de consulta en negrita. Se genera y muestra un breve resumen despu\u00e9s de cada enlace. El resumen destaca pasajes importantes en el documento.<\/p>\n<p class=\"indent\">En este sentido, se toman oraciones de encabezados, descripci\u00f3n de metadatos o de texto que mejor corresponde con la consulta. Si todos los t\u00e9rminos de consulta aparecen en el t\u00edtulo, no se repetir\u00e1n en el fragmento<sup>2<\/sup>. Las oraciones tambi\u00e9n se seleccionan en funci\u00f3n de cu\u00e1n legibles son.<\/p>\n<p class=\"indent\">Se a\u00f1ade publicidad apropiada a los resultados. Los motores de b\u00fasqueda generan ingresos a trav\u00e9s de anuncios. En algunos motores de b\u00fasqueda, est\u00e1n claramente marcados como contenido patrocinado, mientras que en otros no lo est\u00e1n. Dado que muchos usuarios solo miran los primeros resultados, los anuncios pueden cambiar el proceso sustancialmente.<\/p>\n<p class=\"indent\">Los anuncios se eligen seg\u00fan el contexto de la consulta y el modelo de usuario. Las compa\u00f1\u00edas de motores de b\u00fasqueda mantienen una base de datos de anuncios. Esta base de datos se busca para encontrar los anuncios m\u00e1s relevantes para una consulta dada. Los anunciantes compiten por palabras clave que describen temas asociados con su producto. Tanto el monto de la competencia como la popularidad de un anuncio son factores significativos en el proceso de selecci\u00f3n<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Para preguntas sobre hechos, algunos motores usan su propia colecci\u00f3n de hechos. La B\u00f3veda de Conocimiento de Google contiene m\u00e1s de mil millones de hechos indexados de diferentes fuentes<sup>3<\/sup>. Los resultados se agrupan por algoritmos de aprendizaje autom\u00e1tico en grupos apropiados. Finalmente, al usuario tambi\u00e9n se le presentan alternativas a la consulta para ver si son mejores.<\/p>\n<h3 style=\"text-align: left\">Algunas referencias<\/h3>\n<p class=\"no-indent\">El origen de Google se puede encontrar en <a href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\">el art\u00edculo original de Brin y Page. <\/a>Algunas de las matem\u00e1ticas detr\u00e1s de PageRank est\u00e1n en <a href=\"https:\/\/es.wikipedia.org\/wiki\/PageRank\">PageRank de Wiki<\/a>. Para los matem\u00e1ticamente inclinados, aqu\u00ed hay <a href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\">una buena explicaci\u00f3n de PageRank<\/a>.<\/p>\n<p>&nbsp;<\/p>\n<hr \/>\n<p class=\"hanging-indent\"><sup>1<\/sup> <strong data-start=\"0\" data-end=\"18\" data-is-only-node=\"\">Russell, D. M.<\/strong> (2015). <em data-start=\"27\" data-end=\"120\">What do you need to know to use a search engine? Why we still need to teach research skills<\/em>. <em data-start=\"122\" data-end=\"139\">AI Magazine, 36<\/em>(4), 61\u201370. <a href=\"https:\/\/doi.org\/10.1609\/aimag.v36i4.2617\" target=\"_new\" rel=\"noopener noreferrer\" data-start=\"151\" data-end=\"191\" data-is-last-node=\"\">https:\/\/doi.org\/10.1609\/aimag.v36i4.2617<\/a><\/p>\n<p class=\"hanging-indent\"><sup>2 <span class=\"relative -mx-px my-[-0.2rem] rounded px-px py-[0.2rem] transition-colors duration-100 ease-in-out\"><strong data-start=\"0\" data-end=\"45\" data-is-only-node=\"\">Croft, W. B., Metzler, D., &amp; Strohman, T.<\/strong> (2015). <em data-start=\"54\" data-end=\"105\">Search engines: Information retrieval in practice<\/em>. Pearson. [Versi\u00f3n gratuita disponible en PDF] <a href=\"https:\/\/ciir.cs.umass.edu\/irbook\/\" target=\"_new\" rel=\"noopener noreferrer\" data-start=\"153\" data-end=\"186\" data-is-last-node=\"\">https:\/\/ciir.cs.umass.edu\/irbook\/<\/a><\/span><\/sup><\/p>\n<p class=\"hanging-indent\"><sup>3<\/sup> <span class=\"relative -mx-px my-[-0.2rem] rounded px-px py-[0.2rem] transition-colors duration-100 ease-in-out\"><strong data-start=\"0\" data-end=\"15\" data-is-only-node=\"\">Spencer, S.<\/strong> (2021). <em data-start=\"24\" data-end=\"105\">Google Power Search: The essential guide to finding anything online with Google<\/em> [Kindle edition]. Koshkonong. <a href=\"https:\/\/www.amazon.com\/dp\/B09BHTN8QB\" target=\"_new\" rel=\"noopener noreferrer\" data-start=\"136\" data-end=\"172\" data-is-last-node=\"\">https:\/\/www.amazon.com\/dp\/B09BHTN8QB<\/a><\/span><\/p>\n","protected":false},"author":3,"menu_order":5,"template":"","meta":{"pb_show_title":"on","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[],"contributor":[],"license":[],"part":45,"_links":{"self":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters\/71"}],"collection":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/users\/3"}],"version-history":[{"count":13,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters\/71\/revisions"}],"predecessor-version":[{"id":834,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters\/71\/revisions\/834"}],"part":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/parts\/45"}],"metadata":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapters\/71\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/media?parent=71"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/pressbooks\/v2\/chapter-type?post=71"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/contributor?post=71"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/IAparaprofesores\/wp-json\/wp\/v2\/license?post=71"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}