{"id":75,"date":"2023-11-30T16:29:43","date_gmt":"2023-11-30T16:29:43","guid":{"rendered":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/chapter\/ai-speak-search-engine-ranking\/"},"modified":"2024-01-31T11:50:34","modified_gmt":"2024-01-31T11:50:34","slug":"ai-speak-search-engine-ranking","status":"publish","type":"chapter","link":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/chapter\/ai-speak-search-engine-ranking\/","title":{"raw":"Parlons IA : Classement par les moteurs de recherche","rendered":"Parlons IA : Classement par les moteurs de recherche"},"content":{"raw":"<p class=\"no-indent\">Par rapport aux moteurs de recherche au d\u00e9but des ann\u00e9es 2000, les moteurs de recherche actuels font une analyse plus riche et plus profonde. Par exemple, plus que de compter les mots, ils peuvent analyser et comparer la signification derri\u00e8re les mots<sup>1<\/sup>. Une grande partie de cette richesse se produit dans le processus de classement :<\/p>\n<img class=\" wp-image-70 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-11.1.png\" alt=\"\" width=\"468\" height=\"332\">\n<h3 style=\"text-align: left\">\u00c9tape 4 : Les termes de la requ\u00eate sont associ\u00e9s aux termes de l'index<\/h3>\n[caption id=\"attachment_74\" align=\"alignleft\" width=\"429\"]<img class=\"wp-image-71\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-5-supercali-2.png\" alt=\"\" width=\"429\" height=\"286\"> Source: https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html, A Fast WordPiece Tokenization System, By Xinying Song and Denny Zhou and \"Vintage Disney Mary Poppins Plate by Sun Valley Melmac\" by GranniesKitchen is licenced under CC BY 2.0. To view a copy of this licence, visit <a href=\"https:\/\/creativecommons.org\/licenses\/by\/2.0\/\" target=\"_blank\" rel=\"noopener\">https:\/\/creativecommons.org\/licenses\/by\/2.0\/<\/a>?[\/caption]\n<p class=\"no-indent\">Une fois que l'utilisateur a saisi la requ\u00eate et a cliqu\u00e9 sur le bouton de recherche, la requ\u00eate est trait\u00e9e. Les tokens sont cr\u00e9\u00e9s avec le m\u00eame processus que le texte du document. Ensuite, la requ\u00eate peut \u00eatre \u00e9largie en ajoutant d'autres mots-cl\u00e9s. Cela permet d'\u00e9viter le cas o\u00f9 des documents pertinents ne sont pas trouv\u00e9s parce que la requ\u00eate utilise des mots l\u00e9g\u00e8rement diff\u00e9rents de ceux des auteurs du contenu Web. Ceci est \u00e9galement fait pour prendre en compte les diff\u00e9rences d'usage et de coutume. Par exemple, l'utilisation de mots comme Pr\u00e9sident, Premier ministre et Chancelier peut \u00eatre interchang\u00e9e selon le pays<sup>1<\/sup>.<\/p>\n<p class=\"indent\">La plupart des moteurs de recherche gardent une trace des recherches des utilisateurs (Regardez<a href=\"a-brief-description-of-some-search-engines\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\"> la description de certains moteurs de recherche populaires<\/a> pour en savoir plus). Les requ\u00eates sont enregistr\u00e9es avec les donn\u00e9es de l'utilisateur afin de personnaliser le contenu et de servir des publicit\u00e9s. Ou bien, les enregistrements de tous les utilisateurs sont rassembl\u00e9s pour voir comment et o\u00f9 am\u00e9liorer les performances des moteurs de recherche.<\/p>\n<p class=\"indent\">Les historiques des utilisateurs contiennent les requ\u00eates pr\u00e9c\u00e9dentes, la page de r\u00e9sultats et des informations sur ce qui a fonctionn\u00e9 - ce sur quoi l'utilisateur a cliqu\u00e9 et ce qu'il a pass\u00e9 du temps \u00e0 lire. Avec les historiques des utilisateurs, chaque requ\u00eate peut \u00eatre mise en correspondance avec des documents pertinents (l'utilisateur a cliqu\u00e9, lu et ferm\u00e9 la session) et des documents non pertinents (l'utilisateur n'a pas cliqu\u00e9 ou n'a pas lu ou a essay\u00e9 de reformuler la requ\u00eate)<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Avec ces logs, chaque nouvelle requ\u00eate peut \u00eatre mise en correspondance avec une requ\u00eate pass\u00e9e qui est similaire. Une fa\u00e7on de savoir si une requ\u00eate est similaire \u00e0 une autre est de voir si le classement fait appara\u00eetre les m\u00eames documents : les requ\u00eates similaires ne contiennent pas toujours les m\u00eames mots mais les r\u00e9sultats sont susceptibles d'\u00eatre identiques<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Les fautes d'orthographe peuvent \u00eatre corrig\u00e9es en utilisant des requ\u00eates similaires. De nouveaux mots cl\u00e9s et synonymes peuvent \u00eatre ajout\u00e9s pour \u00e9largir la requ\u00eate. Pour ce faire, on examine d'autres mots qui apparaissent fr\u00e9quemment dans les documents pertinents du pass\u00e9.\u00a0 En g\u00e9n\u00e9ral, cependant, les mots qui apparaissent plus fr\u00e9quemment dans les documents pertinents que dans les documents non pertinents sont ajout\u00e9s \u00e0 la requ\u00eate ou se voient accorder une pond\u00e9ration suppl\u00e9mentaire<sup>2<\/sup>.<\/p>\n\n<h3 style=\"text-align: left\">\u00c9tape 5 : Les documents pertinents sont class\u00e9s<\/h3>\n<p class=\"no-indent\">Chaque document est \u00e9valu\u00e9 pour sa pertinence et class\u00e9 en fonction de ce score. La pertinence est ici \u00e0 la fois la pertinence du sujet - dans quelle mesure les termes d'indexation d'un document correspondent \u00e0 ceux de la requ\u00eate, et la pertinence de l'utilisateur - dans quelle mesure il correspond aux pr\u00e9f\u00e9rences de l'utilisateur. Une partie de cette \u00e9valuation des documents peut \u00eatre effectu\u00e9e pendant l'indexation. La vitesse du moteur de recherche d\u00e9pend de la qualit\u00e9 des index. Son efficacit\u00e9 repose sur la fa\u00e7on dont la requ\u00eate est associ\u00e9e au document et sur le syst\u00e8me de classement<sup>2<\/sup>.<\/p>\n<p class=\"indent\"><img class=\" wp-image-72 alignleft\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.3.png\" alt=\"\" width=\"369\" height=\"656\">La pertinence pour l'utilisateur est d\u00e9termin\u00e9e en cr\u00e9ant des mod\u00e8les d'utilisateurs (ou types de personnalit\u00e9) bas\u00e9s sur leurs anciens termes de recherche, les sites visit\u00e9s, les courriels, l'appareil qu'ils utilisent, leur langue et leur localisation g\u00e9ographique. <a href=\"http-cookies\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http-cookies\">Cookies<\/a> sont utilis\u00e9s pour enregistrer les pr\u00e9f\u00e9rences des utilisateurs. Certains moteurs de recherche ach\u00e8tent \u00e9galement des informations sur les utilisateurs aupr\u00e8s de tiers (voir <a href=\"a-brief-description-of-some-search-engines\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">description de certains moteurs de recherche<\/a>). Si quelqu'un s'int\u00e9resse au football, ses r\u00e9sultats pour \u201cManchester\" ; seront diff\u00e9rents de ceux qui viennent de r\u00e9server un vol pour Londres. Les mots qui apparaissent fr\u00e9quemment dans les documents associ\u00e9s \u00e0 une personne se verront accorder la plus grande importance.<\/p>\n<p class=\"indent\">Les moteurs de recherche web commerciaux int\u00e8grent des centaines de caract\u00e9ristiques dans leurs algorithmes de classement, dont beaucoup proviennent de l'\u00e9norme collection de donn\u00e9es d'interaction des utilisateurs dans les historiques de requ\u00eates. La fonction de classement combine le document, la requ\u00eate et les \u00e9l\u00e9ments de pertinence pour l'utilisateur. Quelle que soit la fonction de classement utilis\u00e9e, elle doit reposer sur une base math\u00e9matique robuste. La sortie est la probabilit\u00e9 qu'un document r\u00e9ponde au besoin de renseignements de l'utilisateur. Au-del\u00e0 d'une certaine probabilit\u00e9 de pertinence, le document est class\u00e9 comme \u00e9tant utile<sup>2<\/sup>.<\/p>\n<p class=\"indent\">L'apprentissage automatique est utilis\u00e9 pour apprendre le classement sur la base des retours implicites des utilisateurs dans les historiques (ce qui a fonctionn\u00e9 dans les requ\u00eates pr\u00e9c\u00e9dentes). L'apprentissage automatique est \u00e9galement utilis\u00e9 pour d\u00e9velopper des mod\u00e8les sophistiqu\u00e9s de la fa\u00e7on dont les humains utilisent le langage avec lesquels il est possible de d\u00e9chiffrer les requ\u00eates<sup>1,2<\/sup>.<\/p>\n<img class=\"wp-image-73 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.4.png\" alt=\"\" width=\"423\" height=\"354\">\n<p class=\"no-indent\">Les progr\u00e8s de la recherche web ont \u00e9t\u00e9 ph\u00e9nom\u00e9naux au cours de la derni\u00e8re d\u00e9cennie. Cependant, lorsqu'il s'agit de comprendre le contexte d'une requ\u00eate sp\u00e9cifique, rien ne remplace l'utilisateur qui fournit une meilleure requ\u00eate. G\u00e9n\u00e9ralement, les meilleures requ\u00eates proviennent des utilisateurs qui examinent les r\u00e9sultats et reformulent la requ\u00eate<sup>2<\/sup>.<\/p>\n\n<h3 style=\"text-align: left\">\u00c9tape 6 : Les r\u00e9sultats sont affich\u00e9s<\/h3>\n[caption id=\"attachment_74\" align=\"alignleft\" width=\"477\"]<img class=\"wp-image-74\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/che-page-5-search-results-2.png\" alt=\"\" width=\"477\" height=\"381\"> \"Gumshoe DuckDuckGo Results\" par jrbrusseauest sous licence CC BY-SA 2.0. Pour voir une copie de cette licence, <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse\">https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse<\/a>.[\/caption]\n<p class=\"no-indent\">Enfin, les r\u00e9sultats sont pr\u00eats \u00e0 \u00eatre affich\u00e9s. Le titre et l'url de la page sont affich\u00e9s, avec les mots de la requ\u00eate en gras. Un court r\u00e9sum\u00e9 est g\u00e9n\u00e9r\u00e9 et affich\u00e9 apr\u00e8s chaque lien. Le r\u00e9sum\u00e9 met en \u00e9vidence les passages importants du document. Pour cela, des phrases sont utilis\u00e9es \u00e0 partir des titres, de la description des m\u00e9tadonn\u00e9es ou du texte qui correspond le mieux \u00e0 la requ\u00eate. Si tous les termes de la requ\u00eate apparaissent dans le titre, ils ne sont pas r\u00e9p\u00e9t\u00e9s dans le r\u00e9sum\u00e9<sup>2<\/sup>. Les phrases sont \u00e9galement s\u00e9lectionn\u00e9es en fonction de leur lisibilit\u00e9.<\/p>\n<p class=\"indent\">Des publicit\u00e9s appropri\u00e9es sont ajout\u00e9es aux r\u00e9sultats. La publicit\u00e9 est la fa\u00e7on dont la plupart des moteurs de recherche g\u00e9n\u00e8rent des revenus. Dans certains moteurs de recherche, elles sont clairement marqu\u00e9es comme contenu sponsoris\u00e9, alors que dans d'autres, elles ne le sont pas. \u00c9tant donn\u00e9 que de nombreux utilisateurs ne regardent que les premiers r\u00e9sultats, les publicit\u00e9s apportent un changement substantiel \u00e0 la totalit\u00e9 du parcours.<\/p>\n<p class=\"indent\">Les publicit\u00e9s sont choisies en fonction du contexte de la requ\u00eate et du mod\u00e8le d'utilisateur. Les fabricants de moteurs de recherche maintiennent une base de donn\u00e9es d'annonces qu'ils utilisent pour trouver les annonces les plus pertinentes pour une requ\u00eate donn\u00e9e. Les annonceurs ench\u00e9rissent pour des mots-cl\u00e9s qui d\u00e9crivent des sujets associ\u00e9s \u00e0 leur produit. Le montant de l'ench\u00e8re et la popularit\u00e9 d'une annonce sont des facteurs importants dans le processus de s\u00e9lection<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Pour les questions sur les faits, certains moteurs utilisent leur propre collection de faits. Le Knowledge Vault de Google contient plus d'un milliard de faits index\u00e9s \u00e0 partir de diff\u00e9rentes sources<sup>3<\/sup>. Les r\u00e9sultats sont regroup\u00e9s par des algorithmes d'apprentissage automatique dans des groupes appropri\u00e9s. Enfin, des alternatives \u00e0 la requ\u00eate sont \u00e9galement pr\u00e9sent\u00e9es \u00e0 l'utilisateur pour voir si elles correspondent mieux \u00e0 son besoin r\u00e9el.<\/p>\n\n<h3 style=\"text-align: left\">Quelques r\u00e9f\u00e9rences :<\/h3>\n<p class=\"no-indent\">L'origine de Google peut \u00eatre consult\u00e9e dans <a href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\">l'article original de Brin et Paige ;<\/a>\nCertaines des math\u00e9matiques derri\u00e8re le Pagerank se trouvent sur <a href=\"https:\/\/fr.wikipedia.org\/wiki\/PageRank\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/fr.wikipedia.org\/wiki\/PageRank\">Wiki's PageRank<\/a> ;\nPour les esprits matheux, <a href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\">une belle explication du Pagerank<\/a>.<\/p>\n\n\n<hr>\n<p class=\"hanging-indent\"><sup>1<\/sup> Russell, D., <em>What Do You Need to Know to Use a Search Engine? Why We Still Need to Teach Research Skills<\/em>, AI Magazine, 36(4), 2015.<\/p>\n<p class=\"hanging-indent\"><sup>2 <\/sup>Croft, B., Metzler D., Strohman, T.,<em> Search Engines, Information Retrieval in Practice<\/em>, 2015.<\/p>\n<p class=\"hanging-indent\"><sup>3<\/sup> Spencer, S., <em>Google Power Search: The Essential Guide to Finding Anything Online With Google<\/em>, Koshkonong, Kindle Edition.<\/p>","rendered":"<p class=\"no-indent\">Par rapport aux moteurs de recherche au d\u00e9but des ann\u00e9es 2000, les moteurs de recherche actuels font une analyse plus riche et plus profonde. Par exemple, plus que de compter les mots, ils peuvent analyser et comparer la signification derri\u00e8re les mots<sup>1<\/sup>. Une grande partie de cette richesse se produit dans le processus de classement :<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-70 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-11.1.png\" alt=\"\" width=\"468\" height=\"332\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-11.1.png 1748w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-11.1-300x213.png 300w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-11.1-1024x726.png 1024w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-11.1-768x545.png 768w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-11.1-1536x1090.png 1536w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-11.1-65x46.png 65w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-11.1-225x160.png 225w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-11.1-350x248.png 350w\" sizes=\"(max-width: 468px) 100vw, 468px\" \/><\/p>\n<h3 style=\"text-align: left\">\u00c9tape 4 : Les termes de la requ\u00eate sont associ\u00e9s aux termes de l&rsquo;index<\/h3>\n<figure id=\"attachment_74\" aria-describedby=\"caption-attachment-74\" style=\"width: 429px\" class=\"wp-caption alignleft\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-71\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-5-supercali-2.png\" alt=\"\" width=\"429\" height=\"286\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-5-supercali-2.png 1800w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-5-supercali-2-300x200.png 300w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-5-supercali-2-1024x683.png 1024w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-5-supercali-2-768x512.png 768w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-5-supercali-2-1536x1024.png 1536w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-5-supercali-2-65x43.png 65w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-5-supercali-2-225x150.png 225w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-5-supercali-2-350x233.png 350w\" sizes=\"(max-width: 429px) 100vw, 429px\" \/><figcaption id=\"caption-attachment-74\" class=\"wp-caption-text\">Source: https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html, A Fast WordPiece Tokenization System, By Xinying Song and Denny Zhou and \u00ab\u00a0Vintage Disney Mary Poppins Plate by Sun Valley Melmac\u00a0\u00bb by GranniesKitchen is licenced under CC BY 2.0. To view a copy of this licence, visit <a href=\"https:\/\/creativecommons.org\/licenses\/by\/2.0\/\" target=\"_blank\" rel=\"noopener\">https:\/\/creativecommons.org\/licenses\/by\/2.0\/<\/a>?<\/figcaption><\/figure>\n<p class=\"no-indent\">Une fois que l&rsquo;utilisateur a saisi la requ\u00eate et a cliqu\u00e9 sur le bouton de recherche, la requ\u00eate est trait\u00e9e. Les tokens sont cr\u00e9\u00e9s avec le m\u00eame processus que le texte du document. Ensuite, la requ\u00eate peut \u00eatre \u00e9largie en ajoutant d&rsquo;autres mots-cl\u00e9s. Cela permet d&rsquo;\u00e9viter le cas o\u00f9 des documents pertinents ne sont pas trouv\u00e9s parce que la requ\u00eate utilise des mots l\u00e9g\u00e8rement diff\u00e9rents de ceux des auteurs du contenu Web. Ceci est \u00e9galement fait pour prendre en compte les diff\u00e9rences d&rsquo;usage et de coutume. Par exemple, l&rsquo;utilisation de mots comme Pr\u00e9sident, Premier ministre et Chancelier peut \u00eatre interchang\u00e9e selon le pays<sup>1<\/sup>.<\/p>\n<p class=\"indent\">La plupart des moteurs de recherche gardent une trace des recherches des utilisateurs (Regardez<a href=\"a-brief-description-of-some-search-engines\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\"> la description de certains moteurs de recherche populaires<\/a> pour en savoir plus). Les requ\u00eates sont enregistr\u00e9es avec les donn\u00e9es de l&rsquo;utilisateur afin de personnaliser le contenu et de servir des publicit\u00e9s. Ou bien, les enregistrements de tous les utilisateurs sont rassembl\u00e9s pour voir comment et o\u00f9 am\u00e9liorer les performances des moteurs de recherche.<\/p>\n<p class=\"indent\">Les historiques des utilisateurs contiennent les requ\u00eates pr\u00e9c\u00e9dentes, la page de r\u00e9sultats et des informations sur ce qui a fonctionn\u00e9 &#8211; ce sur quoi l&rsquo;utilisateur a cliqu\u00e9 et ce qu&rsquo;il a pass\u00e9 du temps \u00e0 lire. Avec les historiques des utilisateurs, chaque requ\u00eate peut \u00eatre mise en correspondance avec des documents pertinents (l&rsquo;utilisateur a cliqu\u00e9, lu et ferm\u00e9 la session) et des documents non pertinents (l&rsquo;utilisateur n&rsquo;a pas cliqu\u00e9 ou n&rsquo;a pas lu ou a essay\u00e9 de reformuler la requ\u00eate)<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Avec ces logs, chaque nouvelle requ\u00eate peut \u00eatre mise en correspondance avec une requ\u00eate pass\u00e9e qui est similaire. Une fa\u00e7on de savoir si une requ\u00eate est similaire \u00e0 une autre est de voir si le classement fait appara\u00eetre les m\u00eames documents : les requ\u00eates similaires ne contiennent pas toujours les m\u00eames mots mais les r\u00e9sultats sont susceptibles d&rsquo;\u00eatre identiques<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Les fautes d&rsquo;orthographe peuvent \u00eatre corrig\u00e9es en utilisant des requ\u00eates similaires. De nouveaux mots cl\u00e9s et synonymes peuvent \u00eatre ajout\u00e9s pour \u00e9largir la requ\u00eate. Pour ce faire, on examine d&rsquo;autres mots qui apparaissent fr\u00e9quemment dans les documents pertinents du pass\u00e9.\u00a0 En g\u00e9n\u00e9ral, cependant, les mots qui apparaissent plus fr\u00e9quemment dans les documents pertinents que dans les documents non pertinents sont ajout\u00e9s \u00e0 la requ\u00eate ou se voient accorder une pond\u00e9ration suppl\u00e9mentaire<sup>2<\/sup>.<\/p>\n<h3 style=\"text-align: left\">\u00c9tape 5 : Les documents pertinents sont class\u00e9s<\/h3>\n<p class=\"no-indent\">Chaque document est \u00e9valu\u00e9 pour sa pertinence et class\u00e9 en fonction de ce score. La pertinence est ici \u00e0 la fois la pertinence du sujet &#8211; dans quelle mesure les termes d&rsquo;indexation d&rsquo;un document correspondent \u00e0 ceux de la requ\u00eate, et la pertinence de l&rsquo;utilisateur &#8211; dans quelle mesure il correspond aux pr\u00e9f\u00e9rences de l&rsquo;utilisateur. Une partie de cette \u00e9valuation des documents peut \u00eatre effectu\u00e9e pendant l&rsquo;indexation. La vitesse du moteur de recherche d\u00e9pend de la qualit\u00e9 des index. Son efficacit\u00e9 repose sur la fa\u00e7on dont la requ\u00eate est associ\u00e9e au document et sur le syst\u00e8me de classement<sup>2<\/sup>.<\/p>\n<p class=\"indent\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-72 alignleft\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.3.png\" alt=\"\" width=\"369\" height=\"656\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.3.png 1080w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.3-169x300.png 169w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.3-576x1024.png 576w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.3-768x1365.png 768w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.3-864x1536.png 864w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.3-65x116.png 65w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.3-225x400.png 225w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.3-350x622.png 350w\" sizes=\"(max-width: 369px) 100vw, 369px\" \/>La pertinence pour l&rsquo;utilisateur est d\u00e9termin\u00e9e en cr\u00e9ant des mod\u00e8les d&rsquo;utilisateurs (ou types de personnalit\u00e9) bas\u00e9s sur leurs anciens termes de recherche, les sites visit\u00e9s, les courriels, l&rsquo;appareil qu&rsquo;ils utilisent, leur langue et leur localisation g\u00e9ographique. <a href=\"http-cookies\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http-cookies\">Cookies<\/a> sont utilis\u00e9s pour enregistrer les pr\u00e9f\u00e9rences des utilisateurs. Certains moteurs de recherche ach\u00e8tent \u00e9galement des informations sur les utilisateurs aupr\u00e8s de tiers (voir <a href=\"a-brief-description-of-some-search-engines\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">description de certains moteurs de recherche<\/a>). Si quelqu&rsquo;un s&rsquo;int\u00e9resse au football, ses r\u00e9sultats pour \u201cManchester\u00a0\u00bb ; seront diff\u00e9rents de ceux qui viennent de r\u00e9server un vol pour Londres. Les mots qui apparaissent fr\u00e9quemment dans les documents associ\u00e9s \u00e0 une personne se verront accorder la plus grande importance.<\/p>\n<p class=\"indent\">Les moteurs de recherche web commerciaux int\u00e8grent des centaines de caract\u00e9ristiques dans leurs algorithmes de classement, dont beaucoup proviennent de l&rsquo;\u00e9norme collection de donn\u00e9es d&rsquo;interaction des utilisateurs dans les historiques de requ\u00eates. La fonction de classement combine le document, la requ\u00eate et les \u00e9l\u00e9ments de pertinence pour l&rsquo;utilisateur. Quelle que soit la fonction de classement utilis\u00e9e, elle doit reposer sur une base math\u00e9matique robuste. La sortie est la probabilit\u00e9 qu&rsquo;un document r\u00e9ponde au besoin de renseignements de l&rsquo;utilisateur. Au-del\u00e0 d&rsquo;une certaine probabilit\u00e9 de pertinence, le document est class\u00e9 comme \u00e9tant utile<sup>2<\/sup>.<\/p>\n<p class=\"indent\">L&rsquo;apprentissage automatique est utilis\u00e9 pour apprendre le classement sur la base des retours implicites des utilisateurs dans les historiques (ce qui a fonctionn\u00e9 dans les requ\u00eates pr\u00e9c\u00e9dentes). L&rsquo;apprentissage automatique est \u00e9galement utilis\u00e9 pour d\u00e9velopper des mod\u00e8les sophistiqu\u00e9s de la fa\u00e7on dont les humains utilisent le langage avec lesquels il est possible de d\u00e9chiffrer les requ\u00eates<sup>1,2<\/sup>.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-73 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.4.png\" alt=\"\" width=\"423\" height=\"354\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.4.png 940w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.4-300x251.png 300w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.4-768x644.png 768w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.4-65x54.png 65w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.4-225x189.png 225w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-11.4-350x293.png 350w\" sizes=\"(max-width: 423px) 100vw, 423px\" \/><\/p>\n<p class=\"no-indent\">Les progr\u00e8s de la recherche web ont \u00e9t\u00e9 ph\u00e9nom\u00e9naux au cours de la derni\u00e8re d\u00e9cennie. Cependant, lorsqu&rsquo;il s&rsquo;agit de comprendre le contexte d&rsquo;une requ\u00eate sp\u00e9cifique, rien ne remplace l&rsquo;utilisateur qui fournit une meilleure requ\u00eate. G\u00e9n\u00e9ralement, les meilleures requ\u00eates proviennent des utilisateurs qui examinent les r\u00e9sultats et reformulent la requ\u00eate<sup>2<\/sup>.<\/p>\n<h3 style=\"text-align: left\">\u00c9tape 6 : Les r\u00e9sultats sont affich\u00e9s<\/h3>\n<figure id=\"attachment_74\" aria-describedby=\"caption-attachment-74\" style=\"width: 477px\" class=\"wp-caption alignleft\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-74\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/che-page-5-search-results-2.png\" alt=\"\" width=\"477\" height=\"381\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/che-page-5-search-results-2.png 1280w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/che-page-5-search-results-2-300x240.png 300w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/che-page-5-search-results-2-1024x819.png 1024w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/che-page-5-search-results-2-768x614.png 768w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/che-page-5-search-results-2-65x52.png 65w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/che-page-5-search-results-2-225x180.png 225w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/che-page-5-search-results-2-350x280.png 350w\" sizes=\"(max-width: 477px) 100vw, 477px\" \/><figcaption id=\"caption-attachment-74\" class=\"wp-caption-text\">\u00ab\u00a0Gumshoe DuckDuckGo Results\u00a0\u00bb par jrbrusseauest sous licence CC BY-SA 2.0. Pour voir une copie de cette licence, <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse\">https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse<\/a>.<\/figcaption><\/figure>\n<p class=\"no-indent\">Enfin, les r\u00e9sultats sont pr\u00eats \u00e0 \u00eatre affich\u00e9s. Le titre et l&rsquo;url de la page sont affich\u00e9s, avec les mots de la requ\u00eate en gras. Un court r\u00e9sum\u00e9 est g\u00e9n\u00e9r\u00e9 et affich\u00e9 apr\u00e8s chaque lien. Le r\u00e9sum\u00e9 met en \u00e9vidence les passages importants du document. Pour cela, des phrases sont utilis\u00e9es \u00e0 partir des titres, de la description des m\u00e9tadonn\u00e9es ou du texte qui correspond le mieux \u00e0 la requ\u00eate. Si tous les termes de la requ\u00eate apparaissent dans le titre, ils ne sont pas r\u00e9p\u00e9t\u00e9s dans le r\u00e9sum\u00e9<sup>2<\/sup>. Les phrases sont \u00e9galement s\u00e9lectionn\u00e9es en fonction de leur lisibilit\u00e9.<\/p>\n<p class=\"indent\">Des publicit\u00e9s appropri\u00e9es sont ajout\u00e9es aux r\u00e9sultats. La publicit\u00e9 est la fa\u00e7on dont la plupart des moteurs de recherche g\u00e9n\u00e8rent des revenus. Dans certains moteurs de recherche, elles sont clairement marqu\u00e9es comme contenu sponsoris\u00e9, alors que dans d&rsquo;autres, elles ne le sont pas. \u00c9tant donn\u00e9 que de nombreux utilisateurs ne regardent que les premiers r\u00e9sultats, les publicit\u00e9s apportent un changement substantiel \u00e0 la totalit\u00e9 du parcours.<\/p>\n<p class=\"indent\">Les publicit\u00e9s sont choisies en fonction du contexte de la requ\u00eate et du mod\u00e8le d&rsquo;utilisateur. Les fabricants de moteurs de recherche maintiennent une base de donn\u00e9es d&rsquo;annonces qu&rsquo;ils utilisent pour trouver les annonces les plus pertinentes pour une requ\u00eate donn\u00e9e. Les annonceurs ench\u00e9rissent pour des mots-cl\u00e9s qui d\u00e9crivent des sujets associ\u00e9s \u00e0 leur produit. Le montant de l&rsquo;ench\u00e8re et la popularit\u00e9 d&rsquo;une annonce sont des facteurs importants dans le processus de s\u00e9lection<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Pour les questions sur les faits, certains moteurs utilisent leur propre collection de faits. Le Knowledge Vault de Google contient plus d&rsquo;un milliard de faits index\u00e9s \u00e0 partir de diff\u00e9rentes sources<sup>3<\/sup>. Les r\u00e9sultats sont regroup\u00e9s par des algorithmes d&rsquo;apprentissage automatique dans des groupes appropri\u00e9s. Enfin, des alternatives \u00e0 la requ\u00eate sont \u00e9galement pr\u00e9sent\u00e9es \u00e0 l&rsquo;utilisateur pour voir si elles correspondent mieux \u00e0 son besoin r\u00e9el.<\/p>\n<h3 style=\"text-align: left\">Quelques r\u00e9f\u00e9rences :<\/h3>\n<p class=\"no-indent\">L&rsquo;origine de Google peut \u00eatre consult\u00e9e dans <a href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\">l&rsquo;article original de Brin et Paige ;<\/a><br \/>\nCertaines des math\u00e9matiques derri\u00e8re le Pagerank se trouvent sur <a href=\"https:\/\/fr.wikipedia.org\/wiki\/PageRank\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/fr.wikipedia.org\/wiki\/PageRank\">Wiki&rsquo;s PageRank<\/a> ;<br \/>\nPour les esprits matheux, <a href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\">une belle explication du Pagerank<\/a>.<\/p>\n<hr \/>\n<p class=\"hanging-indent\"><sup>1<\/sup> Russell, D., <em>What Do You Need to Know to Use a Search Engine? Why We Still Need to Teach Research Skills<\/em>, AI Magazine, 36(4), 2015.<\/p>\n<p class=\"hanging-indent\"><sup>2 <\/sup>Croft, B., Metzler D., Strohman, T.,<em> Search Engines, Information Retrieval in Practice<\/em>, 2015.<\/p>\n<p class=\"hanging-indent\"><sup>3<\/sup> Spencer, S., <em>Google Power Search: The Essential Guide to Finding Anything Online With Google<\/em>, Koshkonong, Kindle Edition.<\/p>\n","protected":false},"author":1,"menu_order":5,"template":"","meta":{"pb_show_title":"","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[],"contributor":[],"license":[],"part":46,"_links":{"self":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters\/75"}],"collection":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":1,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters\/75\/revisions"}],"predecessor-version":[{"id":76,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters\/75\/revisions\/76"}],"part":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/parts\/46"}],"metadata":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters\/75\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/media?parent=75"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapter-type?post=75"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/contributor?post=75"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/license?post=75"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}