{"id":78,"date":"2023-11-30T17:18:01","date_gmt":"2023-11-30T17:18:01","guid":{"rendered":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/chapter\/ai-speak-search-engine-ranking\/"},"modified":"2024-01-31T11:38:23","modified_gmt":"2024-01-31T11:38:23","slug":"ai-speak-search-engine-ranking","status":"publish","type":"chapter","link":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/chapter\/ai-speak-search-engine-ranking\/","title":{"raw":"Parlare di IA: posizionamento nei motori di ricerca","rendered":"Parlare di IA: posizionamento nei motori di ricerca"},"content":{"raw":"<p class=\"no-indent\">Rispetto ai motori di ricerca dei primi anni 2000, i motori di ricerca attuali effettuano analisi pi\u00f9 ricche e profonde. Ad esempio, oltre a contare le parole, sono in grado di analizzare e confrontare il significato delle parole stesse<sup>1<\/sup>. Gran parte di questa ricchezza avviene nel processo di classificazione:<\/p>\n<img class=\" wp-image-203 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch2-page-5-ranking-1024x726-1.png\" alt=\"\" width=\"468\" height=\"332\">\n<h3 style=\"text-align: left\">Fase 4: I termini della query vengono abbinati ai termini dell'indice<\/h3>\n[caption id=\"attachment_199\" align=\"alignleft\" width=\"429\"]<img class=\"wp-image-199\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch2-page-5-supercali-300x200-1.png\" alt=\"\" width=\"429\" height=\"286\"> Source :<a href=\"https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html\"> https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html<\/a>, A Fast WordPiece Tokenization System, By Xinying Song and Denny Zhou and \"Vintage Disney Mary Poppins Plate by Sun Valley Melmac\" by GranniesKitchen pubblicato con licenza CC BY 2.0. Per visualizzare una copia di questa licenza, visitare <a href=\"https:\/\/creativecommons.org\/licenses\/by\/2.0\/\">https:\/\/creativecommons.org\/licenses\/by\/2.0\/<\/a>?[\/caption]\n<p class=\"no-indent\">Una volta che l'utente digita la query e clicca su cerca, la query viene elaborata. I token vengono creati con lo stesso processo del testo del documento. Poi la query pu\u00f2 essere ampliata aggiungendo altre parole chiave. Questo per evitare il caso in cui i documenti rilevanti non vengano trovati perch\u00e9 la query utilizza parole leggermente diverse da quelle degli autori dei contenuti web. Questo viene fatto anche per cogliere le differenze nell'uso e nella consuetudine. Ad esempio, l'uso di parole come Presidente, Primo Ministro e Cancelliere pu\u00f2 essere cambiato a seconda del Paese<sup>1<\/sup>.<\/p>\n<p class=\"indent\">La maggior parte dei motori di ricerca tiene traccia delle ricerche effettuate dagli utenti (Guardate <a href=\"a-brief-description-of-some-search-engines\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">la descrizione di alcuni motori di ricerca popolari<\/a>). Le query vengono registrate insieme ai dati dell'utente per personalizzare i contenuti e servire pubblicit\u00e0. Oppure, i dati di tutti gli utenti vengono messi insieme per capire come e dove migliorare le prestazioni dei motori di ricerca.<\/p>\n<p class=\"indent\">I log degli utenti contengono le query precedenti, la pagina dei risultati e le informazioni su ci\u00f2 che ha funzionato - cosa ha cliccato l'utente e cosa ha speso tempo a leggere. Grazie ai log degli utenti, ogni query pu\u00f2 essere abbinata a documenti rilevanti (l'utente clicca, legge e chiude la sessione) e a documenti non rilevanti (l'utente non ha cliccato o non ha letto o ha cercato di riformulare la query)<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Con questi log, ogni nuova query pu\u00f2 essere abbinata a una query passata simile. Un modo per capire se una query \u00e8 simile a un'altra \u00e8 vedere se la classificazione produce gli stessi documenti: le query simili possono non contenere sempre le stesse parole, ma \u00e8 probabile che i risultati siano identici<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Gli errori ortografici possono essere corretti utilizzando query simili. \u00c8 possibile aggiungere nuove parole chiave e sinonimi per ampliare la query. A tale scopo, \u00e8 necessario esaminare altre parole che ricorrono frequentemente nei documenti rilevanti del passato.\u00a0 In generale, tuttavia, le parole che ricorrono pi\u00f9 frequentemente nei documenti rilevanti rispetto a quelli non rilevanti vengono aggiunte alla query o ricevono un peso aggiuntivo<sup>2<\/sup>.<\/p>\n\n<h3 style=\"text-align: left\">Fase 5: classificazione dei documenti rilevanti<\/h3>\n<p class=\"no-indent\">Ogni documento viene valutato per la sua rilevanza e classificato in base a questo punteggio. Per rilevanza si intende sia la rilevanza dell'argomento, ossia la corrispondenza tra i termini dell'indice di un documento e quelli della query, sia la rilevanza dell'utente, ossia la corrispondenza tra il documento e le preferenze dell'utente. Una parte del punteggio dei documenti pu\u00f2 essere effettuata durante l'indicizzazione. La velocit\u00e0 del motore di ricerca dipende dalla qualit\u00e0 degli indici. La sua efficacia si basa sulla corrispondenza tra la query e il documento e sul sistema di classificazione<sup>2<\/sup>.<\/p>\n<img class=\" wp-image-198 alignleft\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch2-page-5-some-features-for-ranking-576x1024-1.jpg\" alt=\"\" width=\"369\" height=\"656\">La rilevanza degli utenti viene misurata creando modelli di utenti (o tipi di personalit\u00e0) basati sui termini di ricerca precedenti, sui siti visitati, sui messaggi e-mail, sul dispositivo utilizzato, sulla lingua e sulla posizione geografica.\u00a0I <a href=\"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/chapter\/cookies-and-fingerprinting\/\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http-cookies\">Cookies<\/a> sono utilizzati per memorizzare le preferenze dell'utente. Alcuni motori di ricerca acquistano informazioni sugli utenti anche da terzi (fate riferimento alla <a href=\"a-brief-description-of-some-search-engines\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">descrizione di alcuni motori di ricerca<\/a>). Se una persona \u00e8 interessata al calcio, i suoi risultati per \"Manchester\" saranno diversi da quelli di una persona che ha appena prenotato un volo per Londra. Le parole che ricorrono frequentemente nei documenti associati a una persona avranno la massima importanza.\n\nI motori di ricerca web commerciali incorporano centinaia di caratteristiche nei loro algoritmi di classificazione, molte delle quali derivano dall'enorme raccolta di dati sulle interazioni degli utenti nei log delle query. Una funzione di ranking combina le caratteristiche del documento, della query e della rilevanza dell'utente. Qualunque sia la funzione di ranking utilizzata, deve avere una solida base matematica. L'output \u00e8 la probabilit\u00e0 che un documento soddisfi il bisogno informativo dell'utente. Al di sopra di una certa probabilit\u00e0 di rilevanza, il documento viene classificato come rilevante<sup>2<\/sup>.\n<p class=\"indent\">L'apprendimento automatico viene utilizzato per imparare il ranking sulla base del feedback implicito dell'utente nei log (ci\u00f2 che ha funzionato nelle query precedenti). L'apprendimento automatico \u00e8 stato utilizzato anche per sviluppare modelli sofisticati di come gli esseri umani utilizzano il linguaggio per decifrare le query<sup>1,2<\/sup>.<\/p>\n<img class=\"wp-image-197 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch2-page5-ML-ranking-300x251-1.png\" alt=\"\" width=\"423\" height=\"354\">\n<p class=\"indent\">I progressi nella ricerca sul Web sono stati fenomenali nell'ultimo decennio. Tuttavia, quando si tratta di comprendere il contesto di una specifica query, non \u00e8 possibile sostituire l'utente nel fornire una query migliore. In genere, le query migliori derivano dall'esame dei risultati da parte degli utenti e dalla riformulazione della query<sup>2<\/sup>.<\/p>\n\n<h3>Fase 6: Visualizzazione dei risultati<\/h3>\n[caption id=\"attachment_196\" align=\"alignleft\" width=\"477\"]<img class=\"wp-image-196\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/che-page-5-search-results-300x240-1.png\" alt=\"\" width=\"477\" height=\"381\"> \"Gumshoe DuckDuckGo Results\" di jrbrusseau pubblicato con licenza CC BY-SA 2.0. Per visualizzare una copia di questa licenza, visitare <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse.\">https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse.<\/a>[\/caption]\n<p class=\"indent\">Infine, i risultati sono pronti per essere visualizzati. Il titolo e l'url della pagina sono visualizzati, con i termini di ricerca in grassetto. Dopo ogni link viene generato e visualizzato un breve sommario. Il sommario evidenzia i passaggi importanti del documento. A tale scopo, vengono utilizzate frasi tratte dai titoli, dalla descrizione dei metadati o dal testo che corrisponde meglio alla query. Se tutti i termini della query sono presenti nel titolo, non vengono ripetuti nello snippet<sup>2<\/sup>. Le frasi vengono selezionate anche in base alla loro leggibilit\u00e0.<\/p>\n<p class=\"indent\">Ai risultati viene aggiunta una pubblicit\u00e0 appropriata. La pubblicit\u00e0 \u00e8 il modo in cui la maggior parte dei motori di ricerca genera entrate. In alcuni motori di ricerca sono chiaramente indicati come contenuti sponsorizzati, mentre in altri non lo sono. Poich\u00e9 molti utenti guardano solo i primi risultati, gli annunci cambiano sostanzialmente l'intero processo.<\/p>\n<p class=\"indent\">Gli annunci vengono scelti in base al contesto della richiesta e al modello dell'utente. Le aziende produttrici di motori di ricerca mantengono un database di annunci pubblicitari che viene consultato per trovare gli annunci pi\u00f9 rilevanti per una determinata query. Gli inserzionisti fanno offerte per parole chiave che descrivono argomenti associati ai loro prodotti. Sia l'importo dell'offerta che la popolarit\u00e0 di un annuncio sono fattori significativi nel processo di selezione<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Per le domande sui fatti, alcuni motori utilizzano la propria raccolta di fatti. La Knowledge Vault di Google contiene oltre un miliardo di fatti indicizzati da diverse fonti<sup>3<\/sup>. I risultati vengono raggruppati da algoritmi di apprendimento automatico in gruppi appropriati. Infine, all'utente vengono presentate anche delle alternative alla query, per vedere se si adattano meglio alle sue reali esigenze.<\/p>\n\n<h3 style=\"text-align: left\">Alcuni riferimenti:<\/h3>\n<p class=\"no-indent\">L'origine di Google si trova <a href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\">nell'articolo orginiale di Brin and Paige<\/a>\nAlcuni dei calcoli che stanno alla base del Pagerank si trovano su <a href=\"https:\/\/en.wikipedia.org\/wiki\/PageRank\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/en.wikipedia.org\/wiki\/PageRank\">Wiki's PageRank<\/a>\nPer gli amanti della matematica, <a href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af \" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af \">una bella spiegazione del Pagerank<\/a><\/p>\n&nbsp;\n\n<hr>\n<p class=\"hanging-indent\" style=\"text-align: left\"><sup>1<\/sup> Russell, D., <em>What Do You Need to Know to Use a Search Engine? Why We Still Need to Teach Research Skills<\/em>, AI Magazine, 36(4), 2015.<\/p>\n<p class=\"hanging-indent\" style=\"text-align: left\"><sup>2 <\/sup>Croft, B., Metzler D., Strohman, T.,<em> Search Engines, Information Retrieval in Practice<\/em>, 2015.<\/p>\n<p class=\"hanging-indent\" style=\"text-align: left\"><sup>3<\/sup> Spencer, S., <em>Google Power Search: The Essential Guide to Finding Anything Online With Google<\/em>, Koshkonong, Kindle Edition.<\/p>","rendered":"<p class=\"no-indent\">Rispetto ai motori di ricerca dei primi anni 2000, i motori di ricerca attuali effettuano analisi pi\u00f9 ricche e profonde. Ad esempio, oltre a contare le parole, sono in grado di analizzare e confrontare il significato delle parole stesse<sup>1<\/sup>. Gran parte di questa ricchezza avviene nel processo di classificazione:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-203 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch2-page-5-ranking-1024x726-1.png\" alt=\"\" width=\"468\" height=\"332\" \/><\/p>\n<h3 style=\"text-align: left\">Fase 4: I termini della query vengono abbinati ai termini dell&#8217;indice<\/h3>\n<figure id=\"attachment_199\" aria-describedby=\"caption-attachment-199\" style=\"width: 429px\" class=\"wp-caption alignleft\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-199\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch2-page-5-supercali-300x200-1.png\" alt=\"\" width=\"429\" height=\"286\" \/><figcaption id=\"caption-attachment-199\" class=\"wp-caption-text\">Source :<a href=\"https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html\"> https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html<\/a>, A Fast WordPiece Tokenization System, By Xinying Song and Denny Zhou and &#8220;Vintage Disney Mary Poppins Plate by Sun Valley Melmac&#8221; by GranniesKitchen pubblicato con licenza CC BY 2.0. Per visualizzare una copia di questa licenza, visitare <a href=\"https:\/\/creativecommons.org\/licenses\/by\/2.0\/\">https:\/\/creativecommons.org\/licenses\/by\/2.0\/<\/a>?<\/figcaption><\/figure>\n<p class=\"no-indent\">Una volta che l&#8217;utente digita la query e clicca su cerca, la query viene elaborata. I token vengono creati con lo stesso processo del testo del documento. Poi la query pu\u00f2 essere ampliata aggiungendo altre parole chiave. Questo per evitare il caso in cui i documenti rilevanti non vengano trovati perch\u00e9 la query utilizza parole leggermente diverse da quelle degli autori dei contenuti web. Questo viene fatto anche per cogliere le differenze nell&#8217;uso e nella consuetudine. Ad esempio, l&#8217;uso di parole come Presidente, Primo Ministro e Cancelliere pu\u00f2 essere cambiato a seconda del Paese<sup>1<\/sup>.<\/p>\n<p class=\"indent\">La maggior parte dei motori di ricerca tiene traccia delle ricerche effettuate dagli utenti (Guardate <a href=\"a-brief-description-of-some-search-engines\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">la descrizione di alcuni motori di ricerca popolari<\/a>). Le query vengono registrate insieme ai dati dell&#8217;utente per personalizzare i contenuti e servire pubblicit\u00e0. Oppure, i dati di tutti gli utenti vengono messi insieme per capire come e dove migliorare le prestazioni dei motori di ricerca.<\/p>\n<p class=\"indent\">I log degli utenti contengono le query precedenti, la pagina dei risultati e le informazioni su ci\u00f2 che ha funzionato &#8211; cosa ha cliccato l&#8217;utente e cosa ha speso tempo a leggere. Grazie ai log degli utenti, ogni query pu\u00f2 essere abbinata a documenti rilevanti (l&#8217;utente clicca, legge e chiude la sessione) e a documenti non rilevanti (l&#8217;utente non ha cliccato o non ha letto o ha cercato di riformulare la query)<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Con questi log, ogni nuova query pu\u00f2 essere abbinata a una query passata simile. Un modo per capire se una query \u00e8 simile a un&#8217;altra \u00e8 vedere se la classificazione produce gli stessi documenti: le query simili possono non contenere sempre le stesse parole, ma \u00e8 probabile che i risultati siano identici<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Gli errori ortografici possono essere corretti utilizzando query simili. \u00c8 possibile aggiungere nuove parole chiave e sinonimi per ampliare la query. A tale scopo, \u00e8 necessario esaminare altre parole che ricorrono frequentemente nei documenti rilevanti del passato.\u00a0 In generale, tuttavia, le parole che ricorrono pi\u00f9 frequentemente nei documenti rilevanti rispetto a quelli non rilevanti vengono aggiunte alla query o ricevono un peso aggiuntivo<sup>2<\/sup>.<\/p>\n<h3 style=\"text-align: left\">Fase 5: classificazione dei documenti rilevanti<\/h3>\n<p class=\"no-indent\">Ogni documento viene valutato per la sua rilevanza e classificato in base a questo punteggio. Per rilevanza si intende sia la rilevanza dell&#8217;argomento, ossia la corrispondenza tra i termini dell&#8217;indice di un documento e quelli della query, sia la rilevanza dell&#8217;utente, ossia la corrispondenza tra il documento e le preferenze dell&#8217;utente. Una parte del punteggio dei documenti pu\u00f2 essere effettuata durante l&#8217;indicizzazione. La velocit\u00e0 del motore di ricerca dipende dalla qualit\u00e0 degli indici. La sua efficacia si basa sulla corrispondenza tra la query e il documento e sul sistema di classificazione<sup>2<\/sup>.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-198 alignleft\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch2-page-5-some-features-for-ranking-576x1024-1.jpg\" alt=\"\" width=\"369\" height=\"656\" \/>La rilevanza degli utenti viene misurata creando modelli di utenti (o tipi di personalit\u00e0) basati sui termini di ricerca precedenti, sui siti visitati, sui messaggi e-mail, sul dispositivo utilizzato, sulla lingua e sulla posizione geografica.\u00a0I <a href=\"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/chapter\/cookies-and-fingerprinting\/\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http-cookies\">Cookies<\/a> sono utilizzati per memorizzare le preferenze dell&#8217;utente. Alcuni motori di ricerca acquistano informazioni sugli utenti anche da terzi (fate riferimento alla <a href=\"a-brief-description-of-some-search-engines\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">descrizione di alcuni motori di ricerca<\/a>). Se una persona \u00e8 interessata al calcio, i suoi risultati per &#8220;Manchester&#8221; saranno diversi da quelli di una persona che ha appena prenotato un volo per Londra. Le parole che ricorrono frequentemente nei documenti associati a una persona avranno la massima importanza.<\/p>\n<p>I motori di ricerca web commerciali incorporano centinaia di caratteristiche nei loro algoritmi di classificazione, molte delle quali derivano dall&#8217;enorme raccolta di dati sulle interazioni degli utenti nei log delle query. Una funzione di ranking combina le caratteristiche del documento, della query e della rilevanza dell&#8217;utente. Qualunque sia la funzione di ranking utilizzata, deve avere una solida base matematica. L&#8217;output \u00e8 la probabilit\u00e0 che un documento soddisfi il bisogno informativo dell&#8217;utente. Al di sopra di una certa probabilit\u00e0 di rilevanza, il documento viene classificato come rilevante<sup>2<\/sup>.<\/p>\n<p class=\"indent\">L&#8217;apprendimento automatico viene utilizzato per imparare il ranking sulla base del feedback implicito dell&#8217;utente nei log (ci\u00f2 che ha funzionato nelle query precedenti). L&#8217;apprendimento automatico \u00e8 stato utilizzato anche per sviluppare modelli sofisticati di come gli esseri umani utilizzano il linguaggio per decifrare le query<sup>1,2<\/sup>.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-197 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch2-page5-ML-ranking-300x251-1.png\" alt=\"\" width=\"423\" height=\"354\" \/><\/p>\n<p class=\"indent\">I progressi nella ricerca sul Web sono stati fenomenali nell&#8217;ultimo decennio. Tuttavia, quando si tratta di comprendere il contesto di una specifica query, non \u00e8 possibile sostituire l&#8217;utente nel fornire una query migliore. In genere, le query migliori derivano dall&#8217;esame dei risultati da parte degli utenti e dalla riformulazione della query<sup>2<\/sup>.<\/p>\n<h3>Fase 6: Visualizzazione dei risultati<\/h3>\n<figure id=\"attachment_196\" aria-describedby=\"caption-attachment-196\" style=\"width: 477px\" class=\"wp-caption alignleft\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-196\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/che-page-5-search-results-300x240-1.png\" alt=\"\" width=\"477\" height=\"381\" \/><figcaption id=\"caption-attachment-196\" class=\"wp-caption-text\">&#8220;Gumshoe DuckDuckGo Results&#8221; di jrbrusseau pubblicato con licenza CC BY-SA 2.0. Per visualizzare una copia di questa licenza, visitare <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse.\">https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse.<\/a><\/figcaption><\/figure>\n<p class=\"indent\">Infine, i risultati sono pronti per essere visualizzati. Il titolo e l&#8217;url della pagina sono visualizzati, con i termini di ricerca in grassetto. Dopo ogni link viene generato e visualizzato un breve sommario. Il sommario evidenzia i passaggi importanti del documento. A tale scopo, vengono utilizzate frasi tratte dai titoli, dalla descrizione dei metadati o dal testo che corrisponde meglio alla query. Se tutti i termini della query sono presenti nel titolo, non vengono ripetuti nello snippet<sup>2<\/sup>. Le frasi vengono selezionate anche in base alla loro leggibilit\u00e0.<\/p>\n<p class=\"indent\">Ai risultati viene aggiunta una pubblicit\u00e0 appropriata. La pubblicit\u00e0 \u00e8 il modo in cui la maggior parte dei motori di ricerca genera entrate. In alcuni motori di ricerca sono chiaramente indicati come contenuti sponsorizzati, mentre in altri non lo sono. Poich\u00e9 molti utenti guardano solo i primi risultati, gli annunci cambiano sostanzialmente l&#8217;intero processo.<\/p>\n<p class=\"indent\">Gli annunci vengono scelti in base al contesto della richiesta e al modello dell&#8217;utente. Le aziende produttrici di motori di ricerca mantengono un database di annunci pubblicitari che viene consultato per trovare gli annunci pi\u00f9 rilevanti per una determinata query. Gli inserzionisti fanno offerte per parole chiave che descrivono argomenti associati ai loro prodotti. Sia l&#8217;importo dell&#8217;offerta che la popolarit\u00e0 di un annuncio sono fattori significativi nel processo di selezione<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Per le domande sui fatti, alcuni motori utilizzano la propria raccolta di fatti. La Knowledge Vault di Google contiene oltre un miliardo di fatti indicizzati da diverse fonti<sup>3<\/sup>. I risultati vengono raggruppati da algoritmi di apprendimento automatico in gruppi appropriati. Infine, all&#8217;utente vengono presentate anche delle alternative alla query, per vedere se si adattano meglio alle sue reali esigenze.<\/p>\n<h3 style=\"text-align: left\">Alcuni riferimenti:<\/h3>\n<p class=\"no-indent\">L&#8217;origine di Google si trova <a href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\">nell&#8217;articolo orginiale di Brin and Paige<\/a><br \/>\nAlcuni dei calcoli che stanno alla base del Pagerank si trovano su <a href=\"https:\/\/en.wikipedia.org\/wiki\/PageRank\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/en.wikipedia.org\/wiki\/PageRank\">Wiki&#8217;s PageRank<\/a><br \/>\nPer gli amanti della matematica, <a href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\">una bella spiegazione del Pagerank<\/a><\/p>\n<p>&nbsp;<\/p>\n<hr \/>\n<p class=\"hanging-indent\" style=\"text-align: left\"><sup>1<\/sup> Russell, D., <em>What Do You Need to Know to Use a Search Engine? Why We Still Need to Teach Research Skills<\/em>, AI Magazine, 36(4), 2015.<\/p>\n<p class=\"hanging-indent\" style=\"text-align: left\"><sup>2 <\/sup>Croft, B., Metzler D., Strohman, T.,<em> Search Engines, Information Retrieval in Practice<\/em>, 2015.<\/p>\n<p class=\"hanging-indent\" style=\"text-align: left\"><sup>3<\/sup> Spencer, S., <em>Google Power Search: The Essential Guide to Finding Anything Online With Google<\/em>, Koshkonong, Kindle Edition.<\/p>\n","protected":false},"author":1,"menu_order":5,"template":"","meta":{"pb_show_title":"","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[],"contributor":[],"license":[],"part":47,"_links":{"self":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters\/78"}],"collection":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":1,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters\/78\/revisions"}],"predecessor-version":[{"id":79,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters\/78\/revisions\/79"}],"part":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/parts\/47"}],"metadata":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters\/78\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/media?parent=78"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapter-type?post=78"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/contributor?post=78"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/license?post=78"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}