{"id":77,"date":"2023-11-30T17:30:16","date_gmt":"2023-11-30T17:30:16","guid":{"rendered":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/chapter\/ai-speak-search-engine-ranking\/"},"modified":"2024-01-31T11:47:29","modified_gmt":"2024-01-31T11:47:29","slug":"ai-speak-search-engine-ranking","status":"publish","type":"chapter","link":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/chapter\/ai-speak-search-engine-ranking\/","title":{"raw":"Govorica UI: Razvr\u0161\u010danje","rendered":"Govorica UI: Razvr\u0161\u010danje"},"content":{"raw":"<p class=\"no-indent\">V primerjavi z iskalniki iz za\u010detka tiso\u010dletja dana\u0161nji iskalniki opravljajo veliko podrobnej\u0161e in globlje analize. To pomeni, na primer, da ne le \u0161tejejo besede v besedilu, temve\u010d analizirajo in primerjajo pomen besed<sup>1<\/sup>. Veliko tak\u0161nih procesov poteka v postopku razvr\u0161\u010danja:<\/p>\n<img class=\" wp-image-203 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page-5-ranking-.png\" alt=\"\" width=\"468\" height=\"332\">\n<h3 style=\"text-align: left\">4. korak: usklajevanje izrazov iz poizvedbe z izrazi iz kazala<\/h3>\n[caption id=\"attachment_76\" align=\"alignleft\" width=\"429\"]<img class=\"wp-image-73\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/14\/2023\/11\/ch2-page-5-supercali-300x200.png\" alt=\"\" width=\"429\" height=\"286\"> A Fast WordPiece Tokenization System, By Xinying Song and Denny Zhou and \"Vintage Disney Mary Poppins Plate by Sun Valley Melmac\" by GranniesKitchen je licenciran pod CC BY 2.0. \u010ce si \u017eelite ogledati kopijo te licence, obi\u0161\u010dite <a href=\"https:\/\/creativecommons.org\/licenses\/by\/2.0\/\">https:\/\/creativecommons.org\/licenses\/by\/2.0\/<\/a>? Source: <a href=\"https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html\">https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html<\/a>,[\/caption]\n<p class=\"no-indent\">Ko uporabnik vnese iskalno poizvedbo in klikne na iskanje, se pri\u010dne obdelava poizvedbe. Po enakem principu, kot nastane besedilo, se ustvarijo \u017eetoni. Poizvedba se nato lahko raz\u0161iri, z dodatnimi klju\u010dnimi besedami. Na ta na\u010din se izognemo situaciji, da ustreznih dokumentov ne najdemo, ker v poizvedbi uporabljamo nekoliko druga\u010dne besede kot avtorji spletnih vsebin. To po\u010dnemo tudi zato, da upo\u0161tevamo morebitne razlike na\u010dinov rabe (npr., uporaba besed, kot so predsednik, premier, ali kancler, je lahko druga\u010dna glede na dr\u017eavo)<sup>1<\/sup>.<\/p>\n<p class=\"indent\">Ve\u010dina iskalnikov bele\u017ei zgodovino uporabnikovih poizvedb (za ve\u010d informacij si oglejte\u00a0<a href=\"a-brief-description-of-some-search-engines\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">Opis nekaterih priljubljenih iskalnikov<\/a>). Poizvedbe se bele\u017eijo skupaj s podatki o uporabniku, za u\u010dinkovitej\u0161o personalizacijo vsebin in zaradi prikazovanja oglasov. Podatki vseh uporabnikov se pogosto zdru\u017eijo in se obravnavajo kot celota, prav tako z namenom izbolj\u0161anja delovanja iskalnika.<\/p>\n<p class=\"indent\">Uporabni\u0161ki dnevniki vsebujejo prej\u0161nje poizvedbe, stran z rezultati in informacije o tem, kaj je delovalo (kaj je bilo ustrezno) - torej, kaj je uporabnik kliknil in koliko \u010dasa je porabil za branje teh strani. S pomo\u010djo uporabni\u0161kih dnevnikov\u00a0je mogo\u010de vsako poizvedbo povezati z relevantnimi dokumenti (uporabnik klikne, prebere stran in zaklju\u010di sejo) in z nerelevantnimi dokumenti (uporabnik ni kliknil ali prebral ali posku\u0161al preoblikovati poizvedbe)<sup>2<\/sup>.<\/p>\n<p class=\"indent\">S tak\u0161nimi dnevniki lahko vsako novo poizvedbo primerjamo s preteklo poizvedbo, ki je podobna trenutni. Eden od na\u010dinov, kako ugotoviti, da je poizvedba podobna drugi poizvedbi je, da pogledamo ali razvr\u0161\u010danje prika\u017ee iste dokumente: podobne poizvedbe morda ne vsebujejo vedno istih besed, vendar bodo prikazani rezultati verjetno enaki<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Pravopisne napake lahko popravimo s podobnimi poizvedbami. Za raz\u0161iritev poizvedbe lahko dodamo nove klju\u010dne besede ali sopomenke. To storimo tako, da poi\u0161\u010demo druge besede, ki se pogosto pojavljajo v dokumentih, ki so rezultat preteklih poizvedb. V splo\u0161nem pa velja, da se poizvedbi dodajo besede, ki se v relevantnih dokumentih pojavljajo pogosteje kot v nerelevantnih dokumentih, ali se tem besedam dodelijo dodatne ute\u017ei<sup>2<\/sup>.<\/p>\n\n<h3 style=\"text-align: left\">5. korak: razvrstitev ustreznih dokumentov<\/h3>\n<p class=\"no-indent\">Vsak dokument se oceni glede na relevantnost (ustreznost) in se nato glede na tak\u0161no oceno razvrsti. Pri tem je pomembna tako relevantnost teme - kako dobro se indeksirani izrazi dokumenta ujemajo z izrazi poizvedbe, kot tudi relevantnost za uporabnika - kako dobro se dokument ujema z uporabnikovimi preferencami. Delno lahko razvr\u0161\u010danje dokumentov poteka \u017ee med indeksiranjem. Hitrost iskalnika je odvisna od kakovosti kazal. U\u010dinkovitost iskalnikov temelji na tem, kako se poizvedba ujema z dokumentom, in na sistemu razvr\u0161\u010danja<sup>2<\/sup>.<\/p>\n<img class=\" wp-image-74 alignleft\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page-5-some-features-for-ranking-576x1024.jpg\" alt=\"\" width=\"369\" height=\"656\">\n<p class=\"indent\">Relevantnost za uporabnika se meri s pomo\u010djo uporabni\u0161kih modelov (tipov osebnosti) na podlagi njihovih prej\u0161njih iskalnih izrazov, obiskanih spletnih mest, e-po\u0161tnih sporo\u010dil, naprave, ki jo uporabljajo, jezika in geografske lokacije. <a href=\"http-cookies\" data-cke-saved-href=\"http-cookies\">Pi\u0161kotki<\/a> se uporabljajo za shranjevanje uporabni\u0161kih nastavitev. Nekateri iskalniki kupujejo podatke o uporabnikih tudi od tretjih oseb (gl. poglavje\u00a0<a href=\"a-brief-description-of-some-search-engines\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">Opis nekaterih priljubljenih iskalnikov<\/a>). \u010ce osebo zanima nogomet, bodo njeni rezultati za poizvedbo \u201cManchester\u201d druga\u010dni od rezultatov za osebo, ki je pravkar rezervirala let v London. Besedam, ki se pogosto pojavljajo v dokumentih, relevantnih za to osebo, bo dodeljena najve\u010dja relevantnost.<\/p>\n<p class=\"indent\">Komercialni spletni iskalniki v svoje algoritme razvr\u0161\u010danja vklju\u010dujejo na stotine zna\u010dilnosti\/funkcij, od katerih jih veliko izhaja iz ogromne zbirke podatkov o interakciji uporabnikov (iz uporabni\u0161kih dnevnikov). Funkcija razvr\u0161\u010danja zdru\u017euje zna\u010dilnosti, ki se nana\u0161ajo na relevantnost dokumenta, poizvedbe in uporabnika. Ne glede na funkcijo razvr\u0161\u010danja ima le-ta v principu trdno matemati\u010dno podlago. Rezultat je izra\u017eena verjetnost, da dokument izpolnjuje uporabnikovo zahtevo. Dokument je razvr\u0161\u010den kot relevanten (ustrezen) takrat, ko je prese\u017eena dolo\u010dena stopnja verjetnosti za njegovo relelvantnost<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Strojno u\u010denje se uporablja za u\u010denje razvr\u0161\u010danja na podlagi implicitnih povratnih informacij uporabnika v uporabni\u0161kih dnevnikih (torej, kaj je delovalo oz. kaj je bilo ustrezno pri prej\u0161njih poizvedbah). Strojno u\u010denje se uporablja tudi za razvoj izpopolnjenih modelov \u010dlove\u0161ke rabe jezika, s pomo\u010djo katerih se dekodirajo poizvedbe<sup>1,2<\/sup>.\n<img class=\"wp-image-75 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page5-ML-ranking-300x251.png\" alt=\"\" width=\"423\" height=\"354\">V zadnjem desetletju je\u00a0tehnologija spletnega iskanja do\u017eivela velikanski napredek. Toda \u010de govorimo o razumevanju konteksta posamezne poizvedbe, ni\u010d ne more nadomestiti vnosa bolj\u0161e poizvedbe s strani uporabnika samega. Obi\u010dajno bolj\u0161e poizvedbe nastanejo tako, da uporabniki preu\u010dijo rezultate in nato preoblikujejo svojo prvotno poizvedbo<sup>2<\/sup>.<\/p>\n\n<h3 style=\"text-align: left\">6. korak: prikaz rezultatov<\/h3>\n[caption id=\"attachment_76\" align=\"alignleft\" width=\"477\"]<img class=\"wp-image-76\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/14\/2024\/01\/che-page-5-search-results-300x240.png\" alt=\"\" width=\"477\" height=\"381\"> \"Gumshoe DuckDuckGo Results\" by jrbrusseau je licenciran pod CC BY-SA 2.0. \u010ce si \u017eelite ogledati kopijo te licence, obi\u0161\u010dite <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse\">https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse<\/a>.[\/caption]\n<p class=\"indent no-indent\">Kon\u010dno so rezultati pripravljeni za prikaz. Prika\u017ee se naslov spletne strani (URL - Uniform Resource Locator), izrazi poizvedba pa so poudarjeni s krepkim tiskom. Pod vsako prikazano povezavo (rezultatom) je prikazan tudi kratek povzetek. V povzetku so izpostavljeni pomembni deli dokumenta. Uporabljeni so stavki iz naslovov, iz opisa metapodatkov ali iz besedila, ki najbolj ustreza poizvedbi. \u010ce so vsi poizvedbeni izrazi navedeni v naslovu, se v povzetkih ne ponovijo<sup>2<\/sup>. Stavki so izbrani tudi glede na to, kako berljivi so.<\/p>\n<p class=\"indent\">Prikazane rezultate spremljajo primerni oglasi. Z ogla\u0161evanjem ve\u010dina iskalnikov ustvarja prihodke. V nekaterih iskalnikih so oglasi jasno ozna\u010deni kot 'sponzorirana vsebina', v drugih pa ne. Ker si veliko uporabnikov ogleda le prvih nekaj rezultatov, imajo oglasi bistven vpliv na celoten postopek.<\/p>\n<p class=\"indent\">Oglasi so izbrani glede na kontekst poizvedbe in glede na model uporabnika. Podjetja, ki se ukvarjajo s spletnimi iskalniki, \u010drpajo iz podatkovne zbirke oglasov, kjer i\u0161\u010dejo najustreznej\u0161e oglase za dano poizvedbo. Ogla\u0161evalci zakupijo klju\u010dne besede, ki opisujejo teme, povezane z njihovim produktom. Znesek njihove ponudbe kot tudi priljubljenost oglasov sta pomembna dejavnika v postopku izbire<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Za poizvedbe o dejstvih nekateri iskalniki uporabljajo lastne zbirke dejstev. Googlova \"zakladnica znanja\" (Google Knowledge Vault) vsebuje ve\u010d kot milijardo dejstev, indeksiranih iz razli\u010dnih virov<sup>3<\/sup>. Rezultate algoritmi strojnega u\u010denja zdru\u017eijo v ustrezne skupine. Za konec se uporabniku predstavijo \u0161e alternative njegovi poizvedbi, s \u010dimer se preveri, ali nemara bolje ustrezajo njegovim dejanskim zahtevam.<\/p>\n\n<h3 style=\"text-align: left\">Nekaj uporabnih virov:<\/h3>\n<p class=\"no-indent\">Ve\u010d o nastanku in razvoju Googla:\u00a0<a href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\">S. Brin in L. Paige - izvirni prispevek<\/a>\nMatematika v ozadju razvr\u0161\u010danja: <a href=\"https:\/\/en.wikipedia.org\/wiki\/PageRank\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/en.wikipedia.org\/wiki\/PageRank\">Wiki PageRank<\/a>\nZa nadebudne matematike:\u00a0<a href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\">Pagerank<\/a><\/p>\n&nbsp;\n\n<hr>\n<p class=\"hanging-indent\"><sup>1<\/sup> Russell, D., <em>What Do You Need to Know to Use a Search Engine? Why We Still Need to Teach Research Skills<\/em>, AI Magazine, 36(4), 2015.<\/p>\n<p class=\"hanging-indent\"><sup>2 <\/sup>Croft, B., Metzler D., Strohman, T.,<em> Search Engines, Information Retrieval in Practice<\/em>, 2015.<\/p>\n<p class=\"hanging-indent\"><sup>3<\/sup> Spencer, S., <em>Google Power Search: The Essential Guide to Finding Anything Online With Google<\/em>, Koshkonong, Kindle Edition.<\/p>","rendered":"<p class=\"no-indent\">V primerjavi z iskalniki iz za\u010detka tiso\u010dletja dana\u0161nji iskalniki opravljajo veliko podrobnej\u0161e in globlje analize. To pomeni, na primer, da ne le \u0161tejejo besede v besedilu, temve\u010d analizirajo in primerjajo pomen besed<sup>1<\/sup>. Veliko tak\u0161nih procesov poteka v postopku razvr\u0161\u010danja:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-203 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page-5-ranking-.png\" alt=\"\" width=\"468\" height=\"332\" \/><\/p>\n<h3 style=\"text-align: left\">4. korak: usklajevanje izrazov iz poizvedbe z izrazi iz kazala<\/h3>\n<figure id=\"attachment_76\" aria-describedby=\"caption-attachment-76\" style=\"width: 429px\" class=\"wp-caption alignleft\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-73\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/14\/2023\/11\/ch2-page-5-supercali-300x200.png\" alt=\"\" width=\"429\" height=\"286\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2023\/11\/ch2-page-5-supercali-300x200.png 300w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2023\/11\/ch2-page-5-supercali-1024x683.png 1024w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2023\/11\/ch2-page-5-supercali-768x512.png 768w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2023\/11\/ch2-page-5-supercali-1536x1024.png 1536w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2023\/11\/ch2-page-5-supercali-65x43.png 65w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2023\/11\/ch2-page-5-supercali-225x150.png 225w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2023\/11\/ch2-page-5-supercali-350x233.png 350w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2023\/11\/ch2-page-5-supercali.png 1800w\" sizes=\"(max-width: 429px) 100vw, 429px\" \/><figcaption id=\"caption-attachment-76\" class=\"wp-caption-text\">A Fast WordPiece Tokenization System, By Xinying Song and Denny Zhou and &#8220;Vintage Disney Mary Poppins Plate by Sun Valley Melmac&#8221; by GranniesKitchen je licenciran pod CC BY 2.0. \u010ce si \u017eelite ogledati kopijo te licence, obi\u0161\u010dite <a href=\"https:\/\/creativecommons.org\/licenses\/by\/2.0\/\">https:\/\/creativecommons.org\/licenses\/by\/2.0\/<\/a>? Source: <a href=\"https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html\">https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html<\/a>,<\/figcaption><\/figure>\n<p class=\"no-indent\">Ko uporabnik vnese iskalno poizvedbo in klikne na iskanje, se pri\u010dne obdelava poizvedbe. Po enakem principu, kot nastane besedilo, se ustvarijo \u017eetoni. Poizvedba se nato lahko raz\u0161iri, z dodatnimi klju\u010dnimi besedami. Na ta na\u010din se izognemo situaciji, da ustreznih dokumentov ne najdemo, ker v poizvedbi uporabljamo nekoliko druga\u010dne besede kot avtorji spletnih vsebin. To po\u010dnemo tudi zato, da upo\u0161tevamo morebitne razlike na\u010dinov rabe (npr., uporaba besed, kot so predsednik, premier, ali kancler, je lahko druga\u010dna glede na dr\u017eavo)<sup>1<\/sup>.<\/p>\n<p class=\"indent\">Ve\u010dina iskalnikov bele\u017ei zgodovino uporabnikovih poizvedb (za ve\u010d informacij si oglejte\u00a0<a href=\"a-brief-description-of-some-search-engines\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">Opis nekaterih priljubljenih iskalnikov<\/a>). Poizvedbe se bele\u017eijo skupaj s podatki o uporabniku, za u\u010dinkovitej\u0161o personalizacijo vsebin in zaradi prikazovanja oglasov. Podatki vseh uporabnikov se pogosto zdru\u017eijo in se obravnavajo kot celota, prav tako z namenom izbolj\u0161anja delovanja iskalnika.<\/p>\n<p class=\"indent\">Uporabni\u0161ki dnevniki vsebujejo prej\u0161nje poizvedbe, stran z rezultati in informacije o tem, kaj je delovalo (kaj je bilo ustrezno) &#8211; torej, kaj je uporabnik kliknil in koliko \u010dasa je porabil za branje teh strani. S pomo\u010djo uporabni\u0161kih dnevnikov\u00a0je mogo\u010de vsako poizvedbo povezati z relevantnimi dokumenti (uporabnik klikne, prebere stran in zaklju\u010di sejo) in z nerelevantnimi dokumenti (uporabnik ni kliknil ali prebral ali posku\u0161al preoblikovati poizvedbe)<sup>2<\/sup>.<\/p>\n<p class=\"indent\">S tak\u0161nimi dnevniki lahko vsako novo poizvedbo primerjamo s preteklo poizvedbo, ki je podobna trenutni. Eden od na\u010dinov, kako ugotoviti, da je poizvedba podobna drugi poizvedbi je, da pogledamo ali razvr\u0161\u010danje prika\u017ee iste dokumente: podobne poizvedbe morda ne vsebujejo vedno istih besed, vendar bodo prikazani rezultati verjetno enaki<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Pravopisne napake lahko popravimo s podobnimi poizvedbami. Za raz\u0161iritev poizvedbe lahko dodamo nove klju\u010dne besede ali sopomenke. To storimo tako, da poi\u0161\u010demo druge besede, ki se pogosto pojavljajo v dokumentih, ki so rezultat preteklih poizvedb. V splo\u0161nem pa velja, da se poizvedbi dodajo besede, ki se v relevantnih dokumentih pojavljajo pogosteje kot v nerelevantnih dokumentih, ali se tem besedam dodelijo dodatne ute\u017ei<sup>2<\/sup>.<\/p>\n<h3 style=\"text-align: left\">5. korak: razvrstitev ustreznih dokumentov<\/h3>\n<p class=\"no-indent\">Vsak dokument se oceni glede na relevantnost (ustreznost) in se nato glede na tak\u0161no oceno razvrsti. Pri tem je pomembna tako relevantnost teme &#8211; kako dobro se indeksirani izrazi dokumenta ujemajo z izrazi poizvedbe, kot tudi relevantnost za uporabnika &#8211; kako dobro se dokument ujema z uporabnikovimi preferencami. Delno lahko razvr\u0161\u010danje dokumentov poteka \u017ee med indeksiranjem. Hitrost iskalnika je odvisna od kakovosti kazal. U\u010dinkovitost iskalnikov temelji na tem, kako se poizvedba ujema z dokumentom, in na sistemu razvr\u0161\u010danja<sup>2<\/sup>.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-74 alignleft\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page-5-some-features-for-ranking-576x1024.jpg\" alt=\"\" width=\"369\" height=\"656\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page-5-some-features-for-ranking-576x1024.jpg 576w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page-5-some-features-for-ranking-169x300.jpg 169w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page-5-some-features-for-ranking-768x1365.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page-5-some-features-for-ranking-864x1536.jpg 864w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page-5-some-features-for-ranking-65x116.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page-5-some-features-for-ranking-225x400.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page-5-some-features-for-ranking-350x622.jpg 350w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page-5-some-features-for-ranking.jpg 1080w\" sizes=\"(max-width: 369px) 100vw, 369px\" \/><\/p>\n<p class=\"indent\">Relevantnost za uporabnika se meri s pomo\u010djo uporabni\u0161kih modelov (tipov osebnosti) na podlagi njihovih prej\u0161njih iskalnih izrazov, obiskanih spletnih mest, e-po\u0161tnih sporo\u010dil, naprave, ki jo uporabljajo, jezika in geografske lokacije. <a href=\"http-cookies\" data-cke-saved-href=\"http-cookies\">Pi\u0161kotki<\/a> se uporabljajo za shranjevanje uporabni\u0161kih nastavitev. Nekateri iskalniki kupujejo podatke o uporabnikih tudi od tretjih oseb (gl. poglavje\u00a0<a href=\"a-brief-description-of-some-search-engines\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">Opis nekaterih priljubljenih iskalnikov<\/a>). \u010ce osebo zanima nogomet, bodo njeni rezultati za poizvedbo \u201cManchester\u201d druga\u010dni od rezultatov za osebo, ki je pravkar rezervirala let v London. Besedam, ki se pogosto pojavljajo v dokumentih, relevantnih za to osebo, bo dodeljena najve\u010dja relevantnost.<\/p>\n<p class=\"indent\">Komercialni spletni iskalniki v svoje algoritme razvr\u0161\u010danja vklju\u010dujejo na stotine zna\u010dilnosti\/funkcij, od katerih jih veliko izhaja iz ogromne zbirke podatkov o interakciji uporabnikov (iz uporabni\u0161kih dnevnikov). Funkcija razvr\u0161\u010danja zdru\u017euje zna\u010dilnosti, ki se nana\u0161ajo na relevantnost dokumenta, poizvedbe in uporabnika. Ne glede na funkcijo razvr\u0161\u010danja ima le-ta v principu trdno matemati\u010dno podlago. Rezultat je izra\u017eena verjetnost, da dokument izpolnjuje uporabnikovo zahtevo. Dokument je razvr\u0161\u010den kot relevanten (ustrezen) takrat, ko je prese\u017eena dolo\u010dena stopnja verjetnosti za njegovo relelvantnost<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Strojno u\u010denje se uporablja za u\u010denje razvr\u0161\u010danja na podlagi implicitnih povratnih informacij uporabnika v uporabni\u0161kih dnevnikih (torej, kaj je delovalo oz. kaj je bilo ustrezno pri prej\u0161njih poizvedbah). Strojno u\u010denje se uporablja tudi za razvoj izpopolnjenih modelov \u010dlove\u0161ke rabe jezika, s pomo\u010djo katerih se dekodirajo poizvedbe<sup>1,2<\/sup>.<br \/>\n<img loading=\"lazy\" decoding=\"async\" class=\"wp-image-75 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page5-ML-ranking-300x251.png\" alt=\"\" width=\"423\" height=\"354\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page5-ML-ranking-300x251.png 300w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page5-ML-ranking-768x644.png 768w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page5-ML-ranking-65x54.png 65w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page5-ML-ranking-225x189.png 225w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page5-ML-ranking-350x293.png 350w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/ch2-page5-ML-ranking.png 940w\" sizes=\"(max-width: 423px) 100vw, 423px\" \/>V zadnjem desetletju je\u00a0tehnologija spletnega iskanja do\u017eivela velikanski napredek. Toda \u010de govorimo o razumevanju konteksta posamezne poizvedbe, ni\u010d ne more nadomestiti vnosa bolj\u0161e poizvedbe s strani uporabnika samega. Obi\u010dajno bolj\u0161e poizvedbe nastanejo tako, da uporabniki preu\u010dijo rezultate in nato preoblikujejo svojo prvotno poizvedbo<sup>2<\/sup>.<\/p>\n<h3 style=\"text-align: left\">6. korak: prikaz rezultatov<\/h3>\n<figure id=\"attachment_76\" aria-describedby=\"caption-attachment-76\" style=\"width: 477px\" class=\"wp-caption alignleft\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-76\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/14\/2024\/01\/che-page-5-search-results-300x240.png\" alt=\"\" width=\"477\" height=\"381\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/che-page-5-search-results-300x240.png 300w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/che-page-5-search-results-1024x819.png 1024w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/che-page-5-search-results-768x614.png 768w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/che-page-5-search-results-65x52.png 65w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/che-page-5-search-results-225x180.png 225w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/che-page-5-search-results-350x280.png 350w, https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-content\/uploads\/sites\/14\/2024\/01\/che-page-5-search-results.png 1280w\" sizes=\"(max-width: 477px) 100vw, 477px\" \/><figcaption id=\"caption-attachment-76\" class=\"wp-caption-text\">&#8220;Gumshoe DuckDuckGo Results&#8221; by jrbrusseau je licenciran pod CC BY-SA 2.0. \u010ce si \u017eelite ogledati kopijo te licence, obi\u0161\u010dite <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse\">https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse<\/a>.<\/figcaption><\/figure>\n<p class=\"indent no-indent\">Kon\u010dno so rezultati pripravljeni za prikaz. Prika\u017ee se naslov spletne strani (URL &#8211; Uniform Resource Locator), izrazi poizvedba pa so poudarjeni s krepkim tiskom. Pod vsako prikazano povezavo (rezultatom) je prikazan tudi kratek povzetek. V povzetku so izpostavljeni pomembni deli dokumenta. Uporabljeni so stavki iz naslovov, iz opisa metapodatkov ali iz besedila, ki najbolj ustreza poizvedbi. \u010ce so vsi poizvedbeni izrazi navedeni v naslovu, se v povzetkih ne ponovijo<sup>2<\/sup>. Stavki so izbrani tudi glede na to, kako berljivi so.<\/p>\n<p class=\"indent\">Prikazane rezultate spremljajo primerni oglasi. Z ogla\u0161evanjem ve\u010dina iskalnikov ustvarja prihodke. V nekaterih iskalnikih so oglasi jasno ozna\u010deni kot &#8216;sponzorirana vsebina&#8217;, v drugih pa ne. Ker si veliko uporabnikov ogleda le prvih nekaj rezultatov, imajo oglasi bistven vpliv na celoten postopek.<\/p>\n<p class=\"indent\">Oglasi so izbrani glede na kontekst poizvedbe in glede na model uporabnika. Podjetja, ki se ukvarjajo s spletnimi iskalniki, \u010drpajo iz podatkovne zbirke oglasov, kjer i\u0161\u010dejo najustreznej\u0161e oglase za dano poizvedbo. Ogla\u0161evalci zakupijo klju\u010dne besede, ki opisujejo teme, povezane z njihovim produktom. Znesek njihove ponudbe kot tudi priljubljenost oglasov sta pomembna dejavnika v postopku izbire<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Za poizvedbe o dejstvih nekateri iskalniki uporabljajo lastne zbirke dejstev. Googlova &#8220;zakladnica znanja&#8221; (Google Knowledge Vault) vsebuje ve\u010d kot milijardo dejstev, indeksiranih iz razli\u010dnih virov<sup>3<\/sup>. Rezultate algoritmi strojnega u\u010denja zdru\u017eijo v ustrezne skupine. Za konec se uporabniku predstavijo \u0161e alternative njegovi poizvedbi, s \u010dimer se preveri, ali nemara bolje ustrezajo njegovim dejanskim zahtevam.<\/p>\n<h3 style=\"text-align: left\">Nekaj uporabnih virov:<\/h3>\n<p class=\"no-indent\">Ve\u010d o nastanku in razvoju Googla:\u00a0<a href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\">S. Brin in L. Paige &#8211; izvirni prispevek<\/a><br \/>\nMatematika v ozadju razvr\u0161\u010danja: <a href=\"https:\/\/en.wikipedia.org\/wiki\/PageRank\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/en.wikipedia.org\/wiki\/PageRank\">Wiki PageRank<\/a><br \/>\nZa nadebudne matematike:\u00a0<a href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\">Pagerank<\/a><\/p>\n<p>&nbsp;<\/p>\n<hr \/>\n<p class=\"hanging-indent\"><sup>1<\/sup> Russell, D., <em>What Do You Need to Know to Use a Search Engine? Why We Still Need to Teach Research Skills<\/em>, AI Magazine, 36(4), 2015.<\/p>\n<p class=\"hanging-indent\"><sup>2 <\/sup>Croft, B., Metzler D., Strohman, T.,<em> Search Engines, Information Retrieval in Practice<\/em>, 2015.<\/p>\n<p class=\"hanging-indent\"><sup>3<\/sup> Spencer, S., <em>Google Power Search: The Essential Guide to Finding Anything Online With Google<\/em>, Koshkonong, Kindle Edition.<\/p>\n","protected":false},"author":1,"menu_order":5,"template":"","meta":{"pb_show_title":"","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[],"contributor":[],"license":[],"part":47,"_links":{"self":[{"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/pressbooks\/v2\/chapters\/77"}],"collection":[{"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":1,"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/pressbooks\/v2\/chapters\/77\/revisions"}],"predecessor-version":[{"id":78,"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/pressbooks\/v2\/chapters\/77\/revisions\/78"}],"part":[{"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/pressbooks\/v2\/parts\/47"}],"metadata":[{"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/pressbooks\/v2\/chapters\/77\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/wp\/v2\/media?parent=77"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/pressbooks\/v2\/chapter-type?post=77"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/wp\/v2\/contributor?post=77"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/wp\/v2\/license?post=77"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}