{"id":78,"date":"2023-11-30T16:59:38","date_gmt":"2023-11-30T16:59:38","guid":{"rendered":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/chapter\/ai-speak-search-engine-ranking\/"},"modified":"2024-01-31T11:43:00","modified_gmt":"2024-01-31T11:43:00","slug":"ai-speak-search-engine-ranking","status":"publish","type":"chapter","link":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/chapter\/ai-speak-search-engine-ranking\/","title":{"raw":"KI-Sprache: Suchmaschinen-Ranking","rendered":"KI-Sprache: Suchmaschinen-Ranking"},"content":{"raw":"<p class=\"no-indent\">Im Vergleich zu den Suchmaschinen der fr\u00fchen 2000er Jahre f\u00fchren die heutigen Suchmaschinen umfangreichere und tiefere Analysen durch. Zum Beispiel k\u00f6nnen sie nicht nur W\u00f6rter z\u00e4hlen, sondern auch die Bedeutung hinter den W\u00f6rtern analysieren und vergleichen.<sup>1<\/sup> Vieles davon geschieht im Ranking-Prozess:<\/p>\n<img class=\" wp-image-203 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/13\/2023\/11\/ch2-page-5-ranking-.png\" alt=\"\" width=\"468\" height=\"332\">\n<h3>Schritt 4: Abfragebegriffe werden mit Indexbegriffen abgeglichen<\/h3>\n[caption id=\"attachment_77\" align=\"alignleft\" width=\"429\"]<img class=\"wp-image-74\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-supercali-300x200.png\" alt=\"\" width=\"429\" height=\"286\"> Quelle : <a href=\"https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html\">https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html<\/a>, A Fast WordPiece Tokenization System, By Xinying Song and Denny Zhou and \"Vintage Disney Mary Poppins Plate by Sun Valley Melmac\" bei GranniesKitchen ist lizensiert unterCC BY 2.0. Informationen zu dieser Lizenz finden Sie unter: <a href=\"https:\/\/creativecommons.org\/licenses\/by\/2.0\/\">https:\/\/creativecommons.org\/licenses\/by\/2.0\/<\/a>?[\/caption]\n<p class=\"no-indent\">Wenn die nutzende Person die Suchanfrage eingibt und auf<em> Suchen<\/em> klickt, wird die Anfrage verarbeitet. Die <em>Token<\/em> werden mit demselben Verfahren wie der Dokumententext erstellt. Dann kann die Abfrage durch Hinzuf\u00fcgen weiterer Schl\u00fcsselw\u00f6rter erweitert werden. Damit soll vermieden werden, dass relevante Dokumente nicht gefunden werden, weil die Abfrage etwas andere W\u00f6rter verwendet als die Autoren oder Autorinnen der Webinhalte. Dies geschieht auch, um Unterschiede in der Gewohnheit und im Gebrauch zu erfassen. Zum Beispiel kann die Verwendung von W\u00f6rtern wie Pr\u00e4sident, Premierminister und Kanzler je nach Land unterschiedlich sein<sup>1<\/sup>.<\/p>\n<p class=\"indent\">Die meisten Suchmaschinen zeichnen die Suchanfragen der Nutzenden auf (siehe <a href=\"a-brief-description-of-some-search-engines\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">Beschreibung einiger popul\u00e4rer Suchmaschinen<\/a>). Die Suchanfragen werden zusammen mit den Nutzerdaten aufgezeichnet, um Inhalte zu personalisieren und Werbung zu schalten. Oder die Datens\u00e4tze aller Nutzenden werden zusammengef\u00fchrt, um zu sehen, wie und wo die Leistung der Suchmaschine verbessert werden kann.<\/p>\n<p class=\"indent\">Benutzerprotokolle enthalten fr\u00fchere Abfragen, die Ergebnisseite und Informationen dar\u00fcber, was funktioniert hat\u00a0\u2014 was die nutzende Person angeklickt und was sie gelesen hat. Anhand der Benutzerprotokolle kann jede Abfrage mit relevanten Dokumenten (die nutzende Person klickt, liest und schlie\u00dft die Sitzung) und nicht relevanten Dokumenten (die nutzende Person hat nicht geklickt oder nicht gelesen oder versucht, die Abfrage neu zu formulieren) abgeglichen werden<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Anhand dieser Protokolle kann jede neue Abfrage mit einer fr\u00fcheren, \u00e4hnlichen Abfrage abgeglichen werden. Eine M\u00f6glichkeit, um festzustellen, ob eine Abfrage einer anderen \u00e4hnlich ist, besteht darin, zu sehen, ob das Ranking die gleichen Dokumente ergibt: \u00c4hnliche Abfragen enthalten zwar nicht immer die gleichen W\u00f6rter, aber die Ergebnisse sind wahrscheinlich identisch<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Rechtschreibfehler k\u00f6nnen mit \u00e4hnlichen Suchanfragen korrigiert werden. Neue Schl\u00fcsselw\u00f6rter und Synonyme k\u00f6nnen hinzugef\u00fcgt werden, um die Abfrage zu erweitern.\u00a0 Im Allgemeinen werden W\u00f6rter, die in den relevanten Dokumenten h\u00e4ufiger vorkommen als in den nicht relevanten Dokumenten, der Abfrage hinzugef\u00fcgt oder zus\u00e4tzlich gewichtet<sup>2<\/sup>.<\/p>\n\n<h3>Schritt 5: Relevante Dokumente werden eingestuft<\/h3>\n<p class=\"no-indent\">Jedes Dokument wird nach seiner Relevanz bewertet und entsprechend dieser Bewertung eingestuft. Relevanz bedeutet hier sowohl Themenrelevanz\u00a0\u2014 wie gut die Indexbegriffe eines Dokuments mit denen der Anfrage \u00fcbereinstimmen\u00a0\u2014 als auch Benutzerrelevanz\u00a0\u2014 wie gut es den Pr\u00e4ferenzen der nutzenden Person entspricht. Ein Teil der Dokumentenbewertung kann w\u00e4hrend der Indizierung erfolgen. Die Geschwindigkeit der Suchmaschine h\u00e4ngt von der Qualit\u00e4t der Indizes ab. Die Effektivit\u00e4t der Suchmaschine h\u00e4ngt davon ab, wie gut die Anfrage mit dem Dokument \u00fcbereinstimmt und wie das Ranking-System funktioniert<sup>2<\/sup>.<\/p>\n<p class=\"indent\"><img class=\" wp-image-75 alignleft\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-some-features-for-ranking-576x1024.jpg\" alt=\"\" width=\"369\" height=\"656\">Die Relevanz der Nutzenden wird durch die Erstellung von Nutzermodellen (oder Pers\u00f6nlichkeitstypen) auf der Grundlage ihrer fr\u00fcheren Suchbegriffe, besuchten Websites, E-Mail-Nachrichten, des von ihnen verwendeten Ger\u00e4ts, der Sprache und des geografischen Standorts gemessen. <a href=\"http-cookies\" data-cke-saved-href=\"http-cookies\">Cookies<\/a> werden verwendet, um Benutzereinstellungen zu speichern. Einige Suchmaschinen kaufen auch Benutzerinformationen von Dritten (siehe <a href=\"a-brief-description-of-some-search-engines\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">Beschreibung einiger Suchmaschinen<\/a>). Wenn sich eine Person f\u00fcr Fu\u00dfball interessiert, werden ihre Ergebnisse f\u00fcr \u201eManchester\u201d andere sein als die einer Person, die gerade einen Flug nach London gebucht hat. W\u00f6rter, die in den Dokumenten, die mit einer Person in Verbindung stehen, h\u00e4ufig vorkommen, erhalten die gr\u00f6\u00dfte Bedeutung.<\/p>\n<p class=\"indent\">Kommerzielle Web-Suchmaschinen integrieren Hunderte von Merkmalen in ihre Ranking-Algorithmen, von denen viele aus der riesigen Sammlung von Benutzerinteraktionsdaten in den Abfrageprotokollen stammen. Eine Ranking-Funktion kombiniert das Dokument, die Abfrage und die Relevanzmerkmale der nutzenden Person, und zwar auf einer soliden mathematischen Grundlage. Die Ausgabe ist die Wahrscheinlichkeit, dass ein Dokument den Informationsbedarf der nutzenden Person befriedigt. Ab einer bestimmten Relevanzwahrscheinlichkeit wird das Dokument als relevant eingestuft.<sup>2<\/sup><\/p>\n<p class=\"indent\">Maschinelles Lernen wird verwendet, um die Einstufung anhand von implizitem Benutzerfeedback in den Protokollen zu erlernen (was bei fr\u00fcheren Abfragen funktioniert hat). Maschinelles Lernen wurde auch verwendet, um ausgefeilte Modelle zu entwickeln, die zeigen, wie Menschen Sprache verwenden, um Abfragen zu entschl\u00fcsseln<sup>1, 2<\/sup>. <img class=\"wp-image-76 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page5-ML-ranking-300x251.png\" alt=\"\" width=\"423\" height=\"354\">\nDie Fortschritte bei der Websuche waren im letzten Jahrzehnt ph\u00e4nomenal. Wenn es jedoch darum geht, den Kontext einer bestimmten Anfrage zu verstehen, gibt es keinen Ersatz f\u00fcr eine bessere Anfrage durch die Nutzenden. Bessere Abfragen entstehen in der Regel dadurch, dass die Nutzenden die Ergebnisse pr\u00fcfen und die Abfrage neu formulieren<sup>2<\/sup>.<\/p>\n\n<h3>Schritt 6: Ergebnisse werden angezeigt<\/h3>\n[caption id=\"attachment_77\" align=\"alignleft\" width=\"477\"]<img class=\"wp-image-77\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/13\/2024\/01\/che-page-5-search-results-300x240.png\" alt=\"\" width=\"477\" height=\"381\"> \"Gumshoe DuckDuckGo Results\" bei jrbrusseau ist lizensiert unter CC BY-SA 2.0. Informationen zu dieser Lizenz finden Sie unter: <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse\">https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse<\/a>.[\/caption]\n<p class=\"no-indent\">Endlich sind die Ergebnisse bereit, angezeigt zu werden. Der Titel und die URL der Seite werden angezeigt, wobei die Suchbegriffe fett gedruckt sind. Eine kurze Zusammenfassung wird erstellt und nach jedem Link angezeigt. Die Zusammenfassung hebt wichtige Passagen des Dokuments hervor. Hierf\u00fcr werden S\u00e4tze aus \u00dcberschriften, Metadatenbeschreibungen oder aus dem Text verwendet, der am besten mit der Abfrage \u00fcbereinstimmt. Wenn alle Abfragebegriffe im Titel vorkommen, werden sie im <em>Snippet<\/em> nicht wiederholt<sup>2<\/sup>. Die S\u00e4tze werden auch danach ausgew\u00e4hlt, wie lesbar sie sind.<\/p>\n<p class=\"indent\">Angemessene Werbung wird zu den Ergebnissen hinzugef\u00fcgt. Mit Werbung erzielen die meisten Suchmaschinen ihre Einnahmen. Bei einigen Suchmaschinen sind sie deutlich als gesponserte Inhalte gekennzeichnet, bei anderen nicht. Da sich viele Nutzende nur die ersten paar Ergebnisse ansehen, ver\u00e4ndern Anzeigen den gesamten Prozess erheblich.<\/p>\n<p class=\"indent\">Anzeigen werden je nach Kontext der Suchanfrage und dem Nutzermodell ausgew\u00e4hlt. Suchmaschinenunternehmen unterhalten eine Datenbank mit Anzeigen, die durchsucht wird, um die relevantesten Anzeigen f\u00fcr eine bestimmte Suchanfrage zu finden. Die Inserierenden bieten f\u00fcr Schl\u00fcsselw\u00f6rter, die Themen beschreiben, die mit ihrem Produkt in Verbindung stehen. Bei der Auswahl der Anzeigen spielen sowohl der gebotene Betrag als auch die Popularit\u00e4t der Anzeige eine wichtige Rolle<sup>2<\/sup>.<\/p>\n<p class=\"indent\">F\u00fcr Fragen zu Fakten verwenden einige Suchmaschinen ihre eigene Sammlung von Fakten. Googles Knowledge Vault enth\u00e4lt \u00fcber eine Milliarde Fakten aus verschiedenen Quellen.<sup>3 <\/sup>Die Ergebnisse werden von Algorithmen f\u00fcr maschinelles Lernen in geeignete Gruppen eingeteilt. Schlie\u00dflich werden den Nutzenden auch Alternativen zur Abfrage pr\u00e4sentiert, um zu sehen, ob diese besser zu ihrem tats\u00e4chlichen Bedarf passen.<\/p>\n\n<h3>Einige Referenzen:<\/h3>\nDen Ursprung von Google finden Sie in <a href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\">Brin und Paiges Originalarbeit<\/a>. Einige der mathematischen Grundlagen von Pagerank finden Sie im <a href=\"https:\/\/de.wikipedia.org\/wiki\/PageRank\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/de.wikipedia.org\/wiki\/PageRank\">Wiki-Artikel PageRank.\u00a0<\/a>Mathematisch Interessierte k\u00f6nnen hier eine vollst\u00e4ndige\u00a0 <a href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\">Erkl\u00e4rung des PageRank-Algorithmus<\/a> lesen.\n\n<hr>\n<p class=\"hanging-indent\"><sup>1<\/sup> Russell, D., <em>What Do You Need to Know to Use a Search Engine? Why We Still Need to Teach Research Skills<\/em>, AI Magazine, 36(4), 2015.<\/p>\n<p class=\"hanging-indent\"><sup>2 <\/sup>Croft, B., Metzler D., Strohman, T.,<em> Search Engines, Information Retrieval in Practice<\/em>, 2015.<\/p>\n<p class=\"hanging-indent\"><sup>3<\/sup> Spencer, S., <em>Google Power Search: The Essential Guide to Finding Anything Online With Google<\/em>, Koshkonong, Kindle Edition.<\/p>","rendered":"<p class=\"no-indent\">Im Vergleich zu den Suchmaschinen der fr\u00fchen 2000er Jahre f\u00fchren die heutigen Suchmaschinen umfangreichere und tiefere Analysen durch. Zum Beispiel k\u00f6nnen sie nicht nur W\u00f6rter z\u00e4hlen, sondern auch die Bedeutung hinter den W\u00f6rtern analysieren und vergleichen.<sup>1<\/sup> Vieles davon geschieht im Ranking-Prozess:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-203 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/13\/2023\/11\/ch2-page-5-ranking-.png\" alt=\"\" width=\"468\" height=\"332\" \/><\/p>\n<h3>Schritt 4: Abfragebegriffe werden mit Indexbegriffen abgeglichen<\/h3>\n<figure id=\"attachment_77\" aria-describedby=\"caption-attachment-77\" style=\"width: 429px\" class=\"wp-caption alignleft\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-74\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-supercali-300x200.png\" alt=\"\" width=\"429\" height=\"286\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-supercali-300x200.png 300w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-supercali-1024x683.png 1024w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-supercali-768x512.png 768w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-supercali-1536x1024.png 1536w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-supercali-65x43.png 65w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-supercali-225x150.png 225w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-supercali-350x233.png 350w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-supercali.png 1800w\" sizes=\"(max-width: 429px) 100vw, 429px\" \/><figcaption id=\"caption-attachment-77\" class=\"wp-caption-text\">Quelle : <a href=\"https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html\">https:\/\/ai.googleblog.com\/2021\/12\/a-fast-wordpiece-tokenization-system.html<\/a>, A Fast WordPiece Tokenization System, By Xinying Song and Denny Zhou and &#8220;Vintage Disney Mary Poppins Plate by Sun Valley Melmac&#8221; bei GranniesKitchen ist lizensiert unterCC BY 2.0. Informationen zu dieser Lizenz finden Sie unter: <a href=\"https:\/\/creativecommons.org\/licenses\/by\/2.0\/\">https:\/\/creativecommons.org\/licenses\/by\/2.0\/<\/a>?<\/figcaption><\/figure>\n<p class=\"no-indent\">Wenn die nutzende Person die Suchanfrage eingibt und auf<em> Suchen<\/em> klickt, wird die Anfrage verarbeitet. Die <em>Token<\/em> werden mit demselben Verfahren wie der Dokumententext erstellt. Dann kann die Abfrage durch Hinzuf\u00fcgen weiterer Schl\u00fcsselw\u00f6rter erweitert werden. Damit soll vermieden werden, dass relevante Dokumente nicht gefunden werden, weil die Abfrage etwas andere W\u00f6rter verwendet als die Autoren oder Autorinnen der Webinhalte. Dies geschieht auch, um Unterschiede in der Gewohnheit und im Gebrauch zu erfassen. Zum Beispiel kann die Verwendung von W\u00f6rtern wie Pr\u00e4sident, Premierminister und Kanzler je nach Land unterschiedlich sein<sup>1<\/sup>.<\/p>\n<p class=\"indent\">Die meisten Suchmaschinen zeichnen die Suchanfragen der Nutzenden auf (siehe <a href=\"a-brief-description-of-some-search-engines\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">Beschreibung einiger popul\u00e4rer Suchmaschinen<\/a>). Die Suchanfragen werden zusammen mit den Nutzerdaten aufgezeichnet, um Inhalte zu personalisieren und Werbung zu schalten. Oder die Datens\u00e4tze aller Nutzenden werden zusammengef\u00fchrt, um zu sehen, wie und wo die Leistung der Suchmaschine verbessert werden kann.<\/p>\n<p class=\"indent\">Benutzerprotokolle enthalten fr\u00fchere Abfragen, die Ergebnisseite und Informationen dar\u00fcber, was funktioniert hat\u00a0\u2014 was die nutzende Person angeklickt und was sie gelesen hat. Anhand der Benutzerprotokolle kann jede Abfrage mit relevanten Dokumenten (die nutzende Person klickt, liest und schlie\u00dft die Sitzung) und nicht relevanten Dokumenten (die nutzende Person hat nicht geklickt oder nicht gelesen oder versucht, die Abfrage neu zu formulieren) abgeglichen werden<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Anhand dieser Protokolle kann jede neue Abfrage mit einer fr\u00fcheren, \u00e4hnlichen Abfrage abgeglichen werden. Eine M\u00f6glichkeit, um festzustellen, ob eine Abfrage einer anderen \u00e4hnlich ist, besteht darin, zu sehen, ob das Ranking die gleichen Dokumente ergibt: \u00c4hnliche Abfragen enthalten zwar nicht immer die gleichen W\u00f6rter, aber die Ergebnisse sind wahrscheinlich identisch<sup>2<\/sup>.<\/p>\n<p class=\"indent\">Rechtschreibfehler k\u00f6nnen mit \u00e4hnlichen Suchanfragen korrigiert werden. Neue Schl\u00fcsselw\u00f6rter und Synonyme k\u00f6nnen hinzugef\u00fcgt werden, um die Abfrage zu erweitern.\u00a0 Im Allgemeinen werden W\u00f6rter, die in den relevanten Dokumenten h\u00e4ufiger vorkommen als in den nicht relevanten Dokumenten, der Abfrage hinzugef\u00fcgt oder zus\u00e4tzlich gewichtet<sup>2<\/sup>.<\/p>\n<h3>Schritt 5: Relevante Dokumente werden eingestuft<\/h3>\n<p class=\"no-indent\">Jedes Dokument wird nach seiner Relevanz bewertet und entsprechend dieser Bewertung eingestuft. Relevanz bedeutet hier sowohl Themenrelevanz\u00a0\u2014 wie gut die Indexbegriffe eines Dokuments mit denen der Anfrage \u00fcbereinstimmen\u00a0\u2014 als auch Benutzerrelevanz\u00a0\u2014 wie gut es den Pr\u00e4ferenzen der nutzenden Person entspricht. Ein Teil der Dokumentenbewertung kann w\u00e4hrend der Indizierung erfolgen. Die Geschwindigkeit der Suchmaschine h\u00e4ngt von der Qualit\u00e4t der Indizes ab. Die Effektivit\u00e4t der Suchmaschine h\u00e4ngt davon ab, wie gut die Anfrage mit dem Dokument \u00fcbereinstimmt und wie das Ranking-System funktioniert<sup>2<\/sup>.<\/p>\n<p class=\"indent\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-75 alignleft\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-some-features-for-ranking-576x1024.jpg\" alt=\"\" width=\"369\" height=\"656\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-some-features-for-ranking-576x1024.jpg 576w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-some-features-for-ranking-169x300.jpg 169w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-some-features-for-ranking-768x1365.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-some-features-for-ranking-864x1536.jpg 864w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-some-features-for-ranking-65x116.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-some-features-for-ranking-225x400.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-some-features-for-ranking-350x622.jpg 350w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page-5-some-features-for-ranking.jpg 1080w\" sizes=\"(max-width: 369px) 100vw, 369px\" \/>Die Relevanz der Nutzenden wird durch die Erstellung von Nutzermodellen (oder Pers\u00f6nlichkeitstypen) auf der Grundlage ihrer fr\u00fcheren Suchbegriffe, besuchten Websites, E-Mail-Nachrichten, des von ihnen verwendeten Ger\u00e4ts, der Sprache und des geografischen Standorts gemessen. <a href=\"http-cookies\" data-cke-saved-href=\"http-cookies\">Cookies<\/a> werden verwendet, um Benutzereinstellungen zu speichern. Einige Suchmaschinen kaufen auch Benutzerinformationen von Dritten (siehe <a href=\"a-brief-description-of-some-search-engines\" data-cke-saved-href=\"a-brief-description-of-some-search-engines\">Beschreibung einiger Suchmaschinen<\/a>). Wenn sich eine Person f\u00fcr Fu\u00dfball interessiert, werden ihre Ergebnisse f\u00fcr \u201eManchester\u201d andere sein als die einer Person, die gerade einen Flug nach London gebucht hat. W\u00f6rter, die in den Dokumenten, die mit einer Person in Verbindung stehen, h\u00e4ufig vorkommen, erhalten die gr\u00f6\u00dfte Bedeutung.<\/p>\n<p class=\"indent\">Kommerzielle Web-Suchmaschinen integrieren Hunderte von Merkmalen in ihre Ranking-Algorithmen, von denen viele aus der riesigen Sammlung von Benutzerinteraktionsdaten in den Abfrageprotokollen stammen. Eine Ranking-Funktion kombiniert das Dokument, die Abfrage und die Relevanzmerkmale der nutzenden Person, und zwar auf einer soliden mathematischen Grundlage. Die Ausgabe ist die Wahrscheinlichkeit, dass ein Dokument den Informationsbedarf der nutzenden Person befriedigt. Ab einer bestimmten Relevanzwahrscheinlichkeit wird das Dokument als relevant eingestuft.<sup>2<\/sup><\/p>\n<p class=\"indent\">Maschinelles Lernen wird verwendet, um die Einstufung anhand von implizitem Benutzerfeedback in den Protokollen zu erlernen (was bei fr\u00fcheren Abfragen funktioniert hat). Maschinelles Lernen wurde auch verwendet, um ausgefeilte Modelle zu entwickeln, die zeigen, wie Menschen Sprache verwenden, um Abfragen zu entschl\u00fcsseln<sup>1, 2<\/sup>. <img loading=\"lazy\" decoding=\"async\" class=\"wp-image-76 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page5-ML-ranking-300x251.png\" alt=\"\" width=\"423\" height=\"354\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page5-ML-ranking-300x251.png 300w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page5-ML-ranking-768x644.png 768w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page5-ML-ranking-65x54.png 65w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page5-ML-ranking-225x189.png 225w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page5-ML-ranking-350x293.png 350w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/ch2-page5-ML-ranking.png 940w\" sizes=\"(max-width: 423px) 100vw, 423px\" \/><br \/>\nDie Fortschritte bei der Websuche waren im letzten Jahrzehnt ph\u00e4nomenal. Wenn es jedoch darum geht, den Kontext einer bestimmten Anfrage zu verstehen, gibt es keinen Ersatz f\u00fcr eine bessere Anfrage durch die Nutzenden. Bessere Abfragen entstehen in der Regel dadurch, dass die Nutzenden die Ergebnisse pr\u00fcfen und die Abfrage neu formulieren<sup>2<\/sup>.<\/p>\n<h3>Schritt 6: Ergebnisse werden angezeigt<\/h3>\n<figure id=\"attachment_77\" aria-describedby=\"caption-attachment-77\" style=\"width: 477px\" class=\"wp-caption alignleft\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-77\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/13\/2024\/01\/che-page-5-search-results-300x240.png\" alt=\"\" width=\"477\" height=\"381\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/che-page-5-search-results-300x240.png 300w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/che-page-5-search-results-1024x819.png 1024w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/che-page-5-search-results-768x614.png 768w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/che-page-5-search-results-65x52.png 65w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/che-page-5-search-results-225x180.png 225w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/che-page-5-search-results-350x280.png 350w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2024\/01\/che-page-5-search-results.png 1280w\" sizes=\"(max-width: 477px) 100vw, 477px\" \/><figcaption id=\"caption-attachment-77\" class=\"wp-caption-text\">&#8220;Gumshoe DuckDuckGo Results&#8221; bei jrbrusseau ist lizensiert unter CC BY-SA 2.0. Informationen zu dieser Lizenz finden Sie unter: <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse\">https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse<\/a>.<\/figcaption><\/figure>\n<p class=\"no-indent\">Endlich sind die Ergebnisse bereit, angezeigt zu werden. Der Titel und die URL der Seite werden angezeigt, wobei die Suchbegriffe fett gedruckt sind. Eine kurze Zusammenfassung wird erstellt und nach jedem Link angezeigt. Die Zusammenfassung hebt wichtige Passagen des Dokuments hervor. Hierf\u00fcr werden S\u00e4tze aus \u00dcberschriften, Metadatenbeschreibungen oder aus dem Text verwendet, der am besten mit der Abfrage \u00fcbereinstimmt. Wenn alle Abfragebegriffe im Titel vorkommen, werden sie im <em>Snippet<\/em> nicht wiederholt<sup>2<\/sup>. Die S\u00e4tze werden auch danach ausgew\u00e4hlt, wie lesbar sie sind.<\/p>\n<p class=\"indent\">Angemessene Werbung wird zu den Ergebnissen hinzugef\u00fcgt. Mit Werbung erzielen die meisten Suchmaschinen ihre Einnahmen. Bei einigen Suchmaschinen sind sie deutlich als gesponserte Inhalte gekennzeichnet, bei anderen nicht. Da sich viele Nutzende nur die ersten paar Ergebnisse ansehen, ver\u00e4ndern Anzeigen den gesamten Prozess erheblich.<\/p>\n<p class=\"indent\">Anzeigen werden je nach Kontext der Suchanfrage und dem Nutzermodell ausgew\u00e4hlt. Suchmaschinenunternehmen unterhalten eine Datenbank mit Anzeigen, die durchsucht wird, um die relevantesten Anzeigen f\u00fcr eine bestimmte Suchanfrage zu finden. Die Inserierenden bieten f\u00fcr Schl\u00fcsselw\u00f6rter, die Themen beschreiben, die mit ihrem Produkt in Verbindung stehen. Bei der Auswahl der Anzeigen spielen sowohl der gebotene Betrag als auch die Popularit\u00e4t der Anzeige eine wichtige Rolle<sup>2<\/sup>.<\/p>\n<p class=\"indent\">F\u00fcr Fragen zu Fakten verwenden einige Suchmaschinen ihre eigene Sammlung von Fakten. Googles Knowledge Vault enth\u00e4lt \u00fcber eine Milliarde Fakten aus verschiedenen Quellen.<sup>3 <\/sup>Die Ergebnisse werden von Algorithmen f\u00fcr maschinelles Lernen in geeignete Gruppen eingeteilt. Schlie\u00dflich werden den Nutzenden auch Alternativen zur Abfrage pr\u00e4sentiert, um zu sehen, ob diese besser zu ihrem tats\u00e4chlichen Bedarf passen.<\/p>\n<h3>Einige Referenzen:<\/h3>\n<p>Den Ursprung von Google finden Sie in <a href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http:\/\/infolab.stanford.edu\/pub\/papers\/google.pdf\">Brin und Paiges Originalarbeit<\/a>. Einige der mathematischen Grundlagen von Pagerank finden Sie im <a href=\"https:\/\/de.wikipedia.org\/wiki\/PageRank\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/de.wikipedia.org\/wiki\/PageRank\">Wiki-Artikel PageRank.\u00a0<\/a>Mathematisch Interessierte k\u00f6nnen hier eine vollst\u00e4ndige\u00a0 <a href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/towardsdatascience.com\/pagerank-algorithm-fully-explained-dc794184b4af\">Erkl\u00e4rung des PageRank-Algorithmus<\/a> lesen.<\/p>\n<hr \/>\n<p class=\"hanging-indent\"><sup>1<\/sup> Russell, D., <em>What Do You Need to Know to Use a Search Engine? Why We Still Need to Teach Research Skills<\/em>, AI Magazine, 36(4), 2015.<\/p>\n<p class=\"hanging-indent\"><sup>2 <\/sup>Croft, B., Metzler D., Strohman, T.,<em> Search Engines, Information Retrieval in Practice<\/em>, 2015.<\/p>\n<p class=\"hanging-indent\"><sup>3<\/sup> Spencer, S., <em>Google Power Search: The Essential Guide to Finding Anything Online With Google<\/em>, Koshkonong, Kindle Edition.<\/p>\n","protected":false},"author":1,"menu_order":5,"template":"","meta":{"pb_show_title":"","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[],"contributor":[],"license":[],"part":47,"_links":{"self":[{"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/pressbooks\/v2\/chapters\/78"}],"collection":[{"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":1,"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/pressbooks\/v2\/chapters\/78\/revisions"}],"predecessor-version":[{"id":79,"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/pressbooks\/v2\/chapters\/78\/revisions\/79"}],"part":[{"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/pressbooks\/v2\/parts\/47"}],"metadata":[{"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/pressbooks\/v2\/chapters\/78\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/wp\/v2\/media?parent=78"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/pressbooks\/v2\/chapter-type?post=78"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/wp\/v2\/contributor?post=78"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/wp\/v2\/license?post=78"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}