23
Der Prozess
Bei Google werden jetzt tiefe neuronale Netzwerke für das maschinelle Lernen eingesetzt2. Auf der Grundlage des Videomodells nimmt das neuronale Netzwerk von Youtube Videos, die denen ähnlich sind, die der Nutzende bereits angesehen hat. Dann versucht es, die Verweildauer jedes neuen Videos für eine bestimmte nutzende Person vorherzusagen und ordnet sie auf der Grundlage dieser Vorhersage ein. Die Idee ist dann, die 10 bis 20 Videos (je nach Gerät) mit den besten Platzierungen anzuzeigen.
Der Prozess ähnelt dem Machine-Learning-Modell, das wir zuvor untersucht haben. Zunächst nimmt die Maschine Merkmale aus Benutzer– und Videomodellen, die von der Programmierung vorgegeben werden. Sie lernt aus den Trainingsdaten, welche Gewichtung sie jedem Merkmal geben muss, um die Verweildauer korrekt vorherzusagen. Erst wenn es erprobt und für gut befunden ist, kann mit der Vorhersage und Empfehlung begonnen werden.
Schulung
Während des Trainings werden dem System Millionen von positiven und negativen Beispielen vorgelegt. Ein positives Beispiel ist, wenn eine nutzende Person auf ein Video geklickt und es sich eine bestimmte Zeit lang angesehen hat. Ein negatives Beispiel ist, wenn die Person nicht auf das Video geklickt oder es sich nicht lange angesehen hat2.
Das Netzwerk nimmt die Merkmale einer nutzenden Person und die Videomerkmale auf, die im Abschnitt Modelle in Wie Youtube über Sie lernt — Teil 1 besprochen wurden. Es passt die Wichtigkeit der einzelnen Eingabemerkmale an, indem es prüft, ob es die Sehdauer für ein bestimmtes Video und eine bestimmte nutzende Person korrekt vorhersagt.
Es gibt ungefähr eine Milliarde Parameter (Gewichtung jedes Merkmals), die anhand von Hunderten von Milliarden Beispielen erlernt werden müssen2. Das Netzwerk kann auch lernen, bestimmte Merkmale zu ignorieren, d.h. ihnen keine Bedeutung beizumessen. So kann die Einbettung oder das Modell, das der Algorithmus erstellt, ganz anders aussehen, als es sich die Entwickelnden vorgestellt haben.
Testen
Nachdem das Netzwerk trainiert wurde, wird es an bereits verfügbaren Daten getestet und angepasst. Abgesehen von der Vorhersagegenauigkeit muss die Ausgabe des Systems von den Programmierenden auf der Grundlage mehrerer Werturteile angepasst werden. Die Anzeige von Videos, die den bereits angesehenen Videos zu ähnlich sind, ist nicht sehr vielsprechend. Was bedeutet es wirklich, dass eine Empfehlung gut ist? Wie viele ähnliche Videos sollen gezeigt werden und wie viel Abwechslung soll es geben – sowohl in Bezug auf die anderen Videos als auch in Bezug auf den Verlauf der nutzenden Person? Wie viele der Interessen des Nutzenden sollen abgedeckt werden? Welche Art von Empfehlungen führt zu sofortiger Zufriedenheit und welche zu langfristiger Nutzung?1, 3 All dies sind wichtige Fragen, die es zu berücksichtigen gilt.
Nach diesem Test wird eine Echtzeitbewertung der Empfehlungen durchgeführt. Gemessen wird die Gesamtzeit, die eine nutzende Person sich die empfohlenen Videos ansieht2. Je länger sie sich diese Videos ansieht, desto erfolgreicher ist das Modell. Beachten Sie, dass die Anzahl der angeklickten Videos für die Bewertung nicht ausreicht. Youtube bewertet seine Empfehlungsgeber auf der Grundlage der Anzahl der empfohlenen Videos, die zu einem erheblichen Teil angeschaut wurden, der Sitzungsdauer, der Zeit bis zum ersten längeren Anschauen und des Anteils der eingeloggten Nutzenden mit Empfehlungen1.
Interface
Schließlich geht es darum, wie die Empfehlungen präsentiert werden: Wie viele Videos sollen gezeigt werden? Sollen die besten Empfehlungen alle auf einmal präsentiert werden, oder sollen einige für später gespeichert werden? 3 Wie sollen Miniaturbilder und Videotitel angezeigt werden? Welche anderen Informationen sollen angezeigt werden? Welche Einstellungen kann die nutzende Person kontrollieren?1 Die Antworten auf diese Fragen bestimmen, wie Youtube seine zwei Milliarden Nutzerinnen und Nutzer rund um die Uhr an sich bindet.
1 Davidson, J., Liebald, B., Liu, J., Nandy, P., Vleet, T., The Youtube Video Recommendation System, Proceedings of the 4th ACM Conference on Recommender Systems, Barcelona, 2010.
2 Covington, P., Adams, J., Sargin, E., Deep neural networks for Youtube Recommendations, Proceedings of the 10th ACM Conference on Recommender Systems, ACM, New York, 2016.
3 Konstan, J., Terveen, L., Human-centered recommender systems: Origins, advances, challenges, and opportunities, AI Magazine, 42(3), 31-42, 2021.
4 Spinelli, L., and Crovella, M., How YouTube Leads Privacy-Seeking Users Away from Reliable Information, In Adjunct Publication of the 28th ACM Conference on User Modeling, Adaptation and Personalization (UMAP ’20 Adjunct), Association for Computing Machinery, New York, 244–251, 2020.