22
Modèles et recommandation
ACTIVITÉ
Il s’agit des transactions par carte de crédit de deux personnes vivant à Nantes. Elles cherchent des activités à découvrir ce week-end. Que recommanderez-vous à John Doe et à Tom Harris ?
Liste de choix :
- Le nouveau point de vente Burger King
- Une dégustation d’huile d’olive
- Un site de bagagerie en ligne
- Un concert au bord de la rivière
- Un cours de natation pour bébé
Les systèmes de recommandation existent depuis au moins aussi longtemps que les guides touristiques et les listes du top 10. Alors que Le Monde des meilleurs livres de 2022 conseille la même liste à tout le monde, vous l’adapteriez probablement lorsque vous choisissez pour vous-même : choisissez-en quelques-uns et changez l’ordre de lecture en fonction de vos préférences personnelles.
Comment recommander des ouvrages à des inconnus ? Dans l’activité ci-dessus, vous avez probablement essayé d’imaginer leur personnalité à partir des informations données : vous avez porté des jugements et appliqué des stéréotypes. Puis, une fois que vous avez eu une idée de leur “genre”, vous avez choisi dans la liste des choses qui pourraient (ou non) être pertinentes pour eux. Les recommandeurs comme Amazon, Netflix et Youtube suivent un processus similaire.
De nos jours, chaque fois qu’une personne recherche des informations ou cherche à découvrir du contenu en ligne, elle utilise une sorte de système de recommandation personnalisé1,2. La principale fonction de Youtube est de dire à ses utilisateurs quoi regarder parmi toutes les vidéos disponibles sur la plateforme. Pour les utilisateurs inscrits, il utilise leur activité passée pour créer un “modèle”, ou un type de personnalité. Une fois qu’elle a un modèle pour John, elle peut voir qui d’autre a des modèles similaires à lui. Elle recommande alors à John à la fois des vidéos similaires à ce qu’il a regardé et celles similaires à ce que d’autres personnes comme lui ont regardé.
Qu’est-ce qu’un modèle ?
Les modèles peuvent être utilisés pour imiter n’importe quoi, des utilisateurs aux vidéos jusqu’aux cours qu’un enfant doit apprendre. Un modèle est une représentation simplifiée du monde afin qu’une machine puisse prétendre le comprendre :
Comment Youtube vous apprend
Tous les problèmes de recommandation impliquent une question de substitution : “Que recommander” ; est un peu trop général et vague pour un algorithme.Netflix a demandé aux développeurs quelle serait la note qu’un utilisateur A donnerait à la vidéo B, compte tenu de ses notes pour d’autres vidéos. Youtube demande quelle serait la durée de lecture d’un utilisateur donné dans un contexte particulier. Le choix de ce qu’il faut demander – de ce qu’il faut prédire, a un impact important sur la recommandation affichée3. L’idée étant qu’une prédiction correcte conduira à une bonne recommandation. La prédiction elle-même est basée sur d’autres utilisateurs ayant un historique de goûts similaires4. C’est-à-dire des utilisateurs dont les modèles sont similaires.
Modèles d’utilisateur
Youtube divise la tâche de recommandation en deux parties et utilise des modèles différents pour chacune d’elles3. Nous nous en tiendrons toutefois ici à une explication plus simple.
Pour créer un modèle utilisateur, ses développeurs doivent se demander quelles données sont pertinentes pour la recommandation de vidéos. Qu’en est-il de ce que l’utilisateur a regardé auparavant ? Quelles ont été leurs critiques, leurs évaluations et leurs préférences explicites jusqu’à présent ? Qu’ont-ils recherché ? Et plus que ces signaux explicites, Youtube utilise surtout des signaux implicites, car ils sont plus aisément disponibles3 – Un utilisateur a-t-il simplement cliqué sur une vidéo ou l’a-t-il vraiment regardée ? Si oui, pendant combien de temps ? Comment l’utilisateur a-t-il réagi aux recommandations précédentes 1 ? Quelles sont celles qu’il a ignorées ? Outre les réponses à ces questions, les informations démographiques telles que le sexe, la langue, la région et l’appareil sont d’une grande valeur lorsque l’utilisateur est nouveau ou n’est pas connecté3.
Une fois qu’un modèle est disponible pour chaque utilisateur, nous pourrions voir quels utilisateurs sont similaires les uns aux autres et utiliser cette information pour la recommandation.
Modèles de vidéo
Similaire aux utilisateurs, nous pourrions également utiliser les vidéos qui sont similaires (ou différentes) les unes des autres. Étant donné une vidéo, Youtube examine son contenu, son titre et sa description, la qualité de la vidéo, le nombre de personnes qui l’ont regardée (nombre de vues), l’ont aimée, l’ont favorisée, l’ont commentée ou partagée, le temps écoulé depuis son téléchargement et le nombre d’utilisateurs abonnés à la chaîne mère1.
Ce qu’un utilisateur regarde ensuite dépendra également du fait qu’une vidéo fasse partie d’un épisode d’une série ou d’un élément d’une liste de lecture. Si un utilisateur découvre un artiste, il pourrait passer des chansons les plus populaires à des niches plus fines. De même, un utilisateur ne cliquera pas sur une vidéo dont l’image de la vignette n’est pas bonne1,3. Toutes ces informations entrent également dans le modèle.
L’un des éléments constitutifs du système de recommandation est de passer d’une vidéo à une liste de vidéos liées. Dans ce contexte, nous définissons ; les vidéos liées sont celles qu’un utilisateur est susceptible de regarder ensuite3. L’objectif est d’extraire le maximum de valeur des données pour faire de meilleures recommandations4.
1 Davidson, J., Liebald, B., Liu, J., Nandy, P., Vleet, T., The Youtube Video Recommendation System, Proceedings of the 4th ACM Conference on Recommender Systems, Barcelona, 2010.
2 Spinelli, L., and Crovella, M., How YouTube Leads Privacy-Seeking Users Away from Reliable Information, In Adjunct Publication of the 28th ACM Conference on User Modeling, Adaptation and Personalization (UMAP ’20 Adjunct), Association for Computing Machinery, New York, 244–251, 2020.
3 Covington, P., Adams, J., Sargin, E., Deep neural networks for Youtube Recommendations, Proceedings of the 10th ACM Conference on Recommender Systems, ACM, New York, 2016.
4 Konstan, J., Terveen, L., Human-centered recommender systems: Origins, advances, challenges, and opportunities, AI Magazine, 42(3), 31-42, 2021.