22 Habla de IA: cómo Youtube te conoce -Parte 1
Modelos y recomendaciones
ACTIVIDAD

Estas son las transacciones con tarjeta de crédito de John Doe y Tom Harry, dos hombres que viven en Nantes, Francia. Están buscando cosas que hacer este fin de semana. ¿Qué les recomendarías?
Lista para elegir:
- La nueva sucursal de Burger King
- Un evento de degustación de aceite de oliva
- Una tienda de equipaje en línea
- Un concierto junto al río
- Clase de natación para bebés
Los sistemas de recomendación han existido al menos tanto tiempo como las guías turísticas y las listas de los diez mejores. Mientras que Los Mejores Libros del 2022 según The Guardian recomienda la misma lista a todos, probablemente la adaptarías al elegir para ti mismo, seleccionando algunos y cambiando el orden de lectura basado en tus preferencias personales.
¿Cómo recomendar opciones para desconocidos? En la actividad anterior, probablemente intentaste imaginar sus personalidades basándote en la información dada: hiciste juicios y aplicaste estereotipos. Luego, una vez que tenías una idea de su tipo, elegiste de la lista cosas que podrían (o no) ser relevantes para ellos. Recomendadores como Amazon, Netflix y Youtube siguen un proceso similar.
Hoy en día, cuando alguien está buscando información o buscando descubrir contenido en línea, utilizan algún tipo de sistema de recomendación personalizado1,2. La función principal de Youtube es sugerir a sus usuarios qué ver entre todos los videos disponibles en la plataforma. Para usuarios registrados, utiliza su actividad pasada para crear un modelo, o un tipo de personalidad. Una vez que tiene un modelo para John, puede ver quién más tiene modelos similares al suyo. Luego recomienda a John videos similares a los que ha visto y aquellos similares a los que otros como él han visto.
¿Qué es un modelo?
Los modelos pueden usarse para imitar cualquier cosa, desde usuarios hasta videos inclusive lecciones que un niño tiene que aprender. Un modelo es una representación simplificada del mundo, para que una máquina pueda pretender entenderlo:
Cómo Youtube aprende quién eres
Todos los problemas de recomendación implican hacer una pregunta sustituta: «Qué recomendar» es demasiado general y vago para un algoritmo. Netflix preguntó a los desarrolladores qué calificación daría el usuario A al video B, considerando sus calificaciones para otros videos. Youtube pregunta cuál sería el tiempo de visualización para un usuario dado en un contexto particular. La elección de qué preguntar –y predecir– tiene un gran impacto en qué recomendación se muestra3. La idea es que la predicción correcta llevará a una buena recomendación. La predicción misma se basa en otros usuarios con un historial de gustos similares4. Es decir, usuarios cuyos modelos son similares.
Modelos de usuario
Youtube divide la tarea de recomendación en dos partes y utiliza diferentes modelos para cada una3. Sin embargo, nos atendremos a una explicación más simple aquí.
Para crear un modelo de usuario, sus desarrolladores tienen que preguntar, qué datos son relevantes para la recomendación de videos. ¿Qué pasa con lo que el usuario ha visto antes? ¿Qué pasa con sus reseñas, calificaciones y preferencias explícitas hasta ahora? ¿Qué buscaron? Youtube utiliza señales que son más implícitas que explícitas, ya que las últimas están más disponibles3. ¿Un usuario solo hizo clic en un video o lo vio? Si es así, ¿por cuánto tiempo? ¿Cómo reaccionó el usuario a recomendaciones anteriores1? ¿Cuáles fueron ignoradas? Aparte de respuestas directas a estas preguntas, la información demográfica como género, idioma, región y tipo de dispositivo son de gran valor cuando el usuario es nuevo o no está registrado3.
Una vez que está disponible un modelo para cada usuario, podemos comparar usuarios y usar esa información para recomendaciones.
Modelos de video
También podríamos usar videos que son tanto similares como diferentes entre sí. Youtube observa la información que tiene sobre un video particular: su título y descripción; calidad del video; cuántas personas lo han visto (cantidad de vistas); les ha gustado; lo han marcado como favorito; comentado o compartido; el tiempo desde que se subió y el número de usuarios suscritos al canal padre1.
Lo que un usuario vea a continuación también dependerá de si un video es un episodio dentro de una serie o un elemento en una lista de reproducción. Si un usuario está descubriendo a un nuevo artista, él o ella podría pasar de las canciones más populares a nichos más pequeños. Además, un usuario podría no hacer clic en un video cuya imagen en miniatura es de mala calidad1,3. Toda esta información también entra en el modelo.
Uno de los pilares del sistema de recomendación es pasar de un video a una lista de videos relacionados. En este contexto, definimos videos relacionados como aquellos que un usuario probablemente verá a continuación3. El objetivo es aprovechar al máximo los datos para hacer mejores recomendaciones4.
1 Davidson, J., Liebald, B., Liu, J., Nandy, P., & Van Vleet, T. (2010). The YouTube video recommendation system. En Proceedings of the 4th ACM Conference on Recommender Systems (pp. 293–296). Association for Computing Machinery. https://doi.org/10.1145/1864708.1864770
2 Spinelli, L., & Crovella, M. (2020). How YouTube leads privacy‑seeking users away from reliable information. En Adjunct Publication of the 28th ACM Conference on User Modeling, Adaptation and Personalization (UMAP ’20 Adjunct) (pp. 244–251). Association for Computing Machinery. https://doi.org/10.1145/3386392.3399566
3 Covington, P., Adams, J., & Sargin, E. (2016). Deep neural networks for YouTube recommendations. En Proceedings of the 10th ACM Conference on Recommender Systems (pp. 191–198). Association for Computing Machinery. https://doi.org/10.1145/2959100.2959190
4 Konstan, J. A., & Terveen, L. G. (2021). Human‑centered recommender systems: Origins, advances, challenges, and opportunities. AI Magazine, 42(3), 31–42. https://doi.org/10.1609/aimag.v42i3.18142