23 Habla de IA: cómo Youtube te conoce -Parte 2

El proceso

En Google, las redes neuronales profundas ahora se utilizan para el aprendizaje automático2. Basado en el modelo de video, la red neuronal de Youtube toma videos similares a los que el usuario ya ha visto. Luego intenta predecir el tiempo de visualización de cada nuevo video para un modelo de usuario dado, y los clasifica basándose en la predicción. La idea es entonces mostrar los diez a veinte videos (dependiendo del dispositivo) con las mejores clasificaciones.

El proceso es similar al modelo de aprendizaje automático que estudiamos anteriormente. Primero, la máquina toma características de los modelos de usuario y video proporcionados por el programador. Aprende de los datos de entrenamiento, qué peso dar a cada característica para predecir correctamente el tiempo de visualización. Y luego, una vez probado y encontrado que funciona, puede comenzar a predecir y recomendar.

Imagen Una máquina aprende, adaptada de AI Open Text Lab (2022). Traducción Rodriguez Enríquez del texto incluido en la imagen. Fuente: AI Open Text Lab. Licencia: CC BY‑SA 4.0. https://creativecommons.org/licenses/by-sa/4.0/

Entrenamiento

Durante el entrenamiento, se dan millones de ejemplos tanto positivos como negativos al sistema. Un ejemplo positivo es cuando un usuario hizo clic en un video y lo vio durante cierto tiempo. Un ejemplo negativo es cuando el usuario no hizo clic en el video o no lo vio durante mucho tiempo2.

La red toma las características de usuario y video discutidas en la sección de modelos de Cómo Youtube te Conoce Parte 1. Ajusta la importancia dada a cada característica de entrada comprobando si predijo correctamente el tiempo de visualización para un video y usuario dados.

Hay aproximadamente mil millones de parámetros (peso de cada característica) que se deben aprender en cientos de miles de millones de ejemplos2. La red también puede aprender a ignorar ciertas características y les dará cero importancia. Así, la incrustación, o el modelo que crea el algoritmo, puede ser muy diferente de lo que los desarrolladores imaginaron.

Pruebas

Imagen entre, prueba y usa, adaptada de AI Open Text Lab (2022). Traducción Rodriguez Enríquez del texto incluido en la imagen. Fuente: AI Open Text Lab. Licencia: CC BY‑SA 4.0. https://creativecommons.org/licenses/by-sa/4.0/

Una vez que la red ha sido entrenada, se prueba con datos ya disponibles y se ajusta. Aparte de la precisión de la predicción, el resultado del sistema debe ser ajustado por el programador, basado en varios juicios de valor. Mostrar videos que son demasiado similares a los videos ya vistos no será muy atractivo. ¿Qué significa realmente que una recomendación sea buena? ¿Cuántos videos similares mostrar y cuánta diversidad introducir – tanto con respecto a los otros videos como con respecto al historial del usuario? ¿Cuántos de los intereses del usuario cubrir? ¿Qué tipo de recomendaciones conducen a la satisfacción inmediata y cuáles conducen al uso a largo plazo1,3? Estas son todas preguntas importantes a considerar.

Después de esta prueba, se realiza una evaluación en tiempo real de las recomendaciones. Se mide el tiempo total de visualización por conjunto de videos predichos2. Cuanto más tiempo pasa un usuario viendo el conjunto recomendado de videos, más exitoso se considera el modelo. Note que solo mirar cuántos videos fueron cliqueados no es suficiente para la evaluación. Youtube evalúa sus recomendadores basándose en cuántos videos recomendados fueron vistos por una porción sustancial del video, la longitud de la sesión, el tiempo hasta la primera visualización larga y la fracción de usuarios registrados con recomendaciones1.

La interfaz

Ahora exploraremos cómo se presentan las recomendaciones al espectador. ¿Cuántos videos se deben mostrar? ¿Deberían presentarse las mejores recomendaciones todas de una vez, o algunas deberían guardarse para más tarde3? ¿Cómo se deben mostrar las miniaturas y los títulos de los videos? ¿Qué otra información se debe mostrar? ¿Qué configuraciones puede controlar el usuario1? Las respuestas a estas preguntas determinan cómo Youtube logra mantener enganchados a dos mil millones de usuarios.


1 Davidson, J., Liebald, B., Liu, J., Nandy, P., & Van Vleet, T. (2010). The YouTube video recommendation system. Proceedings of the 4th ACM Conference on Recommender Systems (pp. 293–296). Association for Computing Machinery. https://doi.org/10.1145/1864708.1864770

2 Covington, P., Adams, J., & Sargin, E. (2016). Deep neural networks for YouTube recommendations. Proceedings of the 10th ACM Conference on Recommender Systems (pp. 191–198). Association for Computing Machinery. https://doi.org/10.1145/2959100.2959190

3 Konstan, J. A., & Terveen, L. G. (2021). Human-centered recommender systems: Origins, advances, challenges, and opportunities. AI Magazine, 42(3), 31–42. https://doi.org/10.1609/aimag.v42i3.18142

4 Spinelli, L., & Crovella, M. (2020). How YouTube leads privacy-seeking users away from reliable information. Adjunct Publication of the 28th ACM Conference on User Modeling, Adaptation and Personalization (UMAP ’20 Adjunct) (pp. 244–251). Association for Computing Machinery. https://doi.org/10.1145/3386392.3399566

Licencia

Icono de Licencia Creative Commons Atribución 4.0 Internacional

IA para Profesores: un libro de texto abierto Copyright © 2025 por Colin de la Higuera y Jotsna Iyer se distribuye bajo una Licencia Creative Commons Atribución 4.0 Internacional, excepto cuando se especifiquen otros términos.

Comparte este libro

IA para Profesores: un libro de texto abierto
Resumen de privacidad

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.