23
Il processo
In Google, le reti neurali profonde vengono ora utilizzate per l’apprendimento automatico2. In base al modello di video, la rete neurale di Youtube prende i video simili a quelli già visti dall’utente. Poi cerca di prevedere il tempo di visione di ogni nuovo video per un determinato modello di utente e li classifica in base alla previsione. L’idea è quella di mostrare i 10-20 video (a seconda del dispositivo) con la migliore posizione in classifica.
Il processo è simile a quello del Machine Learning model che abbiamo studiato in precedenza. In primo luogo, la macchina prende le caratteristiche dai modelli di utenti e video forniti dal programmatore. Impara dai dati di addestramento quale peso dare a ciascuna caratteristica per prevedere correttamente il tempo di visione. Poi, una volta testata e trovata corretta, può iniziare a prevedere e consigliare.
Training
Durante l’addestramento, il sistema riceve milioni di esempi positivi e negativi. Un esempio positivo si ha quando un utente clicca su un video e lo guarda per un certo tempo. Un esempio negativo è quando l’utente non clicca sul video o non lo guarda a lungo2.
La rete prende in considerazione le caratteristiche dell’utente e le caratteristiche del video discusse nella sezione modelli di Come Youtube vi studia Parte 1. Regola l’importanza data a ciascuna caratteristica di input verificando se ha previsto correttamente il tempo di visione per un determinato video e utente.
Ci sono circa un miliardo di parametri (peso di ogni caratteristica) da apprendere su centinaia di miliardi di esempi2. La rete potrebbe anche imparare a non tenere conto di alcune caratteristiche, attribuendo loro un’importanza pari a zero. Pertanto, l’incorporazione o il modello creato dall’algoritmo può essere molto diverso da quello previsto dagli sviluppatori.
Testing
Una volta addestrata, la rete viene testata su dati già disponibili e regolata. Oltre all’accuratezza della previsione, l’output del sistema deve essere regolato dal programmatore in base a diversi giudizi di valore. Mostrare video troppo simili a quelli già visti non sarà molto coinvolgente. Cosa significa veramente che una raccomandazione è buona? Quanti video simili mostrare e quanta diversità introdurre, sia rispetto agli altri video sia rispetto alla storia dell’utente. Quanti interessi dell’utente coprire? Quali tipi di raccomandazioni portano a una soddisfazione immediata e quali a un utilizzo a lungo termine?1,3 Sono tutte domande importanti da considerare.
Dopo questo test, si procede alla valutazione in tempo reale delle raccomandazioni. Viene misurato il tempo totale di visione per ogni serie di video predetti2. Se un utente guarda più a lungo l’insieme di video raccomandati, il modello è considerato di maggior successo. Si noti che la semplice osservazione del numero di video cliccati non è un buon metodo di valutazione. Youtube valuta i suoi raccomandatori in base a quanti video raccomandati sono stati guardati per una frazione sostanziale del video, alla durata della sessione, al tempo trascorso fino alla prima visione prolungata e alla frazione di utenti connessi con raccomandazioni1.
Interfaccia
Infine, il modo in cui le raccomandazioni vengono presentate allo spettatore: quanti video mostrare? Le raccomandazioni migliori devono essere presentate tutte insieme o alcune devono essere conservate per un secondo momento?3 Come visualizzare le miniature e i titoli dei video? Quali altre informazioni mostrare? Quali impostazioni può controllare l’utente?1 Le risposte a queste domande determinano il modo in cui Youtube tiene agganciati due miliardi di utenti 24 ore al giorno.
1 Davidson, J., Liebald, B., Liu, J., Nandy, P., Vleet, T., The Youtube Video Recommendation System, Proceedings of the 4th ACM Conference on Recommender Systems, Barcelona, 2010.
2 Covington, P., Adams, J., Sargin, E., Deep neural networks for Youtube Recommendations, Proceedings of the 10th ACM Conference on Recommender Systems, ACM, New York, 2016.
3 Konstan, J., Terveen, L., Human-centered recommender systems: Origins, advances, challenges, and opportunities, AI Magazine, 42(3), 31-42, 2021.
4 Spinelli, L., and Crovella, M., How YouTube Leads Privacy-Seeking Users Away from Reliable Information, In Adjunct Publication of the 28th ACM Conference on User Modeling, Adaptation and Personalization (UMAP ’20 Adjunct), Association for Computing Machinery, New York, 244–251, 2020.