23 AIとは:YouTubeはあなたのことをいかにして学ぶか(2)
プロセス
Googleのいたるところで、現在、ディープニューラルネットワークが現在、機械学習に使用されています2。YouTubeのニューラルネットワークは、動画モデルに基づいて、ユーザーがすでに視聴したものと類似した動画を取得します。つぎに、特定のユーザーモデルごとに取得した動画のそれぞれの視聴時間を予測し、その予測値に基づいてランク付けします。こうした仕組みで、上位10〜20本(デバイスによって異なります)の動画が表示されます。
このプロセスは、前述の機械学習モデルと似ています。まず、機械はプログラマーから与えられたユーザーと動画モデルから特徴を抽出します。訓練データから、各特徴にどのような重みを与えれば視聴時間を正しく予測できるかを学びます。そして、検証して機能していることが判明したら、予測と推奨を開始できるのです。

訓練
訓練のあいだ、何百万もの肯定例および否定例の双方がシステムに与えられます。肯定例とは、ユーザーが動画をクリックし、一定時間視聴した場合です。否定例は、ユーザーが動画をクリックしなかったり、長時間視聴しなかったりした場合です2。
このネットワークは、How Youtube Learns You Part 1のモデルのところで議論されているユーザーの特徴と動画の特徴を取り込みます。特定の動画とユーザーに対する視聴時間の予測が正しかったかどうかを確認することで、各特徴に与えられた重みづけを調整します。
数千億の事例に基づいて学習されるパラメータ(各特徴の重み)は約10億個にのぼります2。ネットワークはまた、特定の特徴を無視することを学び、その重みをゼロにするかもしれません。したがって、アルゴリズムが作成する埋め込み、ないしモデルは、開発者が想定したものとは大きく異なる場合があります。
テスト
ネットワークが訓練を終えると、すでに利用可能なデータで検証され、調整されます。予測の精度とは別に、システムの出力は、いくつかの価値判断に基づいて、プログラマーによって調整されなければなりません。すでに視聴した動画に似すぎた動画を提示しても、ユーザーの関心を惹くことはできないからです。優れた推奨とは具体的にどのようなものか。類似した動画をどのくらい表示させ、異なったものをどのくらい取り入れるか(動画間についても、ユーザー履歴との類似・相違についても当てはまります)。ユーザーの興味関心をどこまでカバーするか。どういった推奨が即時の満足につながり、どういった推奨が長期的な使用につながるのか1,3。これらはすべて考慮検討すべき重要な事項です。
ユーザーが推奨された動画セットを視聴する時間が長ければ長いほど、モデルはより成功しているとみなされます。クリックされた動画の数だけでは、評価の十分な根拠とならないことに注意してください。YouTubeは、推奨された動画のかなりの部分まで視聴された回数、セッションの長さ、最初の長時間視聴までの時間、推奨1されてログインしたユーザー比率に基づいて、推奨システムを評価しています1。
インターフェース
これから、視聴者に推薦がどのように提示されるかを探ります。いくつの動画を表示すべきか?最良の推薦を一度にすべて提示すべきか、それともいくつかを後で保存すべきか3?サムネイルと動画タイトルはどのように表示すべきか?どのようなその他の情報を表示すべきか?ユーザーが制御できる設定は何か1?これらの質問への答えが、YouTubeが20億のユーザーを引きつけ続ける方法を決定します。
1 Davidson, J., Liebald, B., Liu, J., Nandy, P., Vleet, T., The Youtube Video Recommendation System, Proceedings of the 4th ACM Conference on Recommender Systems, Barcelona, 2010.
2 Covington, P., Adams, J., Sargin, E., Deep neural networks for Youtube Recommendations, Proceedings of the 10th ACM Conference on Recommender Systems, ACM, New York, 2016.
3 Konstan, J., Terveen, L., Human-centered recommender systems: Origins, advances, challenges, and opportunities, AI Magazine, 42(3), 31-42, 2021.
4 Spinelli, L., and Crovella, M., How YouTube Leads Privacy-Seeking Users Away from Reliable Information, In Adjunct Publication of the 28th ACM Conference on User Modeling, Adaptation and Personalization (UMAP ’20 Adjunct), Association for Computing Machinery, New York, 244–251, 2020.