методика оценки качества рекомендательных интернет

МЕТОД СКОЛЬЗЯЩЕГО КОНТРОЛЯ ДЛЯ ОЦЕНКИ КАЧЕСТВА РЕКОМЕНДАТЕЛЬНЫХ ИНТЕРНЕТСЕРВИСОВ А.Ю. Каминская, Р.А. Магизов Научный руководитель – Д.И. Игнатов Государственный университет – Высшая школа экономики, Москва, Россия 2010 Содержание • Постановка задачи • Мотивация • Примеры моделей рекомендательных систем – User-based RS – Item-based RS • • • • • Выбор меры (метрики) сходства Методика сравнения Данные MovieLens и Yahoo Результаты Выводы и дальнейшая работа Постановка задачи • Зная предпочтения конкретного пользователя и остальных, выдать ему релевантную рекомендацию • Оценка (проверка) качества рекомендаций Мотивация • Существует огромное количество РС • Требуются эффективные алгоритмы – Время выполнения – Качество рекомендаций • Количество ошибок и полнота рекомендаций User-based RS • целевой пользователь u0 I • u0 - предметы, которые он оценивал • sim u 0 , u  - сходство с пользователем u • - top-n ближайших к N  u0   u | sim  u0 , u     нему соседей, n определяет  • N u0 | i   u | i  u I & u  N u0  - пользователи из N u0  , которые оценили предмет i • rui - оценка предмета i пользователем u • предсказанная системой оценка для целевого пользователя: rˆu0i  u , u  r  sim  uN u0 |i 0 ui u , u   sim  uN u0 |i 0 Item-based RS • • • • целевой пользователь u0 I u0 - предметы, которые он оценивал simi, j  - сходство товара i с товаром j N i    j | simi, j     - top-n ближайших к нему товаров, top-n определяет  • N i | u0    j | j  u0I & i  u0I & j  N i  - для u0 • rui - оценка предмета i пользователем u • предсказанная системой оценка для целевого пользователя: rˆu0i  i, j  r  sim  jN i|u0 u0 j i, j   sim  jN i|u0 Пример V.M. 4.0 3.0 0.0 4.0 SKY 0.5 4.0 4.0 3.5 3.5×0.5=1.75 4.5 OLA 0.5 4.5 4.0 3.0 3.0×0.5=1.5 4.0 GRY 0.94 4.0 2.5 1.0 1.0×0.94=0.94 3.5 IDI 0.87 2.0 2.5 3.0 3.0×0.87=2.6 1.5 1.75  1.5  2.6  0.94  0.5  0.5  0.87  0.94 6.79  2 .4  2 .5 2.81 ВО «Планета» «Планета» Е. Гришковец. Рассказы. ВО Рей Бредбери. Рассказы. Рей Бредбери. и наказание» ВО Преступление наказание» «Преступление и Маргарита» ВО «Мастер и Маргарита» «Мастер и Сходство Пользователь User-based RS Выбор меры (метрики) сходства • Сходство, основанное на расстоянии: – Евклида – Хемминга d ( x, y)   x  y  i 2 i i d ( x, y )  1 s 1 1 d xi  y i • Корреляция как сходство: – коэффициент Пирсона • Косинусная мера cos( x, y)  • Коэффициент Жаккара  x, y  xy J ( X ,Y )  X Y X Y Корреляция Пирсона  x  x  y  y  • pearson   x  x     y  y  i i i 2 2 i i i i • Недостатки – не определена на векторах с постоянными значениями: (4,4,4,...,4) – теряются рекомендации a=(0,5,5,4) b=(0,4,5,0) Методика сравнения • Метрики качества: точность и полнота рекомендаций • Скользящий контроль (кросс-валидация) Точность и полнота • Полнота – число релевантных рекомендаций к числу всех выбранных пользователем товаров recall  | rn (u )  u I | uI • Точность – число релевантных к числу всех рекомендаций I | rn (u )  u | precision  rn (u ) Скользящий контроль • Разбиение на тестовую и обучающую выборки: U  Utraining Utest , где Utraining Utest   • Сокрытие признаков для тестирования рекомендаций: I hidden  I • Вычисление точности и полноты для u  U test на признаках i  I hidden : recall  | rn (u )  u I  I hidden | u I  I hidden 80% | rn (u )  u I  I hidden | precision  rn (u )  I hidden 20% Точность и полнота: раскрытие неопределенностей recall  | rn (u )  u I  I hidden | u I  I hidden  0  recall  1 u I  I hidden | rn (u )  u I  I hidden | precision  rn (u )  I hidden rn (u)  I hidden  0 : u I  0  precision  1 else precision  0 Алгоритм • Параметры: – test% - размер тестового множества – hidden% - размер скрытого множества признаков – p – число повторений разбиения на тестовое и обучающее множество – q – число повторений разбиения на оцененное и неоцененное множества признаков • Выход: средние значения точности и полноты по множеству Utest и Ihidden Данные MovieLens и Yahoo • MovieLens 100K dataset: – 943 пользователя – 1,682 фильма – Каждый оценил как минимум 20 фильмов, всего 100,000 оценок • Yahoo binary dataset: – 2,000 фирм – 3,000 рекламных словосочетаний – 92,345 ненулевых ячеек Результаты Зависимость точности от количества скрытых признаков 0.6 0.5 Точность 0.4 0.3 User-based Item-based 0.2 0.1 0 0 2 4 6 8 10 12 Количество скрытых признаков,% 14 16 18 20 Результаты Зависимость полноты от количества скрытых признаков 0.7 0.6 Полнота 0.5 0.4 User-based 0.3 Item-based 0.2 0.1 0 0 2 4 6 8 10 12 14 Количество скрытых признаков,% 16 18 20 Результаты Зависимость точности и полноты от числа соседей 0.7 0.6 0.5 0.4 Точность 0.3 Полнота 0.2 0.1 0 0 10 20 30 40 число соседей 50 60 70 80 Результаты Зависимость точности и полноты от размера тестового множества для метода user-based 0.7 0.6 Меры качества 0.5 0.4 Precision 0.3 Recall 0.2 0.1 0 0 10 20 30 40 50 60 Размер тестового множества, % 70 80 90 Результаты Зависимость точности и полноты от количества скрытых признаков для метода user-based 0.6 0.5 Меры качества 0.4 0.3 Precision Recall 0.2 0.1 0 0 10 20 30 40 Количество скрытых признаков, % 50 60 Результаты Зависимость точности и полноты от размера тестового множества для метода item-based 0.7 0.6 Мера качества 0.5 0.4 Precision 0.3 Recall 0.2 0.1 0 0 10 20 30 40 50 60 Размер тестового множества, % 70 80 90 Результаты Зависимость точности и полноты от количества скрытых признаков для метода Item based 0.6 Меры качества 0.5 0.4 0.3 Precision Recall 0.2 0.1 0 0 10 20 30 40 Количество скрытых признаков, % 50 60 Выводы и дальнейшая работа • Предложенная методика позволяет оценить качество работы рекомендательной системы вне зависимости от выбора метода • По-видимому, впервые в экспериментах исследуется точность и полнота в зависимости от количества скрытых признаков • Для сравнения методов необходимо проведение аналогичных экспериментов для более совершенных моделей РС, например, основанных на бикластеризации Спасибо за внимание!

методика оценки качества рекомендательных интернет

Related documents

Products

Support

методика оценки качества рекомендательных интернет

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib