Uploaded by besus

1 лаб

advertisement
Лабораторная работа №1. Технология PageRank
Цель работы: получить базовые навыки работы с технологией PageRank
путем решения задач с матрицами методом Гаусса и степенных
преобразований
Задачи:
 Сгенерировать случайную матрицу из нулей и единиц размером 10x10
 Вычислить PageRank всех страниц в соответствии с полученной матрицей
используя метод Гаусса, в предположении, что: телепортации нет,
телепортация с β = 0,8
 Вычислить PageRank всех страниц в соответствии с полученной матрицей,
используя метод степенных итераций (3 шага), в предположении, что:
телепортации нет, телепортация с β = 0,8
 Построить ориентированный граф
PageRank страницы — это алгоритм ссылочного ранжирования, именно
он показывает ее значимость, в частности, для поисковиков. Важность
определяется цифрой от 0 до 10. При этом если между 0 и 1 отличие
небольшое, то между 8 и 9 оно будет огромным, потому как баллы
рассчитываются по логарифмической шкале. Зависит значимость страницы и
рассматриваемый показатель от числа и качества ссылок, ведущих на нее. Чем
чаще ссылаются на конкретный источник ресурсы, тем более авторитетным он
считается. Соответственно, PageRank будет выше.
Общие сведения
Алгоритм применяется к коллекции документов, связанных
гиперссылками. Каждому из документов он назначает определенное
численное значение. Это значение определяет «важность» или
«авторитетность» такого документа в числе остальных. Причем алгоритм
может применяться как к веб-страницам, так и к любому комплекту объектов,
которые связываются между собой ссылками.
Рис. 1. Схема принципа работы PageRank
Чем больше ссылок на страницу, тем она «важнее». При этом вес
страницы «A» зависит от веса ссылки, которая передается страницей «B». Это
объясняется тем, что Google интерпретирует ссылку со страницы «A» на
страницу «B» как своеобразный «голос» «A» в пользу «B». Учитывается не
только количество «голосов», но и качество страниц, участвующих в таком
голосовании.
Значение PR в продвижении
Основная идея PR – определять авторитетность сайта и
характеризировать его качество. Продвижение сайта должно проводиться с
учетом того, что ресурсы-доноры с более высоким PageRank ранжируются
выше в поисковом индексе Google. Собственно, это позволяет увеличить
количество аудитории, потенциальных клиентов и т.д.
Чтобы получить хороший показатель PageRank, необходимо создавать
качественные, актуальные веб-страницы, на которые люди сами захотят
ссылаться на других ресурсах, и уделять пристальное внимание к требованиям
поисковой системы Google. Или же подбирать рекламные площадки с
хорошими показателями для продвижения на них своих товаров и услуг.
Более подробно о PageRank можно узнать, обратившись к файлу лекции
1 в ЭОС.
Download