Техническое задание на разработку поисковой системы сайта

advertisement
Техническое задание
на разработку поисковой системы сайта
1. Имя сайта (название домена).
www.all-autoworld.ru Далее - сайт.
2. Название сайта.
Сайт фирмы "Ваш автомир". Далее по тексту - фирма.
3. Назначение поисковой системы (цель создания поисковой системы).
I.
Просмотр и анализ контента сайта.
II.
Упорядоченная выдача результатов на запросы по поиску информации на сайте.
4. Язык сайта.
Русский.
5. 5. Объём и состав контента сайта, подлежащий индексации:
I.
Объем сайта не более __ Мб.
II.
Объем текста сайта не более __ Мб.
III.
Общее количество страниц сайта - не более __.
IV.
Общее количество слов на сайте - не более __.
V.
Общее количество индексируемых слов на одной странице сайта - не более __.
VI.
Общее количество слов на странице - не более __.
VII.
Число внутренних гиперссылок сайта - не более __.
VIII.
Общее число картинок (рисунков) на сайте - не более __.
IX.
Общее количество мультимедийных файлов - не более __.
6. Программное обеспечение сервера, в составе которого должен работать поисковый
движок:
Согласно Приложению 1.
7. Проиндексированные файлы
Проиндексированная информация хранится в базе данных в __ файлах на сервере.
8. Доступ к базе данных
I.
Доступ к базе данных осуществляется по паролю.
II.
Должно быть предусмотрено разграничение прав доступа к базе данных.
9. Резервная копия базы данных
I.
Должна быть предусмотрена резервная и архивная копии базы данных.
II.
Подключение резервной или архивной копии базы данных осуществляется вручную.
III.
Удаление резервных и архивных копий сайта осуществляется вручную.
10.Учет гиперссылок.
Учитываются только внутренние гиперссылки, ведущие к файлам согласно Приложению 2.
11.Алгоритм поисковой системы.
I.
Наполнение базы данных
a.
b.
c.
d.
e.
II.
Индексация
a.
b.
c.
d.
e.
f.
III.
Индексация - принудительная.
Индексация осуществляется в ручном режиме по команде оператора.
Фреймы не поддерживаются.
Файл robots.txt учитывается.
Анализируемые мета-тэги: description и keywords.
Полнотекстовая
Шумовые слова учитываются согласно Приложению 3
Текст в атрибуте alt рисунков учитывается согласно Приложению 4.
Текст в комментариях не учитывается.
Слова, написанная в разрядку не учитываются.
Слова, написанный заглавными буквами учитываются.
Ранжирование (упорядочение результатов) учитывает:
a. Количество слов запроса в тексте страниц сайта и конкретной страницы.
b. Плотность ключевых слов.
c.
d.
e.
f.
g.
h.
i.
j.
k.
l.
m.
n.
IV.
Частоту ключевых слов.
Название веб-страницы.
Мета-тэги страницы.
Наличие замещающих надписей на рисунках (картинках).
Длину (в количестве символов) замещающих надписей рисунков.
Размер шрифта, которым оформлены ключевые слова.
Жирность шрифта ключевых слов.
Написаны в разрядку или нет ключевые слова.
Написаны или нет заглавными буквами ключевые слова.
Как далеко от начала страницы располагаются ключевые слова.
Стиль заголовков и наименований ключевых слов.
К какому типу страниц относится каждая страница сайта: html или asp.
Алгоритм ранжирования
a. Алгоритм ранжирования основывается на расчете результирующего веса
(суммарного балла) каждого слова и фразы по бальной методике согласно
Приложению 5.
12.Кнопки управления (навигация сайта).
Индексируются только текстовые гиперссылки и гиперссылки в рисунках.
13.Анализ названия страниц сайта (title).
Названия страниц учитываются. Максимальная длина __ символов, включая пробел.
14.Пропускная способность линии связи.
Скорости подключения к Интернет посетителей сайта не выше 28.8 Кбит/сек.
15.Глубина сайта.
Поисковая система должна индексировать файлы не более 7 уровней вложения.
16.Минимальное разрешение монитора, на котором будет просматриваться сайт.
600 х 800 пикселей (15" ЭЛТ).
При указанном разрешении должна быть обеспечена возможность просмотра результатов,
выдаваемых поисковой системой, без горизонтальной прокрутки браузера.
17.Основной браузер, которым будет просматриваться сайт, и его минимальная
версия.
IE 5.5 и выше.
18.Вывод результатов.
I.
Выдаются все результаты по 10 на страницу.
II.
В случае отсутствия найденных результатов выводится предложение расширить или
изменить поиск.
III.
Смежные ссылки или похожие ссылки не выдаются.
IV.
Выдаются ссылки на страницы в порядке убывания совпадения.
V.
Совпадения выделяются.
VI.
Выводится дата последнего обновления страницы.
VII.
Выводится размер и тип файла.
19.Фон страницы выдаваемых результатов.
Фон страниц выдаваемых результатов - белый.
20.Размер и вид шрифта сайта.
I.
Размер шрифта сайта должен быть в пределах 10-12 для оформления текста.
II.
Шрифт должен быть масштабируемым.
III.
Вид (название) шрифта не оговаривается.
21.Срок разработки поисковой системы.
Сто календарных дней со дня зачисления __% предоплаты на расчётный счёт веб-студии.
22.Порядок сдачи-приемки поисковой системы.
I.
Веб-дизайнер сдает поисковую систему на CD диске.
II.
В случае обнаружения смысловых, орфографических и грамматических ошибок вебдизайнер обязан устранить выявленные ошибки в течение пяти рабочих дней.
23.Сопровождение поисковой системы.
I.
Сопровождение поисковой системы определяется отдельным ТЗ.
II.
В настоящем ТЗ сопровождение поисковой системы не оговаривается и не входит в
состав выполняемых работ.
24.Дополнительные условия.
I.
Поисковая система разрабатывается после создания сайта, отладки сайта и
наполнения сайта контентом.
II.
В поисковой системе должна быть предусмотрена ручная настройка выдачи
результатов.
III.
Подсказка о возможной ошибке запроса в написании слов не предусмотрена.
IV.
Все, что не оговорено в техническом задании на разработку поисковой системы,
определяется веб-дизайнером самостоятельно.
Приложения:
1. Программное обеспечение сервера.
2. Формат индексируемых файлов.
3. Список шумовых слов.
4. Учет замещающего текста в рисунках.
5. Алгоритм ранжирования ключевых слов и ключевых фраз.
Для создания полноценного, эффективно работающего поискового движка, обеспечивающего
высокую релевантность выдаваемых результатов, необходима его ручная настройка.
Ручная настройка поискового движка возможна после того, как подобран весь контент сайта.
Внесение изменений в текстовый контент сайта требует внесения изменений в настройку
поискового движка.
В техническое задание на разработку поисковой системы сайта следует включать только те
требования, которые могут быть проверены по определённым критериям. Требования и
характеристики, которые носят субъективный характер, и не могут быть вследствие этого
проверены, бессмысленны с практической и ошибочны с юридической точек зрения.
Резюме
 Каждая поисковая система уникальна. Алгоритм работы поисковой системы зависит от задач конкретного
бизнеса, контента и идеологии сайта.

Создание полноценного поискового движка сайта по сложности, стоимости и срокам превосходит создание
большого Интернет-портала.

Многочисленные предложения о разработке поисковой системы сайта за несколько сот
долларов рассчитаны на несведущих заказчиков. Принятие подобных предложений
приводит к убыткам.

Существуют простые, дешёвые, эффективные и хорошо зарекомендовавшие себя
альтернативные технические решения системам поиска по сайту, не требующие
вмешательства человека и не предъявляющие жестких требований по программноаппаратной совместимости с сервером.

Использование простых схемотехнических решений позволяет посетителю быстро найти
нужную ему информацию и, как следствие, увеличить прибыль владельцу сайта.
Download