Секреты локального поиска

advertisement
Секреты локального поиска
21.02.2005 / Программы / Наталья Сергеева
Иногда найти что-то на собственном диске - все равно что найти иголку в небезызвестном стоге сена. Особенно
это относится к текстам - днем с огнем не найти какой-то нужный документ, и все это при полной уверенности в
его существовании. Утонул документ в огромной куче себе подобных! Перерыть эту кучу вручную - задача для
терпеливых пользователей, имеющих вагон свободного времени. Тем же, кто это время ценит, лучше
воспользоваться программными средствами для локального поиска. О разновидностях этих средств и, главное, их эффективности
как раз и пойдет речь в данной статье.
Поисковые инструменты присутствуют в любой операционной системе, во многих приложениях и файловых менеджерах. Ими мы и
пользуемся чуть ли не каждый день: стандартным "Помощником по поиску" Windows, встроенным поиском в Total Commander или
Far, функцией поиска по архивам WinRAR и другими. Эти средства всегда под рукой, и это главное их достоинство, если не
единственное. А вот недостатков гораздо больше, и среди основных - не всегда находится то, что нужно, и слишком долго ищется. К
этому можно добавить ограниченный перечень форматов и кодировок файлов, по которым возможен поиск, неудобство
представления результатов, невозможность сохранения поисковых запросов и так далее, но это уже мелочи.
Избавиться практически от всех таких досадных мелочей может помочь программа, аналогичная бесплатной AVSearch Анатолия
Вознюка. Программа ищет файлы по фрагментам текста в любой русской кодировке и, главное, находит их в любых местах: в
архивах (около 20 форматов), в кешах браузеров, на сетевых дисках, в "Корзине" и так далее. Работать с программой легко и
приятно. Среди ее достоинств: просмотр найденных документов в текстовом виде с помощью встроенных средств, автоматическое
выделение (подсветка) искомых слов и навигация между ними, сохранение списка файлов для дальнейшей обработки, доступность
всех файловых операций (удаление, переименование, копирование), выбор для поиска различных папок (в том числе находящихся
на разных дисках), "фильтрация" файлов (по размеру, типу, дате изменения). Однако ищет AVSearch так же медленно, как и
перечисленные выше средства. А все потому, что программа перебирает (просматривает по очереди) каждый файл из зоны поиска.
Поиск с индексацией
Вдоволь наискавшись по дискам подручными средствами и не получив или не дождавшись результата, мы "лезем" в Интернет и
обращаемся к услугам поисковых машин - Google, "Яндекс", AltaVista. Пара минут - и по нашему запросу выводится список ссылок
на веб-страницы, содержащие искомые слова. Список обычно отсортирован по релевантности (соответствию запросу), содержит
фрагменты текстов с подсвеченными словами запроса, а на случай недоступности каких-то ссылок иногда предлагаются
кешированные версии найденных текстов. Можно только удивляться такой оперативности сетевых поисковых сервисов - вот бы их
заставить работать на локальных дисках!
Секрет успеха прост - поисковые машины не "бегают" по миллионам интернет-адресов, дабы доставить информацию по вашему
запросу. Если бы это было так, то результата поиска никто и никогда бы не дождался. Поиск ведется по собственной базе машины,
содержащей информацию заранее опрошенных страниц - индексы. Значит, для быстрого поиска по собственным дискам необходимо
использовать программу, которая умеет создавать аналогичные локальные индексы.
Служба индексации Microsoft
Самое простое решение поставленной задачи достигается включением службы индексирования того самого "Помощника по поиску".
Служба ведет индексирование определенных документов на компьютере, когда компьютер простаивает, и в результате процесс
поиска по этим документам значительно ускоряется. Служба работает непрерывно и почти не нуждается в обслуживании. После ее
настройки все операции, включая создание и обновление индекса, аварийное восстановление в случае сбоя питания, выполняются
автоматически. После завершения индексации отбор нужных документов по запросу к службе индексации выполняется за доли
секунды.
С первого взгляда задача может показаться полностью решенной. Однако при внимательном рассмотрении работы поисковой
службы Microsoft и, главное, результатов этой работы можно отметить ряд недостатков и неудобств. И можно было бы смириться с
ними, если бы служба Microsoft находила все документы по запросу к ней. К сожалению, находится далеко не все, и причиной тому
является изначальная "заточенность" службы на поиск англоязычных документов. При работе службы в русскоязычной среде с ее
довольно развитым словоизменением теряются все производные слов, входящих в запрос.
Пятерка известнейших локальных поисковиков
Перечисленные выше причины заставляют отказаться от использования встроенной в Windows поисковой системы в пользу
программ от других разработчиков, свободных от указанных недостатков. Перечисленные ниже программы объединяют следующие
преимущества: быстрый полнотекстовый поиск информации на английском и русском языке (иногда с учетом морфологии языка),
привычный и удобный интерфейс в стиле поисковых интернет-систем и относительно небольшой объем индекса. Представленные
версии программ обеспечивают примерно одинаковый уровень сервиса.

Google Desktop Search (GDS) - разработка компании Google. Интегрирована в упомянутую поисковую систему Google,
распространяется бесплатно и позволяет осуществлять полнотекстовый поиск информации как в Интернете, так и на жестких
дисках компьютера.

"Следопыт 3.0 Профессиональный" - персональная система интеллектуального поиска от компании "МедиаЛингва".
Предназначена для быстрого поиска документов на персональном компьютере, съемных носителях, а также в локальной сети
по их содержанию и атрибутам. Цена - 1200 рублей.

"Ищейка Проф Deluxe 4.5" - полноценная поисковая система для быстрого поиска документов и файлов на жестких дисках от
iSleuthHound Technologies. Данная версия программы представляет собой полный пакет, лишенный каких бы то ни было
ограничений и включающий все доступные на сегодня дополнительные модули, разработанные компанией. Цена пакета - 29
долларов. Имеется бесплатный вариант, ограниченный по количеству индексируемых файлов (до 500) и поддерживаемым
форматам (.doc, .html, .txt).

"Архивариус 3000 (2.91)" - персональная поисковая система компании Wizetech Software для быстрого поиска документов и
почтовых сообщений на компьютере, в локальной сети и съемных дисках. Демоверсия ограничена 10 000 файлов в области
поиска. Цена для частных лиц - 300 рублей.

Cros - система компании "Кронос-Информ", предназначенная для накопления и обработки текстовых документов различных
форматов и быстрого поиска по накопленному массиву данных. Цена - 4248 рублей. Демонстрационная версия системы Cros
имеет ряд ограничений, одним из которых является число обрабатываемых документов - до 5000.
Запросы программ
Прежде всего для работы всех программ требуется наличие свободного места на жестком диске для хранения индексов - как
минимум 30% от общего объема файлов, которые подлежат индексации. На 100 тысяч индексируемых документов небольшого
размера (до 100 Кб) необходимо выделить примерно 500 Мб. На хранение индекса библиотеки, содержащей увесистые электронные
книги (300-2000 Кб), потребуется значительно больше дискового пространства - например, тех же 500 Мб хватит только на 1000
файлов.
Для комфортной работы с программами компьютер должен иметь более 128 Мб оперативной памяти и процессор с тактовой частотой
выше 400 МГц. На более слабых машинах существенно замедляется процесс создания и обновления индекса и поисковые запросы
выполняются программами далеко не мгновенно. Особенно это заметно при значительном количестве индексируемых документов более 100 тысяч. Исключение составляет программа Cros, которая оптимизирована для обработки больших объемов информации.
Вот почему скорость индексации и поиска Cros практически не зависит от размера оперативной памяти - при наличии 64 Мб система
работает так же быстро, как и на 128 Мб.
Все программы (кроме GDS) работают на всех популярных версиях операционной системы Microsoft: Windows
98/Me/NT4/2000/XP/2003. GDS работает только под Windows XP/2000, причем для последней требуется установленный SP3 (пакет
обновлений Microsoft Service Pack 3). Cros для этой же ОС требует установки SP2, а для Windows NT - SP6. "Ищейка" для каждого
пользователя предоставляет возможность иметь свой собственный набор зон поиска и персональные настройки программы (для
Windows NT4/2000/XP). Для установки программы требуются права администратора, а работать с ней может любой пользователь,
имеющий собственную лицензию на использование программы.
Для индексации, поиска и отображения определенных типов документов некоторые программы требуют наличия установленных
"родных" приложений для различных типов файлов. Например, "Следопыт" для работы с PDF и RTF нуждается в установке Acrobat
Reader и MS Office.
Кому что выбрать
Какой бы из перечисленных программ для локального поиска вы ни воспользовались, результат будет гораздо полнее того, что
выдают подручные "медленные" средства. При выборе подходящей программы ориентироваться стоит в основном на цену - по
Сеньке и шапка. Анализ всех упомянутых нами программ с выдачей рекомендаций занял бы не одну страницу текста. Но если
коротко, то подытожить можно так:




"домашним" пользователям, для которых содержимое жесткого диска такие же потемки, как и Интернет, за глаза достаточно
возможностей GDS, а иногда и бесплатной "Ищейки";
пользователям же, желающим получить более удобное и функциональное средство (поиск в архивах, в сообщениях
нестандартных почтовиков типа The Bat!, интернет-пейджеров типа Miranda и так далее), стоит обратить свой взор на
"Архивариуса";
для профессионалов подойдут "Следопыт" и "Ищейка", умеющие работать со стандартным набором типов документов и
предоставляющие для этого удобные инструменты;
Cros "заточен" на работу с огромными массивами документов (миллионами файлов!) - оптимально использовать эту программу
в такой же огромной компании.
Программы в каталоге Softkey.ru:


Ищейка Проф Deluxe / Автор: iSleuthHound Technologies
Следопыт 3.0 Профессиональный / Автор: МедиаЛингва
Ссылки по теме:

Сайт программы "Следопыт 3.0 Профессиональный"










Сайт программы "Ищейка Проф Deluxe 4.5"
Сайт программы "Архивариус 3000 (2.91)"
Сайт программы Cros
Сайт программы Google Desktop Search
Сайт программы AVSearch
Поисковая система Google
Поисковая система "Яндекс"
Поисковая система AltaVista
"Ищем все" - статья
"Найди себя" - статья
Автор статьи: Наталья Сергеева
Download