Эффективный поиск в Интернет

advertisement
Эффективный поиск в Интернет
План занятия.
1. Что такое Интернет:
- история (ARPAnet, NSFnet);
- структура (interconnected networks, локальные и глобальные сети, опорные сети);
- технологии (пакетная коммутация, протокол TCP/IP, понятие IP-адреса, DNS, URL);
- сервисы Интернет (электронная почта, WWW - язык HTML, FTP, TelNET, UseNET,
списки рассылки)
2. "В Интернет есть все!" = "В Интернет нет ничего!" (особенности WWW)
- равноправность всех узлов;
- отсутствие контроля (цензуры);
- неструктурированность и децентрализованность сетевых ресурсов;
- "invisible (deep) Web"
3. Так что же там есть?
- Научные ресурсы
- Образовательные ресурсы
- РАЗВЛЕКАТЕЛЬНЫЕ РЕСУРСЫ
- Порталы
- Тематические сайты
- Сайты организаций
- САЙТЫ типа "Я И МОЯ СОБАКА"
4. Попробуем поискать, используя:
- cерфинг;
- поисковые системы (Alta Vista, HotBot, Google, Яndex, Aport, Rambler);
- каталоги ресурсов (Yahoo!, Mail.Ru, Улитка, IванSусанин)
5. Советы по поиску.
- использование ключевых слов;
- применение логических операторов;
- расширенный поиск;
- поиск в найденном.
5. Что такое Интернет?
●
История.
В 1957 году СССР был запущен первый спутник, и Америка восприняла это как вызов. В ответ было создано
Агентство по Новейшим Исследованиям (ARPA) при Министерстве Обороны США, первым проектом которого
стал американский спутник. Агентство собрало лучшие умы страны. С начала 60-х годов основной областью
исследований ARPA стало военное использование компьютерных технологий.
В то время еще не существовало персональных компьютеров. Крупные университеты могли себе позволить 1-2
больших компьютера. Компьютерное время было драгоценным ресурсом. На него заранее записывались. Люди
работали ночами, чтобы ни минуты этого времени не пропало даром. Наконец появилась идея соединить между
собой компьютеры разных университетов, чтобы сделать возможным удаленное использование любого свободного
в данный момент компьютера. Этот проект получил название ARPANET. К концу 1969 года были соединены
компьютеры четырех университетов, и появилась первая компьютерная сеть.
Многомиллионное финансирование на ARPANET было получено в 1966 году без особых бюрократических
проволочек. Ставка делалась на университетских исследователей и академическую традицию свободного обмена
информацией. Не требовалось сохранения ни военной, ни коммерческой тайны. Кстати, это продолжалось недолго
- с начала 70-х годов от ARPA начинают все более настойчиво требовать прямой военной отдачи, и к названию
Агентства добавляется многозначительное D (DARPA, Defense - Оборонное).
В 1972 году, когда ARPANET уже соединял 23 компьютера, была написана первая программа для обмена
электронной почтой по сети. Очень скоро обнаружилось, что сеть в основном используется не по назначению - для
вычислений на удаленном компьютере, - а как раз для обмена сообщениями, вплоть до сплетен и анекдотов. К
счастью, с этим не стали бороться административными методами. Напротив, электронную почту оценили по
достоинству, что побудило целый ряд государственных организаций и корпораций к созданию собственных
компьютерных сетей. Эти сети обладали тем же недостатком, что и ARPANET, они могли соединять только
ограниченное число однотипных компьютеров. Кроме того, они были не совместимы друг с другом.
В середине 70-х годов для ARPANET были разработаны новые стандарты передачи данных, которые позволяли
объединять между собой сети произвольной архитектуры, тогда же было придумано слово "Интернет". Именно эти
стандарты, впоследствии получившие название протокола TCP/IP, заложили основу для роста глобальной
компьютерной сети путем объединения уже существующих сетей. Их важным достоинством было то, что сеть
считалась в принципе не стопроцентно надежной, и предусматривались средства борьбы с ошибками при передаче
данных. В 1983 году сеть ARPANET перешла на новый протокол и разделилась на две независимые сети - военную
и образовательную. К этому времени сеть объединяла более тысячи компьютеров, в том числе в Европе и на
Гавайских островах. Последние использовали спутниковые каналы связи.
С этого момента военное ведомство уже не играло большой роли в развитии Интернета, хотя некоторое время еще
продолжало финансировать образовательную часть ARPANET. Надо отдать должное чиновникам Пентагона - они
не поддались соблазну засекретить разработанную технологию.
Развитие Интернета получило новый импульс благодаря инициативе Национального научного фонда США (NSF)
по созданию глобальной сетевой инфраструктуры для системы высшего образования (1985-88). NSF создал сеть
скоростных магистральных каналов связи и выделял средства на подключение к ней американских университетов,
при условии, что университет обеспечивал доступ к сети для всех подготовленных пользователей. Интернет
оставался преимущественно университетской сетью до начала 90-х годов, однако NSF сразу взял курс на то, чтобы
сделать его в дальнейшем независимым от государственного финансирования. В частности, NSF поощрял
университеты к поиску коммерческих клиентов. К 1988 году Интернет уже насчитывал 56 тысяч соединенных
компьютеров.
Настоящий расцвет Интернета начался в 1992 году, когда была изобретена новая служба, получившая странное
название "Всемирная паутина" (World Wide Web, или WWW, или просто веб). WWW позволял любому
пользователю Интернета публиковать свои текстовые и графические материалы в привлекательной форме,
связывая их с публикациями других авторов и предоставляя удобную систему навигации. Постепенно Интернет
начал выходить за рамки академических институтов и стал превращаться из средства переписки и обмена файлами
в гигантское хранилище информации. К 1992 году Интернет насчитывал более миллиона соединенных
компьютеров.
В настоящее время Интернет продолжает расти с прежней головокружительной скоростью. Трафик в Интернете,
то есть количество передаваемой информации, увеличивается каждый месяц на 30%. В 1999 году Интернет
объединял около 60 миллионов компьютеров и более 275 миллионов пользователей, и каждый день в нем
появлялось полтора миллиона новых вебовских документов. Эти оценки довольно приблизительны, потому что в
Интернете нет центрального административного органа, который регистрировал бы новых пользователей и новые
компьютеры.
●
Технологии
Интернет обладает некоторыми чертами почты, некоторыми чертами телеграфа и некоторыми чертами телефона.
Так же как в телеграфе, в Интернете используется цифровая передача информации. Как в телефонной сети
каждому телефону присваивается телефонный номер, так каждому компьютеру в Интернете присваивается свой
номер, который называется IP-адресом. Только в Интернете, в отличие от телефона, нет путаницы с локальными
номерами и междугородними кодами: каждый IP-адрес имеет ровно 32 бита и записывается обычно как четыре
десятичных числа, например, 192.168.22.11. Это глобальная нумерация - каждый компьютер, подключенный к
Интернету, имеет уникальный IP-адрес.
Наиболее глубокая аналогия существует между Интернетом и обычной почтой. В данном случае речь идет не том,
что в Интернете существует электронная почта, а о том, что информация по Интернету передается в виде
отдельных пакетов. Если нужно передать длинное сообщение, оно разбивается на нужное число кусочков, и
каждый из них снабжается адресом отправителя, адресом получателя и некоторой служебной информацией.
Каждый пакет передается по Интернету независимо от всех остальных и в принципе они могут следовать разными
маршрутами. По прибытии пакетов на место из них собирается исходное сообщение. Это называется
коммутацией пакетов. Напротив, в телефонной сети используется коммутация каналов. Это значит, что сначала
вы дозваниваетесь, причем можете и не дозвониться, если противоположный конец занят или один из
промежуточных коммутаторов перегружен. Когда вы дозвонились, то между вами и вашим абонентом
устанавливается постоянный канал связи. Если вы молчите в трубку, этот канал все равно больше никем не
используется. В Интернете, как и в обычной почте, нет понятия "занято" - каждый компьютер может одновременно
принимать пакеты от большого количества других компьютеров. Если на почте сортировочный пункт перегружен
работой в канун праздника, ваше письмо с небольшой задержкой все равно дойдет до адресата. Точно так же в
Интернете перегрузка сказывается в виде роста времени отклика и поровну ложится на всех пользователей. И если
в данный момент вы ничего не посылаете, то вы не потребляете никаких ресурсов сети. Эффективное
использование общих ресурсов - это главное преимущество коммутации пакетов.
Набор формальных правил о том, как следует передавать данные по сети, называется протоколом. Интернет
использует протокол TCP/IP (вначале это разрабатывалось как один протокол, а сейчас это на самом деле два
тесно связанных протокола). Этот протокол регламентирует, как следует разбивать длинное сообщение на пакеты,
как должны быть устроены пакеты, как контролировать прибытие пакетов к месту назначения, что делать в случае
ошибок и другие детали. Собственно, Интернет - это и есть TCP/IP. Интернет представляет собой объединение
десятков тысяч отдельных сетей, которые используют протокол TCP/IP и единое пространство IP-адресов. В
остальном эти сети административно и финансово независимы. Поэтому на часто задаваемый вопрос о том,
находится ли центр управления Интернетом в подвале Белого Дома, следует ответить отрицательно.
Второе важное достоинство коммутации пакетов - это легкость объединения в единую сеть разных по скорости
каналов связи. В связи с этим качество вашего подключения к Интернету может варьироваться в очень широких
пределах. Ваши ощущения от Интернета будут заметно различаться в зависимости от того, на какой скорости вы
работаете. Телефонная сеть в этом отношении более однородна - вы или подключены, или нет, и качество связи из
дома и из офиса, в общем, различается мало.
У большинства компьютеров в Интернете есть собственное имя, а не только IP-адрес. Хотя люди уже привыкли
пользоваться цифровыми номерами, звоня по телефону, все-таки имена, которые можно произнести, легче
запоминаются. Служба, которая обеспечивает перевод имен компьютеров в их IP-адреса, называется Доменной
Службой Имен(DNS). Это что-то вроде гигантского, распределенного по многим компьютерам телефонного
справочника, с IP-адресами вместо телефонов.
Имя компьютера записывается как несколько слов, разделенных точками, например fadr.msu.ru. Это отражает
иерархическую, или доменную, структуру службы DNS. В нашем примере fadr - это имя компьютера в домене
(второго уровня) msu.ru, который принадлежит домену (первого уровня) ru. Администратор, который отвечает за
домен первого уровня ru (Россия), зарегистрировал домен второго уровня msu.ru (Московский Университет) и
передал туда все полномочия на регистрацию новых имен в пределах этого домена. В свою очередь администратор
домена msu.ru зарегистрировал имя fadr.msu.ru за определенным IP-адресом. Такая структура службы DNS
обеспечивает, с одной стороны, уникальность имен компьютеров в пределах всего Интернета, а с другой стороны,
четкое разделение административной ответственности. Большие и маленькие буквы в именах компьютеров не
различаются, fadr.msu.ru - это то же самое, что FADR.MSU.RU.
DNS - это особая служба Интернета, потому что она используется всеми остальными службами, от telnet до www.
Перевод имен DNS в IP-адреса происходит автоматически. Для этого надо только указать вашему компьютеру IPадрес сервера DNS - того компьютера, которому будут направляться соответствующие запросы.
Хотя не существует особых правил, как следует называть домены, в применении к доменам первого, самого
верхнего уровня сложилась определенная практика. Международные организации и США используют домены
первого уровня com - для коммерческих, org и net - для некоммерческих организаций. В большинстве стран
существует один домен первого уровня для страны: ru - для России, de - для Германии, uk - для Великобритании.
Так же как каждый компьютер имеет свое уникальное имя, уникальное имя имеет и каждый документ в Интернете
(точнее, говоря архивным языком, каждая единица хранения, - это может быть и компьютерная программа, и
компьютерная запись песни - звуковой файл, и все, что угодно). Это уникальное имя называется URL Универсальный Указатель Ресурса (Universal Resource Locator). URL имеет следующую форму:
служба://имя компьютера/директория/поддиректория/.../имя файла
например, http://fadr.msu.ru/ecocoop/index.html. Служба обозначается соответствующим протоколом, чаще всего вы
встретите http:// для веб-страниц и ftp:// для файловых архивов. Обратите внимание, что используется "прямая"
косая черта, "/", а не "обратная", "\". В названиях директорий, поддиректорий и файлов большие и малые буквы
имеют разное значение.
●
Сервисы Интернет
Наиболее широко используются следующие службы Интернета:
 telnet - позволяет вам соединиться с удаленным компьютером и работать с ним так, как будто вы сидите
перед ним, в текстовом режиме. Это то, для чего предназначался Интернет в момент его зарождения.
Теперь эта служба используется прежде всего теми, кто следит за бесперебойной работой сети, системными администраторами. Однако сейчас чаще используют для этих целей другую службу, которая
шифрует передаваемую информацию, - ssh. Вы вряд ли будете пользоваться telnet или ssh, если сети - не
ваша прямая специальность.
 ftp - также одна из старейших служб, используется для копирования файлов с компьютера на компьютер.
В ftp-архивах Интернета можно найти много полезных программ.
 e-mail (электронная почта) - в соответствии с названием, почта, только электронная. Выполняет те же
функции, что и обычная почта, только быстрее, надежнее и дешевле. Это самая главная служба в
Интернете на протяжении 80-х годов, и она ничуть не потеряла своего значения сейчас. Вы можете не
пользоваться никакими другими службами Интернета, но этой пользуются все.
 news (новости) - это тематические тусовки, или газеты, где каждый подписчик одновременно может быть
автором. Эта служба, так же как и веб-форумы или списки рассылки (похожие по функциям, но
отличающиеся техническими деталями), предназначена для обмена сообщениями в пределах группы
людей, связанных общими интересами.
 WWW (веб) - служба, которая совмещает в Интернете функции электронного издательства и библиотеки.
Особенность публикаций в Интернете - это широкое использование ссылок и отсутствие разницы для
читателя между ссылками внутри документа и ссылками на другие документы, где бы они ни хранились. С
точки зрения читателя все публикации в Интернете представляют собой один постоянно дописываемый
многими авторами гигантский документ, связанный паутиной перекрестных ссылок, что и дало название
этой службе (Всемирная Паутина). Эта служба появилась в начале 90-х годов и стала невероятно
популярной.
6. Особенности Web
Развитие Всемирной Паутины послужило началом продолжающегося до сих пор бума Интернета. Однако причина
молниеносного распространения Сети и ее бурного роста состоит не столько в том, что ее службы предлагают
удобные средства для обмена информацией и доступа к ней, сколько в том, что в Сети есть та информация,
которую нужно получить. Кроме того, часто оказывается, что эту информацию нельзя получить ни в каком другом
месте. Между тем, информационные ресурсы, те десятки миллионов документов, которым Всемирная Паутина
обязана своей привлекательностью для пользователей, создаются самими пользователями. Чем больше
пользователей - тем больше информации, и наоборот: со скоростью горной лавины цивилизация переходит в
новую информационную эру. А все дело в том, что для создания публикации во Всемирной Паутине пользователю
нужен только компьютер, подключенный к Интернету, и минимум навыков работы с ним.
Несколько минут работы - и сообщение или документ становится доступным всем пользователям Сети. помимо
собственно информационной нагрузки, Всемирная Паутина и Интернет несут важную социальную функцию. Здесь
встречаются друг с другом люди из самых разных уголков планеты, и формируется новая культурная общность, не
связанная государственными границами и национальной принадлежностью. Уникальная общедоступность
информации и средств ее распространения, характерные для Интернета и Всемирной Паутины, создают
своеобразную электронную демократию. Отдельное правительство, организация или человек не может полностью
контролировать техническую инфраструктуру, все приложения или все информационное наполнение Сети.
Русский термин "Всемирная Паутина" - дословный перевод английского названия World Wide Web. В
русском языке, в том числе и в тексте этой книги, гораздо чаще, чем словосочетание "Всемирная Паутина",
употребляются английские сокращения от World Wide Web - просто Web или WWW.
С технической точки зрения, World Wide Web состоит из множества серверов Интернета, предоставляющих
пользователям Сети доступ к специально составленным, так называемым гипертекстовым, документам.
Гипертекст отличается от обычного текста тем, что он может включать в себя так называемые гипертекстовые
ссылки (гиперссылки), соединяющие контекст, в котором они находятся, с другим контекстом в рамках того же или
другого текста. О наложенных на организованную линейно (слева направо) структуру текста гипертекстовых
ссылках часто говорят, что они вносят в текст третье измерение.
Разновидность гипертекста, используемого на WWW, дает создателю документов дополнительную свободу за счет
возможности включать в текст документа иллюстрации, аудио- и видеоинформацию, а также ссылки на любые
ресурсы Интернета, находящиеся на произвольном сервере Сети (это делается с помощью общего формата
представления адресов ресурсов. Название "Всемирная Паутина" очень метко передает образ переплетающихся
связей, складывающихся в причудливую структуру, которая охватывают множество серверов по всему земному
шару. Из-за возможности включать в документы мультимедийную информацию, т.е. звук, изображение и видео,
для обозначения сетевых гипертекстов применяют также термин "гипермедиа". При этом следует сказать, что звук
и видео в Интернете - в общем, редкость.
При подготовке гипертекстовых документов для WWW текст специальным образом размечается с помощью языка
разметки HTML (HyperText Markup Language, что в переводе и означает "язык разметки гипертекстов").
Как и большинство других служб Интернета, Всемирная Паутина работает в рамках модели клиент-сервер. В
качестве сервера, как правило, выступает постоянно подключенный к Сети компьютер, на котором работает
специальная программа. Именно эту программу чаще всего и называют веб-сервером. Клиент - любой компьютер,
работающий в режиме постоянного или сеансного подключения к Интернету, на котором запущена программа
просмотра WWW - браузер или броузер (англ. browser, от глагола to browse - листать, пролистывать). Браузер
обрабатывает HTML-разметку и отображает гипертекст на экране. Обмен информацией между веб-сервером и
браузером осуществляется с использованием протокола HTTP. О работе во Всемирной Паутине говорят как о
навигации, или веб-серфинге.
Протокол HTTP для передачи гипертекста в Сети был предложен швейцарским физиком Тимом Бернерсом-Ли
(Tim Berners-Lee) в 1989 году. В 1992 году была предложена для всеобщего пользования первая программабраузер. Но настоящая популярность пришла к WWW только после того, как в сентябре 1993 года был выпущен
браузер Mosaic, эффективно использовавший преимущества графического пользовательского интерфейса. Браузер
Mosaic был разработан в США, в Университете Штата Иллинойс; его успех был в значительной степени
обусловлен тем, что в нем впервые была реализована навигация с помощью мыши, и предложено расширение
языка разметки HTML, позволяющее вставлять в гипертекст изображения.
В апреле 1994 года один из разработчиков Мозаики Марк Андрессен (Marc Andreessen) основал корпорацию
Netscape Communications, а в декабре 1994 года увидела свет первая версия браузера Netscape Navigator,
завоевавшего огромную популярность.
В 1996 году у Netscape Navigator появился серьезный конкурент, Internet Explorer, браузер корпорации Microsoft,
также основанный на браузере Mosaic. Протокол HTTP, язык разметки гипертекстов HTML, браузеры и вебсерверы беспрестанно совершенствуются, открывая перед своими пользователями все новые и новые
возможности. Текущая версия браузеров: Netscape Navigator - 4.72, Microsoft Internet Explorer - 5.01; протокола
передачи гипертекстов HTTP - 1.1, языка разметки гипертекстов HTML - 4.01. Совсем недавно HTML был
расширен стандартом XHTML версии 1.0. Более чем вероятно, что на момент, когда вы читаете эту книгу, эти
цифры уже устарели: это происходит очень часто, но совсем не обязательно многое меняет, особенно для
пользователей.
Сегодня, спустя десять лет после изобретения протокола HTTP, легшего в основу Всемирной Паутины, браузер
представляет собой сложнейшее программное обеспечение, сочетающее в себе легкость в использовании и
богатство возможностей. Следует заметить, что конкурирующие между собой Netscape Navigator и Internet Explorer
во многом схожи; мало отличаются от них и другие современные браузеры. Можно говорить о том, что еще при
разработке Mosaic сформировался стандартный интерфейс программы для просмотра Web.
3. Так что же там есть?
По направленности
●
Научные ресурсы
●
Образовательные ресурсы
●
Ресурсы для бизнеса
●
Ресурсы для всех
По принадлежности
●
Национальные порталы
●
Сайты организаций
●
Я и моя собака
4.
Объем информации Интернет переживает стремительный рост: по оценкам экспертов, количество Webстраниц увеличилось от нескольких десятков тысяч в 1996 г. до нескольких сотен тысяч к концу 1998 г. В этих
условиях ни одно отдельно взятое средство поиска информации не сможет охватить всех ресурсов Сети. Поэтому
для эффективного решения задачи поиска пользователю необходимо свободно ориентироваться в сложном и
многообразном мире поисковых инструментов. Правильный выбор средства поиска информации в каждом
конкретном случае является существенным, если не определяющим, фактором успешного выполнения задачи.
Попробуем поискать, используя:
●
серфинг
Непосредственный поиск с использованием гипертекстовых ссылок
Поскольку все сайты в пространстве WWW фактически оказываются связанными между собой, поиск информации
может быть произведен путем последовательного просмотра связанных страниц с помощью броузера.
Хотя этот полностью ручной метод поиска выглядит полным анахронизмом в Сети, содержащей более 60 млн
узлов, "ручной" просмотр Web-страниц часто оказывается единственно возможным на заключительных этапах
информационного поиска, когда механическое "копание" уступает место более глубокому анализу. Использование
каталогов, классифицированных и тематических списков и всевозможных небольших справочников также
относится к этому виду поиска.
●
поисковые машины
Сегодня этот метод является одним из основных и фактически единственным при проведении предварительного
поиска. Результатом последнего может являться список ресурсов Cети, подлежащих детальному рассмотрению.
Как правило, применение поисковых машин основано на использовании ключевых слов, которые передаются
поисковым серверам в качестве аргументов поиска: что искать. Если делать все правильно, то формирование
списка ключевых слов требует предварительной работы по составлению тезауруса. Часть машины, называемая
«пауком» (или «спайдером»), постоянно путешествует по узлам сети, собирая и обновляя информацию, кодирует
ее (индексация) и записывает в специализированную базу данных. При поступлении от пользователя запроса в
виде набора ключевых слов машина исследует свою базу данных и выдает список документов, содержащих
ключевые слова, как правило, ранжированный в зависимости от частоты вхождения ключевых слов и других
характеристик. К достоинствам применения поисковых машин можно отнести огромный объем информации,
исследуемой ими, и ее периодическую актуализацию. Однако, при этом не учитываются документы, не
содержащие ключевых слов, а, с другой стороны, в списке содержится много шумовой, не относящейся к делу
информации, отсеивание которой занимает немалое время.
●
каталоги
Каталоги представляют собой систематизированные группы адресов, объединенные, как правило, по тематике. К
удобству их применения можно отнести то, что, если пользователю известна тема искомого документа, он будет
исследовать соответствующую ветвь каталога, не отвлекаясь на посторонние, не относящиеся к делу документы.
Однако, объем каталога ограничен физическими возможностями редакторской группы и ее субъективностью в
выборе материала. В них отсутствует информация на узкие, специальные темы, да и саму тематику искомого
документа не всегда можно сформулировать в пределах классификации каталога.
5. Советы по поиску
●
ключевые слова
Яndex позволяет использовать в качестве запроса строку до 250 символов. Для введения простого запроса нужно
набрать в строке запроса ключевые слова, разделенные пробелом. Простой запрос подразумевает, что слова
связаны логическим оператором ИЛИ, т. е. машина ищет документы, в которых упоминается хотя бы одно из этих
слов, и на выходе их ранжирует по количеству найденных слов, их весу, частотным характеристикам, близости в
тексте и другим параметрам. Учитывается морфология всех терминов простого запроса.
●
логические операторы
В строгом варианте запроса используются операторы, логические выражения, специальные функции.
Оператор ИЛИ в строгом запросе обозначается запятой.
Оператор И (&) означает, что текст должен содержать все термины или логические выражения, соединенные
данным оператором. В языке запросов Яndex один значок оператора означает его действие в пределах абзаца, а два
подряд - в пределах всего текста.
Оператор НЕ. В языке Яndex этот оператор обозначается "~", и так же его одинарное использование означает
исключение следующего за ним термина в пределах абзаца, а двойное - в пределах всего текста.
●
Поиск в найденном
Позволяет осуществить поиск по документам, найденным по предыдущему запросу. Для этого в конце запроса
нужно поставить "$$" или просто сделать отметку в окошке "поиск в найденном", расположенном на странице
запроса. Эта функция очень удобна для последовательного сужения поиска.
●
Расширенный поиск
Настраивайте заданные по умолчанию параметры простого запроса для выполнения точного поиска, если
поисковая система обеспечивает такую возможность. Если машина таких функций не предлагает, кликните
мышью на кнопке сложного поиска и добавьте адрес соответствующей страницы к числу своих ссылок на самые
необходимые сайты. Это обеспечит вам переход сразу к развитому специализированному поиску.
И напоследок:
Не забывайте о команде Find броузера
Если ваш броузер имеет в меню Файл, Правка или Вид команду Find (Найти), используйте ее для обнаружения
трудноуловимых ключевых слов страницы. Чтобы отыскать слово, которое вам нужно, воспользуйтесь
комбинацией клавиш CTRL+F в вашем броузере и введите искомое ключевое слово.
Сохраняйте копии важных документов
Активно используйте команды контекстного меню Сохранить объект как… и Сохранить рисунок как… и
команду меню Файл – Сохранить как… для создания копий необходимой вам информации из сети Интернет на
локальном ресурсе вашего ПК. Этим вы решите некоторые проблемы:
1) изменчивости и недолговечности WWW (когда со своих адресов со временем исчезают страницы и целые
сайты),
2) концентрации внимания исключительно на целях определенного этапа поиска (например отбор адресов или
предварительный просмотр найденной информации),
3) экономии времени on-line подключения и перевод изучения отобранных материалов в режим off-line.
Фиксируйте результаты ссылками и закладками
1. Сохраняйте ссылки на важные и часто посещаемые страницы, используя команду Добавить в "Избранное".
Используйте подобные механизмы для регистрации предварительных результатов поиска в процессе беглого
отбора с целью дальнейшего подробного изучения.
2. Поддерживайте свою персональную коллекцию ссылок в рабочем состоянии: актуализируйте и
систематизируйте ее, удаляйте устаревшие и ненужные.
Используйте комбинированный поиск фраз
Фразы позволяют выполнять поиск слова с учетом контекста. Обычно машина ищет точное совпадение с
текстовой строкой, заключенной в кавычки. Скомбинировав несколько фраз искомого документа с помощью
оператора языка запроса AND, вы существенно увеличите точность запроса.
Применяйте редкие слова
Если вы хотите найти документ по одному или нескольким словам, выберите наиболее необычные. Тем самым вы
избежите напрасной траты времени на перебор бесполезных для вас сайтов.
Не употребляйте очень распространенных терминов
Слова типа компьютер, провайдер, Web и Windows приводят к высокой выборке нерелевантных узлов, то есть к
большому количеству шумовой информации. Некоторыми машинами поиска подобные термины вообще не
учитываются (так называемые стоп-слова).
Избегайте игнорируемых ключевых слов
Игнорируемыми (стоп-словами) называют слова, которые разработчики механизмов поиска автоматически
исключают из запроса. Так, если вы попробуете в запросе AltaVista указать компьютер, то получите в ответ
Документы, удовлетворяющие данному запросу, не найдены. Большинство машин поиска игнорируют также
одно, двух- и трехбуквенные слова. Иногда не выполняется также поиск слов, начинающихся с цифры.
Разработчики некоторых новейших средств поиска утверждают, что не используют игнорируемых слов, но такие
случаи редки.
И последнее - не забывайте традиционные источники!
Книги и друзья, телевидение и пресса дают нам советы, консультации, знания и справочную информацию, в том
числе о необъятном мире сети Интернет.
Download