Информация о количестве пользователей самых распространенных поисковых. Поиск во всемирной паутине. Тестовые задания для самоконтроля

Windows 10

Как правильно и с минимумом затрат времени найти нужное в сети Интернет

Как правильно искать в Интернет

Как правильно и с минимумом затрат времени найти нужное в сети Интернет.

Проблема поиска информации рано или поздно ожидает каждого пользователя Интернета. Поиск нужной информации, курсовых работ рефератов или какой либо технической документации, может отнять у вас уйму времени, если вы не умеете правильно искать и находить нужное во Всемирной Сети. К нам на помощь в этом случае могут прийти различные каталоги и базы знаний, а также так называемые «поисковики». Далее рассмотрим их по очереди.

Начнем, пожалуй, с каталогов. Здесь всё довольно не сложно, так как каталог представляет собой электронную картотеку ссылок на сайты определённой тематики. Как в настоящей картотеке все сайты и ресурсы здесь разложены по полочкам, которые снабжены кратким описанием для более удобного поиска нужной информации. Большим недостатком этой системы является то что далеко не все ресурсы находятся там так как для того чтобы добавить свой сайт в каталог владелец должен пройти регистрацию а это отнимает некоторое время и по этому приходится набирать сайты вручную что очень неудобно.

Теперь рассмотрим базы знаний. Существуют ресурсы, которые содержат огромное количество информации и при этом предоставляют возможность пользователям для редактирования и дополнения её. Эти ресурсы очень быстро растут и становятся громадными базами данных, такими как Википедия (http://ru.wikipedia.org/) по праву считающаяся одним из самых лучших. Благодаря встроенному поисковому механизму миллионы людей без труда находят нужную для себя информацию за короткий промежуток времени.

И наконец, поисковые машины или как их называют в народе «поисковики». Если вы испробовали в своих поисках вышеперечисленные методы, а результата нет - не отчаивайтесь. Помочь вам смогут поисковые машины, которых на сегодняшний день существует достаточно много. Основные «пионеры» на просторах СНГ это Рамблер, Яндекс ну и конечно Google. Главным достоинством поисковиков является принцип их работы. Поисковые машины в отличие от каталогов используют специального робота, который сканирует все доступные ресурсы Интернета и автоматически добавляет их в свою базу данных. Но огромной базы данных для успешного поиска нам будет недостаточно. Так как же среди огромного моря информации найти именно то, что нам нужно?

Во первых не пытайтесь в запрос всунуть, например, всю тему диплома или реферата будьте точными, но лаконичными. Сначала обдумайте свой запрос и попытайтесь выяснить как можно больше об интересующей вас теме, так как правильность поискового запроса является залогом получения нужного результата. Если, к примеру, вы хотите узнать об Олимпиаде 2014 в России, то в запросе следует набрать Олимпиада 2014 Россия, а не просто Олимпиада Россия. Запомните, машина ищет словосочетания и слова и по степени совпадения сортирует информацию, а что вы имели в виду, она не может знать. Сайт с наибольшим количеством совпадений будет стоять на первом месте и т. д. Также вы должны знать, что поисковик не ищет по знакам пунктуации предлогам и таким словам как «что», «где», «когда».

А как найти цитату, если поисковая машина не берёт во внимание распространенные слова и предлоги? Для этого достаточно запрос выделить кавычками и тогда он будет рассматриваться как единое целое со всеми словами и предлогами в том порядке, в каком вы его написали. Ещё перед словом или символом можно поставить «+» и тогда на запрос, к примеру «Чужие +4» ответом будут ссылки именно на эту часть фильма. А так же есть возможность найти, к примеру, статью на определённом сайте, если допустим мы забыли сохранить ссылку на неё. Для этого достаточно в строке поиска набрать запрос затем site: название сайта в Google и запрос <

Поисковики могут не только искать, но и исключить некоторые слова из поиска. Например, если на запрос о Риме вы не хотите получить документы о его истории в Google, введите: Рим - история, а в Яндексе вместо « - » используют «~ ~».

Также нужно знать, что поисковые машины не учитывают заглавные символы, а это неудобно для поиска населённых пунктов. По этому чтобы получить нужный результат перед словом которое поисковик должен «увидеть» с заглавной буквы ставим! например «село! Рыбки». Для более детального поиска воспользуйтесь функцией «Расширенный поиск». Удачных вам поисков!

http://www.searchboth.ru/search-systems/search-in-www.html

В web размещены миллионы сайтов, причем с актуальной информацией соседствует много устаревших ресурсов, мусора и недобросовестной рекламы.

Интернет - это наиболее демократичный источник информации. Каждый может разместить в Сети собственный ресурс и высказать свое мнение. В этом одновременно сила и слабость Всемирной сети.

Находить информацию в Интернете, вероятно, было бы очень трудно, если бы не были созданы мощные поисковые инструменты: поисковые машины (поисковики), каталоги-рейтинги (рубрикаторы), тематические списки ссылок , онлайновые энциклопедии и словари .

Для поиска разного рода информации наиболее эффективными оказываются различные инструменты.

Каталоги ресурсов

Каталог имеет иерархическую структуру. Тематические разделы первого уровня определяют максимально широкие темы, такие как "спорт", "отдых", "наука", "магазины" и т.д. В каждом таком разделе могут быть подразделы. Пользователь может уточнять интересующую его область, путешествуя по дереву каталога и постепенно сужая зону поиска. Например, при поиске информации о ноутбуках цепочка поиска может выглядеть так: Информационные технологии -> Компьютеры -> Ноутбуки. Дойдя до нужного подкаталога, пользователь находит в нем набор ссылок.

Обычно в каталоге все ссылки являются профильными, поскольку составлением каталогов занимаются не программы, а люди. Очевидно, что если ведется поиск общей информации по некоторой широкой теме, то целесообразно обратиться к каталогу. Если же необходимо найти конкретный документ, то каталог окажется малоэффективным поисковым средством.

Часто каталоги ресурсов одновременно являются и рейтингами, т.е. каталог предлагает зарегистрированным в нем сайтам установить на своих страницах счетчик посещений , и отображает списки ссылок на сайты в соответствии с их популярностью (посещаемостью). Популярность ресурса оценивается по ряду параметров, в том числе по так называемым хостам (количество уникальных посетителей в сутки) и хитам (количество заходов на сайт в сутки).

Одним из наиболее популярных каталогов-рейтингов является Rambler"s Top 100. (http://top100.rambler.ru/top100/). Часто бывает интересно оценить состояние не общероссийских, а региональных ресурсов по конкретной тематике. Для обзора web-ресурсов Красноярска и края можно рекомендовать каталоги-рейтинги ресурсов Krasland (http://www.krasland.ru/) и Сталкер (http://www.stalker.internet.ru/).

Поисковые машины

Релевантный документ - документ, смысловое содержание которого соответствует информационному запросу . Современные поисковые машины осуществляют поиск по контексту, т.е. словам, содержащимся в запросе, учитывая вариации словоформ и расширяя запросы синонимами. Но смысла компьютеры не понимают, поэтому в списке ответов на запрос, наряду с релевантными вашему запросу документами, вы можете получить и те, которые вам никоим образом не подходят.

Очевидно, что от умения грамотно выдавать запрос зависит процент получаемых релевантных документов . Доля релевантных документов в списке всех найденных поисковой машиной называется точностью поиска. Нерелевантные документы называют шумовыми. Если все найденные документы релевантные (шумовых нет), то точность поиска составляет 100%. Если найдены все релевантные документы, то полнота поиска - 100%.

Таким образом, качество поиска определяется двумя взаимозависимыми параметрами: точностью и полнотой поиска. Увеличение полноты поиска снижает точность, и наоборот.

Поисковые системы можно сравнить со справочной службой, агенты которой обходят предприятия, собирая информацию в базу данных. При обращении в службу информация выдается из этой базы. Данные в базе устаревают, поэтому агенты их периодически обновляют. Иными словами, справочная служба имеет две функции: 1) создание и постоянное обновление данных в базе и 2) поиск информации в базе по запросу клиента.

Аналогично, поисковая машина состоит из двух частей: так называемого поискового робота (или паука), который обходит серверы Сети и формирует базу данных, и механизма поиска релевантных запросу пользователя ссылок в базе.

Следует отметить, что, отрабатывая конкретный запрос пользователя, поисковая система оперирует именно внутренней базой данных (а не пускается в путешествие по Сети). Несмотря на то, что база данных поисковой машины постоянно обновляется, поисковая машина не может проиндексировать все Web-документы: их число слишком велико. Проблема недостаточности полноты поиска состоит не только в ограниченности внутренних ресурсов поисковика, но и в том, что скорость робота ограниченна, а количество новых Web-документов постоянно растет.

Наиболее популярными на сегодня поисковыми системами являются Google (www.google.com, www.google.ru) и Яндекс (www.yandex.ru).

Онлайновые энциклопедии и справочники

В ряде случаев бывает нужно найти не просто документ, содержащий ключевое слово, а именно толкование некоторого слова. При поиске незнакомого термина с помощью поисковой машины вы рискуете получить целый ряд статей, в которых этот термин используется, и при этом так и не узнать, что же он все-таки обозначает. Подобный поиск предпочтительнее проводить в онлайновой энциклопедии.

Одной из крупнейших онлайновых энциклопедий является ресурс "Яндекс. Энциклопедии" (http://encycl.yandex.ru/) - этот проект содержит 14 энциклопедий, в том числе статьи из Большой Советской Энциклопедии и "Энциклопедию Брокгауза и Эфрона". К крупным относится и "Энциклопедия Кирилла и Мефодия" (http://www.km.ru).

Помимо переноса в гипертекстовую среду традиционных словарей бурно развиваются энциклопедические wiki-проекты. Ви́ки - веб-сайт для сбора и структуризации письменных сведений. Характеризуется тем, что наполнять и редактировать размещаемую на нем информацию могут все посетители. http://ru.wikipedia.org/ - википедия на русском языке - часть многоязычного проекта, целью которого является создание полной энциклопедии на всех языках Земли.

История Всемирной паутины

Изобретателями всемирной паутины являются Сэр Ти́моти Джон Бе́рнерс-Ли (род. 8 июня 1955) и, в меньшей степени, Роберт Кайо . Тим Бернерс-Ли является автором технологий HTTP, URI/URL и HTML . В 1980 году он работал в Европейском совете по ядерным исследованиям (фр. Conseil Européen pour la Recherche Nucléaire, CERN) консультантом по программному обеспечению. Именно там, в Женеве (Швейцария), он для собственных нужд написал программу «Энквайр», которая и заложила концептуальную основу для Всемирной паутины.

В 1989 году , работая в CERN над внутренней сетью организации, Тим Бернерс-Ли предложил глобальный гипертекстовый проект, теперь известный как Всемирная паутина.

В рамках проекта Бернерс-Ли написал первый в мире веб-сервер и первый в мире гипертекстовый веб-браузер, называвшийся «WorldWideWeb».

Первый в мире веб-сайт Бернерс-Ли создал по адресу http://info.cern.ch/, теперь сайт хранится в архиве. Этот сайт появился в Интернете 6 августа 1991 года . На этом сайте описывалось, что такое Всемирная паутина, как установить веб-сервер, как использовать браузер. Этот сайт также являлся первым в мире интернет-каталогом, потому что позже Тим Бернерс-Ли разместил и поддерживал там список ссылок на другие сайты.

И всё же теоретические основы веба были заложены гораздо раньше. Ещё в 1945 году Ванни́вер Буш разработал концепцию «Memex» - вспомогательных средств «расширения человеческой памяти». Memex - это устройство, в котором человек хранит все свои книги и записи (а в идеале - и все свои знания, поддающиеся формальному описанию) и которое выдаёт нужную информацию с достаточной скоростью и гибкостью. Бушем было также предсказано всеобъемлющее индексирование текстов и мультимедийных ресурсов с возможностью быстрого поиска необходимой информации. Следующим значительным шагом на пути к Всемирной паутине было создание гипертекста (термин введён Тедом Нельсоном в 1965 году).

Рис. 75. Логотип Консорциума Всемирной паутины

С 1994 года основную работу по развитию Всемирной паутины взял на себя Консорциум Всемирной паутины , основанный и до сих пор возглавляемый Тимом Бернерсом-Ли. W3C - организация, разрабатывающая и внедряющая технологические стандарты для Интернета и Всемирной паутины.

Перспективы развития

Актуальная на сегодня концепция развития Всемирной паутины - создание семантической (осмысленной) паутины. Автор концепции семантической паутины также Ти́м Бе́рнерс-Ли. Семантическая паутина (semantic web) - это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в сети информацию более понятной для компьютеров .

В настоящее время компьютеры принимают довольно ограниченное участие в формировании и обработке информации в сети Интернет. Функции компьютеров в основном сводятся к хранению, отображению и поиску информации. В то же время создание информации, её оценку, классификацию и актуализацию - всё это по-прежнему выполняет человек. Как включить компьютер в эти процессы? Если компьютер пока нельзя научить понимать человеческий язык, то нужно использовать язык, который был бы понятен компьютеру. То есть, в идеальном варианте вся информация в Интернете должна размещаться на двух языках: на человеческом языке для человека и на компьютерном языке для понимания компьютера. Семантическая паутина - это концепция сети, в которой каждый ресурс на человеческом языке был бы снабжён описанием, понятным компьютеру.

Программы смогут сами находить нужные ресурсы, обрабатывать информацию, классифицировать данные, выявлять логические связи, делать выводы и принимать решения на основе этих выводов. При широком распространении и грамотном внедрении семантическая паутина может вызвать революцию в Интернете.

Фундаментальным трудом по семантической паутине является книга Бернерса-Ли «Прядя семантическую паутину: полное раскрытие потенциала Всемирной паутины», вышедшая в 2005 году.

Задачи

1. Первая глобальная компьютерная сеть носила имя:

  • BITNet;
  • ARPANet;
  • NSFNet.

2. Провайдер Internet это:

  • организация-поставщик услуг Internet;
  • организация, занимающаяся созданием web-сайтов;
  • периферийное устройство, служащее для связи с другим компьютером.

3. FTP - это:

  • почтовый клиент;
  • программа IP-телефонии;
  • протокол передачи файлов.

4. Задан URL-адрес web-страницы: http://www.sgzt.com/sgzt/archive/content/2005/03/043. Каково имя протокола доступа к этому информационному ресурсу?

  • sgzt/archive/content/2005/03/043;
  • http;
  • www.sgzt.com.

5. В какой из приведенных доменных зон первого уровня может приобрести себе доменное имя юридическое лицо, зарегистрированное на территории РФ?

  • .com;
  • и в том и в другом.

6. Среди приведенных записей укажите корректный IP-адрес компьютера:

  • 198.15.19.216;
  • 298.15.19.216;
  • 200,6,201,13;
  • http://www.ipc.ru;
  • www.ip-address.com.

7. Какой из приведённых адресов e-mail корректен?

8. Что такое HTML?

  • Один из протоколов семейства TCP/IP;
  • Язык гипертекстовой разметки документа;
  • Язык программирования.

Похожая информация.


САМОЕ ГЛАВНОЕ

Свободный доступ к информации, невзирая на границы и расстояния, стал возможен благодаря World Wide Weh (WWW, Web, Всемирная паутина) - всемирному информационному хранилищу, существующему на технической базе сети Интернет.

Перемещаться пользователю по «паутине» помогают специальные

программы, которые называются браузерами. Поиск нужного документа в WW&V может происходить: путём указания адреса документа; путём перемещения по паутине гиперсвязей; путём использования поисковых систем.

Существует множество поисковых систем. В большинстве из них есть три основных типа поиска: по любому из слов; по всем словам; точно по фразе.

Вопросы и задания

1. Выполните дословный перевод словосочетания 4 YVorld Wide Web».

2. Опишите в общих чертах организацию WWW.

4. Представим, что текст этого параграфа размещён на Web-cafrre. Какие слова из текста можно выбрать в качестве ключевых, чтобы наиболее точно передать его смысл? Перечислите до 10 таких слов.

5. Знаете ли вы адрес сайта вашей школы? Какие бы сайты вы рекомендовали посетить своим одноклассникам?

б. Каким браузером вы пользуетесь в школе?

7. Какие поисковые системы вам известны?

8. Перечислите основные типы поисковых запросов.

9. Найдите во Всемирной паутине информацию о количестве пользователей самых распространённых поисковых систем.

Представьте результаты выполнения этих запросов графически с помощью кругов Эйлера. Укажите обозначения запросов в по рядке возрастания количества документов, которые найдёт поисковая система по каждому запросу.

11. Найдите во Всемирной паутине ответы на следующие вопросы.

Кто такой Норберт Винер и какова его роль в исследовании информационных процессов?

Кто такой Клод Шеннон и чем он знаменит?



Кем и когда был введен термин «гипертекст» ?

Кого считают изобретателем WYVW и когда это произошло?

Кто такой Эйлер, в честь кого названа графическая схема, иллюстрирующая отношения между множествами?


Тестовые задания для самоконтроля

1. Какое из следующих утверждений точнее всего раскрывает смысл понятия «информация» с бытовой точки зрения?

а) последовательность знаков некоторого алфавита

б) книжный фонд библиотеки

в) сведения об окружающем мире и протекающих в нем процессах, воспринимаемые человеком непосредственно или с помощью специальных устройств


г) сведения, содержащиеся в научных теориях

2. Непрерывным назывануг сигнал:

в) несущий текстовую информацию

г) несущий какую-либо информацию З. Дискретным называют сигнал:

а) принимающий конечное число определённых значений

б) непрерывно изменяющийся во времени

в) который можно декодировать

г) несущий какую-либо информаци ю

4. Информацию, не зависящую от личного мнения или суждения, называют:

а) понятной

б) актуальной

В) объективной

г) полезной

5. Информацию, существенную и важную в настоящий момент, называют:

а) полезной

б) актуальной

в) достоверной

г) объективной

б. По способу восприятия человеком различают следующие виды информации:

а) текстовую, числовую, графическую, табличную и пр.

б) научную, социальную, политическую, экономическую, религиозную и пр.

в) обыденную, производственную, техническую, управленческую

7. Известно, что наибольший объём информации физически здоровый человек получает при помощи:


а) органов слуха

б) органов зрения

в) органов осязания

г) органов обоняния

д) вкусовых рецепторов

8. Укажите «лишний» объект с точки зрения соглашения о смысле используемых знаков:



б) дорожные знаки

г) нотные знаки

9. Укажите «лишний» объект с точки зрения вида письменности:

а) русский язык

б) английский язык

в) китайский язык

г) французский язык

10. К формальным языкам относится:

а) русский язык

б) латынь

в) китайский язык

г) французский язык

11. По форме представления информацию можно условно разделить на следующие виды:

а) математическую, биологическую, медицинскую, психологическую и пр.

б) знаковую и образную

в) обыденную, научную, производственную, управленческую

г) визуальную, аудиальную, тактильную, обонятельную, вкусовую

12. Дискретизация информации - это:

а) физический процесс, изменяющийся во времени

б) количественная характеристика сигнала

в) процесс преобразования информации из непрерывной формы в дискретную г) процесс преобразования информации из дискретной формы в непрерывную

13. Дайте самый полный ответ.

Определить, какой набор букв закодирован двоичной строкой 0110100011000.

а) ЕВСЕА б) BDDEA в) ВГ)СЕА г) ЕВАЕА

16. Шахматная доска состоит из 8 столбцов и 8 строк. Какое минимальное количество битов потребуется для кодирования координат одного шахматного поля?

17. В какой строке единицы измерения информации расположены по возрастанию?

а) гигабайт, мегабайт, килобайт, байт, бит

б) бит, байт, мегабайт, килобайт, гигабайт

в) байт, бит, килобайт, мегабайт, гигабайт

г) бит, байт, килобайт, мегабайт, гигабайт

18. Объём сообщения равен 11 Кбайт. Сообщение содержит 11 264 символа. Какова мощность алфавита, с помощью которого записано сообщение?

а) 64 б) 128 в) 256 г) 512

19. Дан текст из 600 символов. Известно, что символы берутся из таблицы размером 16 х 32. Определите информационный объём текста в битах.

А) 1000 б) 2400 в) 3600 г) 5400

20.
Два текста содержат одинаковое количество символов. Первый текст составлен из символов алфавита мощностью 16, а второй текст - из символов алфавита мощностью 256. Во сколько раз количество информации во втором тексте больше, чем в перВОМ?

а) 12 б) 2 в) 24

21. Информационные процессы - это:

а) процессы строительства зданий и сооружений

б) процессы химической и механической очистки воды

в) процессы сбора, хранения, обработки, поиска и передачи информации

г) процессы производства электроэнергии

22. Под носителем информации принято подразумевать:

а) линия связи

б) сеть Интернет

в) компьютер

г) материальный объект, на котором можно тем или иным спо собом зафиксировать информацию

23. В какой строке верно представлена схема передачи информации?

а) источник кодирующее устройство -» декодирующее устройство -» приёмник

б) источник -» кодирующее устройство -» канал связи -» декодирующее устройство -» приемник

в) источник кодирующее устройство помехи -» декодирующее устройство приёмник

г) источник декодирующее устройство канал связи -» кодирующее устройство приёмник

24. Гипертекст - это:


а) очень большой текст

б) текст, в котором могут осуществляться переходы по ссылкам

в) текст, набранный на компьютере

г) текст, в котором используется шрифт большого размера

25. Поисковой системой НЕ является:

г) Яндекс

26. В таблице приведены запросы к поисковой системе. По какому запросу будет найдено наибольшее количество соответствующих ему страниц?

а) разведение & содержание & меченосцы & сомики
б) содержание & меченосцы
в) (содержание & меченосцы) сомики
г) содержание & меченосцы & сомики

КОМПЬЮТЕР КАК УНИВЕРСАЛЬНОЕ УСТРОЙСТВО ДЛЯ РАБОТЫ С ИНФОРМАЦИЕЙ

В web размещены миллионы сайтов, причем с актуальной информацией соседствует много устаревших ресурсов, мусора и недобросовестной рекламы.

Интернет - это наиболее демократичный источник информации. Каждый может разместить в Сети собственный ресурс и высказать свое мнение. В этом одновременно сила и слабость Всемирной сети.

Находить информацию в Интернете, вероятно, было бы очень трудно, если бы не были созданы мощные поисковые инструменты: поисковые машины (поисковики), каталоги-рейтинги (рубрикаторы), тематические списки ссылок , онлайновые энциклопедии и словари .

Для поиска разного рода информации наиболее эффективными оказываются различные инструменты.

Каталоги ресурсов

Каталог имеет иерархическую структуру. Тематические разделы первого уровня определяют максимально широкие темы, такие как "спорт", "отдых", "наука", "магазины" и т.д. В каждом таком разделе могут быть подразделы. Пользователь может уточнять интересующую его область, путешествуя по дереву каталога и постепенно сужая зону поиска. Например, при поиске информации о ноутбуках цепочка поиска может выглядеть так: Информационные технологии -> Компьютеры -> Ноутбуки. Дойдя до нужного подкаталога, пользователь находит в нем набор ссылок.

Обычно в каталоге все ссылки являются профильными, поскольку составлением каталогов занимаются не программы, а люди. Очевидно, что если ведется поиск общей информации по некоторой широкой теме, то целесообразно обратиться к каталогу. Если же необходимо найти конкретный документ, то каталог окажется малоэффективным поисковым средством.

Часто каталоги ресурсов одновременно являются и рейтингами, т.е. каталог предлагает зарегистрированным в нем сайтам установить на своих страницах счетчик посещений , и отображает списки ссылок на сайты в соответствии с их популярностью (посещаемостью). Популярность ресурса оценивается по ряду параметров, в том числе по так называемым хостам (количество уникальных посетителей в сутки) и хитам (количество заходов на сайт в сутки).

Одним из наиболее популярных каталогов-рейтингов является Rambler"s Top 100. (http://top100.rambler.ru/top100/). Часто бывает интересно оценить состояние не общероссийских, а региональных ресурсов по конкретной тематике. Для обзора web-ресурсов Красноярска и края можно рекомендовать каталоги-рейтинги ресурсов Krasland (http://www.krasland.ru/) и Сталкер (http://www.stalker.internet.ru/).

Поисковые машины

Релевантный документ - документ, смысловое содержание которого соответствует информационному запросу . Современные поисковые машины осуществляют поиск по контексту, т.е. словам, содержащимся в запросе, учитывая вариации словоформ и расширяя запросы синонимами. Но смысла компьютеры не понимают, поэтому в списке ответов на запрос, наряду с релевантными вашему запросу документами, вы можете получить и те, которые вам никоим образом не подходят.

Очевидно, что от умения грамотно выдавать запрос зависит процент получаемых релевантных документов . Доля релевантных документов в списке всех найденных поисковой машиной называется точностью поиска. Нерелевантные документы называют шумовыми. Если все найденные документы релевантные (шумовых нет), то точность поиска составляет 100%. Если найдены все релевантные документы, то полнота поиска - 100%.

Таким образом, качество поиска определяется двумя взаимозависимыми параметрами: точностью и полнотой поиска. Увеличение полноты поиска снижает точность, и наоборот.

Поисковые системы можно сравнить со справочной службой, агенты которой обходят предприятия, собирая информацию в базу данных. При обращении в службу информация выдается из этой базы. Данные в базе устаревают, поэтому агенты их периодически обновляют. Иными словами, справочная служба имеет две функции: 1) создание и постоянное обновление данных в базе и 2) поиск информации в базе по запросу клиента.

Аналогично, поисковая машина состоит из двух частей: так называемого поискового робота (или паука), который обходит серверы Сети и формирует базу данных, и механизма поиска релевантных запросу пользователя ссылок в базе.

Следует отметить, что, отрабатывая конкретный запрос пользователя, поисковая система оперирует именно внутренней базой данных (а не пускается в путешествие по Сети). Несмотря на то, что база данных поисковой машины постоянно обновляется, поисковая машина не может проиндексировать все Web-документы: их число слишком велико. Проблема недостаточности полноты поиска состоит не только в ограниченности внутренних ресурсов поисковика, но и в том, что скорость робота ограниченна, а количество новых Web-документов постоянно растет.

Наиболее популярными на сегодня поисковыми системами являются Google (www.google.com, www.google.ru) и Яндекс (www.yandex.ru).

Онлайновые энциклопедии и справочники

В ряде случаев бывает нужно найти не просто документ, содержащий ключевое слово, а именно толкование некоторого слова. При поиске незнакомого термина с помощью поисковой машины вы рискуете получить целый ряд статей, в которых этот термин используется, и при этом так и не узнать, что же он все-таки обозначает. Подобный поиск предпочтительнее проводить в онлайновой энциклопедии.

Одной из крупнейших онлайновых энциклопедий является ресурс "Яндекс. Энциклопедии" (http://encycl.yandex.ru/) - этот проект содержит 14 энциклопедий, в том числе статьи из Большой Советской Энциклопедии и "Энциклопедию Брокгауза и Эфрона". К крупным относится и "Энциклопедия Кирилла и Мефодия" (http://www.km.ru).

Помимо переноса в гипертекстовую среду традиционных словарей бурно развиваются энциклопедические wiki-проекты. Ви́ки - веб-сайт для сбора и структуризации письменных сведений. Характеризуется тем, что наполнять и редактировать размещаемую на нем информацию могут все посетители. http://ru.wikipedia.org/ - википедия на русском языке - часть многоязычного проекта, целью которого является создание полной энциклопедии на всех языках Земли.