Поисковая система (англ. search engine, синонимы: поисковый сервер, поисковая машина) — специальный web-сайт, на котором пользователь по заданному запросу может получить ссылки на сайты, соответствующие этому запросу.
Как правило, работа поисковой системы состоит из двух этапов. Поисковый робот (паук, crawler) постоянно обходит сеть и собирает информацию с веб-страниц (индексирует их). Когда пользователь задает запрос, поиск идет по предварительно построенному индексу. Результатом поиска является так называемая поисковая выдача — список ссылок на документы (веб-страницы), соответствующие запросу.
Робот поисковой системы — компонента или программа, которая посещает веб-страницы, считывает (индексирует) полностью или частично их содержимое и далее следует по ссылкам, найденным на данной странице. Робот возвращается через определенные периоды времени и индексирует страницу снова. Вся информация заносится роботом в индексы поисковой системы.
В Интернете поисковых систем сотни и тысячи, но с точки зрения важности для нас отметим следующие основные и наиболее авторитетные.
Яндекс (www.yandex.ru) — крупнейший российский портал, ежедневная аудитория Яндекса — 4,000,000 человек, что составляет порядка 65% суточной аудитории всего русского Интернета, ежемесячная — около двадцати четырех миллионов.
Рамблер (www.rambler.ru) — посещает около 1,000,000 уникальных человек в день.
Google (www.google.ru) — посещаемость неизвестна (предположительно около 500,000 человек в день). Это самая большая поисковая система в мире, которая очень хорошо ищет в русскоязычных документах и важна по той причине, что следующая упомянутая ниже поисковая система использует ее движок.
Поиск@Mail.ru (go.mail.ru) — самая молодая поисковая система. Работает на движке Google, но, в отличие от нее, ищет только по русской части Интернета и с учетом морфологии русского языка.