Что такое поисковая система. Как работает поисковая машина

Как работает поисковая машина.

  • Поисковая машина (поисковая система) — это программный комплекс, состоящий из нескольких компонентов, работающих с одной целью. Работа поисковой машины заключается в выдаче релевантных результатов поиска.
  • Релевантный результат — это тот результат, при котором по ключевому слову или словосочетанию, внесенных вами в строку поиска, выдается страница веб-сайта, максимально соответствующая вашему запросу.

На первой странице (топ 10) результатов по определенному поисковому запросу сверху вниз выводятся сайты, на которых текст наиболее соответствует вашему запросу (релевантный текст). За поиск отвечает программа Search engine results engine (система выдачи результатов).

Поисковая система

Search engine results engine напрямую связанна с базой данных Database, из которой извлекаются релевантные страницы сайтов. База данных является хранилищем сайтов которые были ей проиндексированы на момент поискового запроса. То есть поисковая база данных — это большой вместимости жесткий диск, на котором хранятся скачанные страницы сайтов.

Поисковый запрос обрабатывается в пределах базы данных конкретной поисковой машины. Время обновления базы данных индивидуально для каждого поисковика. И вообще, иметь и обслуживать большую базу данных весьма не дешево, как, например, у гиганта Гугл.

Обновление существующих и добавление новых страниц сайтов — одна из важных задач поисковых систем. Эту задачу выполняет Spider. Программа загружает страницы сайтов и просматривает HTML код (вы тоже можете посмотреть код страницы глазами поисковика — Ctrl+U). Тут вступает в дело Indexer — индексирует страницы сайта на наличие важных элементов гиппертекстовой разметки (html), различных элементов, тегов (bold, ,< i>, ), структуру содержимого, наличие ошибок в разметке, наличие ссылок на внутренние страницы сайта и др.

Как раз по ссылкам на веб-страницах гуляет Crawler — паук, задача которого находить новые страницы как в пределах одного доменного имени, так и, следуя на внешние ссылки, на другой домен. Около десяти миллионов страниц ежедневно добавляются в сеть интернет. Можете себе представить объем информации, который нужно проиндексировать поисковым системам? Естественно, это невыполнимая задача — проиндексировать все в тот же день, да плюс обновить существующие.

Современные поисковые машины используют достаточно сложные алгоритмы ранжирования веб-страниц. И оптимизированная под одну поисковую систему веб-страница, может не так хорошо стоять в поисковой выдаче другого поисковика. Так что купить сайту позиции ссылками не получиться. Этим объясняется, что некоторые вебмастера проводят сео оптимизацию конкретно под Google или Яндекс, справедливо видя разницу ранжирования .

Сделать идеальную веб-страницу, даже под одну поисковую систему, невозможно. Так как методы алгоритмов постоянно совершенствуются и большей частью засекреченны. И то, что вчера выводило вашу страницу в топ 10, завтра может откинуть на те же 10.

Свежие записи
Команда RD

Команда RD и RMDIR позволяют удалять как каталоги, так и

Linux
help2site
Массовое заражение серверов Linux (CVE-2019-10149)

Exim (v4) — это агент пересылки почты. exim4-config предоставляет инфраструктуру конфигурации для служб exim4. Она была вынесена в отдельный пакет для упрощения замены конфигурационной схемы

Web-Дизайн
help2site
Анализ контента вэб-ресурса (инструменты)

Анализ контента сайта – это своеобразный сервис с набором инструментов, с помощью которых проводится качественный анализ текстового контента, находящегося на вэб-ресурсе, его оценка. То есть,

Оборудование
help2site
CHKDSK, система перезагружается при запуске

Если у вас не запускается операционная система, при загрузке компьютер перезагружается, то в большинстве случаев повреждены системные файлы, возможно загрузочный сектор. Что бы решить эту

Web-Дизайн
help2site
Обновления ядра Drupal

Данная статья адресована для начинающих изучать Drupal. Для CMS — Drupal регулярно выходят новые версии (обновления) в которых вносится изменения по усовершенствованию CMS, исправление ошибок/уязвимостей

Интернет
help2site
Правильно составленное семантическое ядро – это успешный старт для сайта

Семантическое ядро сайта… Это словосочетание, безусловно, знакомо любому, более-менее, опытному вэб-мастеру, любому блоггеру, ведущего свой блог, которые прекрасно знают, что один из наиважнейших этапов при

Mac OS
help2site
Подключение к VPN-серверу из Mac OS X

В этой статье мы разберемся в процессе подключения к VPN-серверу для пользователей операционной системы Mac OS. Как настроить VPN-сервер на Windows server 2008 мы описывали в предыдущей статье 1. Откройте Finder, выберите пункт «Программы» и

Windows
help2site
Не запускается рабочий стол Windows 7

В процессе работы или при перезапуске компьютера некоторые пользователи сталкиваются с ситуацией, когда рабочий стол просто пропадает. На нем ничего не отображается, и работать за